Библиотека OpenCV для Python: возможности компьютерного зрения

Раздел: Библиотеки -> Компьютерное зрение

Основные функции OpenCV для работы с изображениями

Библиотека OpenCV (Open Source Computer Vision) предоставляет множество функций для обработки изображений и видео. Рассмотрим ключевые возможности на практических примерах.

Основной конвейер: чтение, предобработка, поиск контуров

Как выполнить типичную задачу анализа изображения: загрузку, преобразование в оттенки серого, бинаризацию и выделение контуров?

import cv2
import numpy as np

# Чтение изображения
img = cv2.imread('example.jpg')

# Преобразование в серый
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Бинаризация по порогу
_, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)

# Поиск контуров
contours, hierarchy = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# Рисование контуров на копии
img_copy = img.copy()
cv2.drawContours(img_copy, contours, -1, (0,255,0), 2)

# Отображение
cv2.imshow('Contours', img_copy)
cv2.waitKey(0)
cv2.destroyAllWindows()

Python opencv functions (функции opencv в python)

Возможные проблемы: Файл не найден (ошибка чтения). Используйте абсолютный путь или проверьте наличие. Порог 127 может быть неподходящим; рекомендуется адаптивная бинаризация. Порядок каналов BGR, при отображении через matplotlib нужно преобразовать в RGB.

Этот конвейер применяется для выделения объектов на контрастном фоне, например, для подсчета деталей или распознавания символов.

Вариант 1. Загрузка и получение свойств изображения

Как загрузить изображение и узнать его размеры, количество каналов, тип данных?

img = cv2.imread('photo.jpg')
print('Размер:', img.shape)  # (height, width, channels)
print('Тип данных:', img.dtype)
print('Количество пикселей:', img.size)

Python opencv 215 assertion failed (ошибка assertion в opencv python)

Размер: (480, 640, 3)
Тип данных: uint8
Количество пикселей: 921600

Python изображения (работа с изображениями в python)

Типичная ошибка: Если файл не найден, img будет None, и вызов shape вызовет исключение. Всегда проверяйте if img is None. Путь с кириллицей может не открыться в Windows, используйте cv2.imdecode с байтами.

Вариант 2. Преобразование цветовых пространств

Как перевести изображение из BGR в RGB, HSV, Lab и другие форматы?

img_bgr = cv2.imread('image.jpg')
img_rgb = cv2.cvtColor(img_bgr, cv2.COLOR_BGR2RGB)
img_hsv = cv2.cvtColor(img_bgr, cv2.COLOR_BGR2HSV)
img_lab = cv2.cvtColor(img_bgr, cv2.COLOR_BGR2Lab)

библиотека cv2 python (библиотека opencv в python)

Частая путаница: OpenCV использует BGR порядок, а Matplotlib ожидает RGB. Если не преобразовать, цвета будут искажены. При работе с HSV значения H обычно от 0 до 179, S и V от 0 до 255.

Преобразование в HSV полезно для цветовой сегментации, например, выделения зеленых объектов.

Вариант 3. Размытие и сглаживание

Как уменьшить шум на изображении с помощью разных фильтров?

# Гауссово размытие
blur_gauss = cv2.GaussianBlur(img, (5,5), 0)
# Медианный фильтр
blur_median = cv2.medianBlur(img, 5)
# Боковой фильтр (сохраняет границы)
blur_bilateral = cv2.bilateralFilter(img, 9, 75, 75)

распознавание объектов python (распознавание объектов с помощью python)

Проблемы: Размер ядра должен быть нечетным. Слишком большое ядро приводит к потере деталей. Медианный фильтр эффективен против шума 'соль-перец'. Боковой фильтр медленный.

Вариант 4. Детектор границ Canny

Как найти границы объектов на изображении?

edges = cv2.Canny(img, 50, 150)
# пороги low_threshold и high_threshold

(результат - бинарное изображение)

Настройка порогов: Слишком низкий порог даёт много ложных границ, слишком высокий - пропускает слабые границы. Рекомендуется подбирать автоматически, например, через гистограмму.

Вариант 5. Изменение размера изображения

Как масштабировать изображение с сохранением пропорций?

height, width = img.shape[:2]
new_width = 300
ratio = new_width / width
new_height = int(height * ratio)
resized = cv2.resize(img, (new_width, new_height), interpolation=cv2.INTER_AREA)

Внимание: При уменьшении используйте INTER_AREA, при увеличении - INTER_CUBIC или INTER_LINEAR. Неправильная интерполяция может привести к артефактам.

Вариант 6. Наложение текста на изображение

Как добавить подпись на изображение?

font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(img, 'OpenCV', (50,50), font, 1, (255,255,255), 2, cv2.LINE_AA)

Типичные ошибки: Координаты выходят за пределы изображения. Шрифт не поддерживает кириллицу, используйте cv2.putText с шрифтом Hershey, либо PIL для кириллицы.

Вариант 7. Захват и отображение видео

Как прочитать видео с камеры или файла и вывести каждый кадр?

cap = cv2.VideoCapture(0)  # или 'video.mp4'
while True:
    ret, frame = cap.read()
    if not ret:
        break
    cv2.imshow('Video', frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
cap.release()
cv2.destroyAllWindows()

Возможные проблемы: Камера не обнаружена (проверьте индекс). Видеофайл может требовать кодеков (установите opencv-contrib-python). Зацикливание без break приведет к зависанию.

Расширенные примеры применения OpenCV

Детекция лиц с помощью каскадов Хаара

Пример показывает, как найти лица на изображении и обвести их рамками.

Пример

import cv2

# Загрузка предобученного каскада для лиц
face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')

# Чтение изображения
img = cv2.imread('group.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Обнаружение лиц
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30,30))

# Рисование прямоугольников
for (x, y, w, h) in faces:
    cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)

# Показ результата
cv2.imshow('Detected Faces', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

(изображение с синими прямоугольниками вокруг лиц)

Параметры detectMultiScale: scaleFactor - шаг изменения масштаба (1.1 означает уменьшение на 10%), minNeighbors - минимальное количество соседних прямоугольников, подтверждающих лицо, minSize - минимальный размер лица в пикселях. Более низкий scaleFactor увеличивает точность, но замедляет работу.

Перспективное преобразование для выпрямления документа

Используя функции cv2.getPerspectiveTransform и cv2.warpPerspective, можно исправить искажения. Подходит для сканирования бумаг с фото.

Пример

import cv2
import numpy as np

img = cv2.imread('document.jpg')
# Исходные координаты четырех углов документа (порядок: левый верх, правый верх, правый низ, левый низ)
pts_src = np.float32([[141, 131], [480, 159], [493, 630], [64, 601]])
# Целевые координаты - прямоугольник в том же размере
height, width = img.shape[:2]
pts_dst = np.float32([[0, 0], [width-1, 0], [width-1, height-1], [0, height-1]])
# Вычисление матрицы преобразования
matrix = cv2.getPerspectiveTransform(pts_src, pts_dst)
# Применение преобразования
warped = cv2.warpPerspective(img, matrix, (width, height))

cv2.imshow('Warped', warped)
cv2.waitKey(0)

(выпрямленное изображение документа)

Для автоматического нахождения углов документа можно использовать findContours и аппроксимацию контура. Типичная ошибка - неправильный порядок точек; они должны соответствовать углам документа.

Сопоставление шаблонов (Template Matching)

Метод позволяет найти фрагмент изображения (шаблон) на большом изображении.

Пример

import cv2

img = cv2.imread('scene.jpg', 0)  # серое изображение
template = cv2.imread('template.jpg', 0)
w, h = template.shape[::-1]

# Сопоставление с помощью корреляции
result = cv2.matchTemplate(img, template, cv2.TM_CCOEFF_NORMED)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result)

# Если метод TM_CCOEFF_NORMED, максимум - лучшее совпадение
top_left = max_loc
bottom_right = (top_left[0] + w, top_left[1] + h)
cv2.rectangle(img, top_left, bottom_right, 255, 2)

cv2.imshow('Detected', img)
cv2.waitKey(0)

(серое изображение с белым прямоугольником вокруг найденного шаблона)

Выбор метода (TM_CCOEFF_NORMED, TM_CCORR_NORMED, TM_SQDIFF_NORMED) влияет на результат. При TM_SQDIFF_NORMED минимум соответствует лучшему совпадению. Проблемы: шаблон должен быть точно такого же масштаба и ориентации; для устойчивости к поворотам используют feature matching (SIFT, ORB).

Функции OpenCV в Python - comments

Python opencv functions (python)