openCV - Open Source Computer Vision Library
logo圖标用的是三原色:BGR
三個核心和常用的模塊
- core:核心模塊,主要包含了openCV中最基本的結構(矩陣,點線和形狀等),以及相關的基礎運算/操作。
- imgproc:圖像處理模塊,包含和圖像相關的基礎功能(濾波,梯度,改變大小等),以及一些衍生的高級功能(圖像分割,直方圖,形态分析和邊緣/直線提取等)。
- highgui:提供了用戶界面和文件讀取的基本函數,比如圖像顯示窗口的生成和控制,圖像/視頻文件的IO等。
視頻和一些特别的視覺應用
- video:用于視頻分析的常用功能,比如光流法(Optical Flow)和目标跟蹤等。
- calib3d:三維重建,立體視覺和相機标定等的相關功能。
- features2d:二維特征相關的功能,主要是一些不受專利保護的,商業友好的特征點檢測和匹配等功能,比如ORB特征。
- object:目标檢測模塊,包含級聯分類和Latent SVM
- ml:機器學習算法模塊,包含一些視覺中最常用的傳統機器學習算法。
- flann:最近鄰算法庫,Fast Library for Approximate Nearest Neighbors,用于在多維空間進行聚類和檢索,經常和關鍵點匹配搭配使用。
- gpu:包含了一些gpu加速的接口,底層的加速是CUDA實現。
- photo:計算攝像學(Computational Photography)相關的接口,當然這隻是個名字,其實隻有圖像修複和降噪而已。
- stitching:圖像拼接模塊,有了它可以自己生成全景照片。
- nonfree:受到專利保護的一些算法,其實就是SIFT和SURF。
- contrib:一些實驗性質的算法,考慮在未來版本中加入的。
- legacy:字面是遺産,意思就是廢棄的一些接口,保留是考慮到向下兼容。
- ocl:利用OpenCL并行加速的一些接口。
- superres:超分辨率模塊,其實就是BTV-L1(Biliteral Total Variation – L1 regularization)算法
- viz:基礎的3D渲染模塊,其實底層就是著名的3D工具包VTK(Visualization Toolkit)。
圖像基礎——圖像按照像素存儲:
黑白顔色的灰度圖:
為單通道,一個像素塊對應矩陣中一個數字,數值為0到255, 其中0表示最暗(黑色) ,255表示最亮(白色), 是一個二維矩陣。
RGB模式的彩色圖片
為三通道圖,Red、Green、Blue三原色,按不同比例相加,一個像素塊對應矩陣中的一個向量, 如[24,180, 50],分别表示三種顔色的比列, 即對應深度上的數字,是一個三維矩陣。openCV采用的是BGR模式, 不是RGB。
基本繪圖:
import numpy as np
import cv2 as cv
# 定義一塊寬600,高400的畫布,初始化為白色
canvas = np.zeros((400, 600, 3), dtype=np.uint8) 255
# 注意cv的顔色是BGR
# 畫一條縱向的正中央的黑色分界線
cv.line(canvas, (300, 0), (300, 399), (0, 0, 0), 2)
# 畫一條右半部份畫面以150為界的橫向分界線
cv.line(canvas, (300, 149), (599, 149), (0, 0, 0), 2)
# 左半部分的右下角畫個紅色的圓
cv.circle(canvas, (200, 300), 70, (0, 0, 255), 2)
# 左半部分的左下角畫個黑色的矩形
cv.rectangle(canvas, (20, 240), (100, 360), (0, 0, 0), thickness=2)
# 定義兩個三角形,并執行内部橙色填充
triangles = np.array([
[(200, 240), (145, 333), (255, 333)],
[(60, 180), (20, 237), (100, 237)]])
cv.fillPoly(canvas, triangles, (0, 153,255))
# 畫一個黃色五角星
# 第一步通過旋轉角度的辦法求出五個頂點
phi = 4 * np.pi / 5
rotations = [[[np.cos(i * phi), -np.sin(i * phi)], [i * np.sin(phi), np.cos(i * phi)]] for i in range(1, 5)]
pentagram = np.array([[[[0, -1]] [np.dot(m, (0, -1)) for m in rotations]]], dtype=np.float)
# 定義縮放倍數和平移向量把五角星畫在左半部分畫面的上方
pentagram = np.round(pentagram * 80 np.array([160, 120])).astype(np.int)
# 将5個頂點作為多邊形頂點連線,得到五角星
cv.polylines(canvas, pentagram, True, (255, 0, 0), 2)
# 按像素為間隔從左至右在畫面右半部份的上方畫出HSV空間的色調連續變化
for x in range(302, 600):
color_pixel = np.array([[[round(180*float(x-302)/298), 255, 255]]], dtype=np.uint8)
line_color = [int(c) for c in cv.cvtColor(color_pixel, cv.COLOR_HSV2BGR)[0][0]]
cv.line(canvas, (x, 0), (x, 147), line_color)
np.random.seed(42)
n_pts = 30
pts_x = np.random.randint(310, 590, n_pts)
pts_y = np.random.randint(160, 390, n_pts)
pts = zip(pts_x, pts_y)
# 畫出每個點,顔色随機
for pt in pts:
pt_color = [int(c) for c in np.random.randint(0, 255, 3)]
cv.circle(canvas, pt, 3, pt_color, 5)
# 在左半部分最上方打印文字
cv.putText(canvas,
'Python-OpenCV Drawing Examples',
(5, 15),
cv.FONT_HERSHEY_SIMPLEX,
0.5,
(0, 0, 0),
1)
#顯示
cv.imshow('canvas',canvas)
cv.waitKey()
#關閉窗口
#cv.destroyAllWindows()
輸出結果如下:
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!