pythonopencv圖像特征檢測-tft每日頭條

pythonopencv圖像特征檢測

科技更新时间:2026-07-15 21:31:39

摘要： 使用Numpy和OpenCV完成圖像的基本數據分析第三部分，主要包含圖像變換、卷積操作等。

pythonopencv圖像特征檢測（使用Numpy和Opencv完成圖像的基本數據分析）1

引言

本文是使用python進行圖像基本處理系列的第三部分，在本人之前的文章裡介紹了一些非常基本的圖像分析操作，見文章《使用Numpy和Opencv完成圖像的基本數據分析Part I》和《使用Numpy和Opencv完成圖像的基本數據分析 Part II》，下面我們将繼續介紹一些有關圖像處理的好玩内容。

本文介紹的内容基本反映了我本人學習的圖像處理課程中的内容，并不會加入任何工程項目中的圖像處理内容，本文目的是嘗試實現一些基本圖像處理技術的基礎知識，出于這個原因，本文繼續使用 SciKit-Image,numpy數據包執行大多數的操作，此外，還會時不時的使用其他類型的工具庫，比如圖像處理中常用的OpenCV等：

本系列分為三個部分，分别為part I、part II以及part III。剛開始想把這個系列分成兩個部分，但由于内容豐富且各種處理操作獲得的結果是令人着迷，因此不得不把它分成三個部分。系列所有的源代碼地址：GitHub-Image-Processing-Python。

在上一篇文章中，我們已經完成了以下一些基本操作。為了跟上今天的内容，回顧一下之前的基本操作：

導入圖像并觀察其屬性
拆分圖層
灰度處理
對像素值使用邏輯運算符
使用邏輯運算符進行掩碼

現在開始本節的内容：

強度變換|Intensity Transformation

首先導入一張圖像作為開始：

%matplotlibinline import imageio import matplotlib.pyplot as plt import warnings import matplotlib.cbook warnings.filterwarnings("ignore",category=matplotlib.cbook.mplDeprecation) pic=imageio.imread('img/parrot.jpg') plt.figure(figsize=(6,6)) plt.imshow(pic); plt.axis('off');

pythonopencv圖像特征檢測（使用Numpy和Opencv完成圖像的基本數據分析）2

圖像底片|Image negative

強度變換函數在數學上定義為：

S = T(r)

其中r是輸入圖像的像素，S是輸出圖像的像素，T是一個轉換函數，它将r的每個像素值映射到s中對應的像素值。

負變換，即恒等變換的逆。在負變換中，輸入圖像的每個像素值從L-1中減去并映射到輸出圖像上。

在這種情況下，完成以下轉換：

S =(L-1)-r

因此，每個像素值都減去255。這樣的操作導緻的結果是，較亮的像素變暗，較暗的圖像變亮，類似于圖像底片。

negative =255- pic # neg = (L-1) - img plt.figure(figsize= (6,6)) plt.imshow(negative); plt.axis('off');

pythonopencv圖像特征檢測（使用Numpy和Opencv完成圖像的基本數據分析）3

對數變換|log transformation

對數轉換可以通過以下公式定義：

s = c *log(r 1)

其中s和r是輸出和輸入圖像的像素值，c是常數。輸入圖像的每個像素值都會加1，之後再進行對數操作，這是因為如果圖像中的像素值為0時，log(0)的結果等于無窮大。因此，為了避免這種情況的發生，輸入圖像中的每個像素值都加1，使最小像素值至少為1。

在對數變換過程中，與較高像素值相比，圖像中的低像素被擴展。較高的像素值在對數變換中被壓縮，這導緻圖像增強。

對數變換中的c值調整了我們想要的增強程度：

%matplotlibinline import imageio import numpyasnp import matplotlib.pyplotasplt pic=imageio.imread('img/parrot.jpg') gray=lambdargb:np.dot(rgb[...,:3],[0.299,0.587,0.114]) gray=gray(pic) ''' log transform -> s = c*log(1 r) So, we calculate constant c to estimate s -> c = (L-1)/log(1 |I_max|) ''' max_=np.max(gray) def log_transform(): return(255/np.log(1 max_))*np.log(1 gray) plt.figure(figsize=(5,5)) plt.imshow(log_transform(),cmap=plt.get_cmap(name='gray')) plt.axis('off');

pythonopencv圖像特征檢測（使用Numpy和Opencv完成圖像的基本數據分析）4

伽馬校正| Gamma Correction

伽馬校正，或通常簡稱為伽瑪，是用于對視頻或靜止圖像系統中的亮度或三刺激值進行編碼和解碼的非線性操作，伽瑪校正也稱為幂律變換。首先，圖像的像素值大小範圍必須從0~255被縮放至0~1.0。然後，通過應用以下等式獲得伽馬校正後的輸出圖像：

Vo = Vi ^(1 / G)

其中Vi是我們的輸入圖像，G是設置的伽瑪值，然後将輸出圖像Vo縮放回0-255範圍。

對于伽馬值而言，G <1有時被稱為編碼伽瑪，并且利用該壓縮幂律非線性進行編碼的過程被稱為伽馬壓縮； Gamma值小于1會将圖像移向光譜的較暗端。

相反，伽馬值G> 1被稱為解碼伽馬，并且膨脹幂律非線性的應用被稱為伽馬展開。Gamma值大于1将使圖像顯得更亮。将伽瑪值設置為G = 1時對輸入圖像沒有影響：

import imageio import matplotlib.pyplotasplt # Gamma encoding pic=image io.imread('img/parrot.jpg') gamma=2.2# Gamma < 1 ~ Dark ; Gamma > 1 ~ Bright gamma_correction=((pic/255)**(1/gamma)) plt.figure(figsize=(5,5)) plt.imshow(gamma_correction) plt.axis('off');

pythonopencv圖像特征檢測（使用Numpy和Opencv完成圖像的基本數據分析）5

伽馬校正的原因|Reason for Gamma Correction

我們應用伽馬校正的原因是，由于我們的眼睛感知顔色和亮度這一過程與數碼相機中的傳感器的工作原理不同。當數碼相機上的傳感器獲得兩倍的光子量時，信号會加倍。但是，我們人類的眼睛的工作原理與這不同，當我們的眼睛感知兩倍的光量時，視野中隻有一小部分顯得更亮。因此，數碼相機在亮度之間具有線性關系，而我們人類的眼睛具有非線性關系。為了解釋這種關系，我們應用伽瑪校正。

還有一些其他的線性變換函數，比如：

對比度拉伸（Contrast Stretching）
強度切片（Intensity-Level Slicing）
位平面切片（Bit-Plane Slicing）

卷積|Convolution

在上一篇文章中，對卷積操作作了簡要讨論。當計算機看到圖像時，它看到不是一整幅圖像，它的眼裡看到的隻是一個像素值數組。假設讀取一個32X32大小的彩色圖像，根據圖像的分辨率和大小，計算機它将看到一個32 x 32 x 3維的數字數組，其中3表示RGB值或三通道。假設現在我們有一個PNG格式的彩色圖像，它的大小是480 x 480。将其讀入後，其表示數組将是480 x 480 x 3維。數組中的所有的每個數字值範圍都在0到255之間，它描述的是那個點的像素強度。

就像我們剛才提到的那樣，假設輸入圖像是一個32 x 32 x 3的像素值數組，解釋卷積的最佳方法是想象一個閃爍在圖像左上方的手電筒。假設手電筒照射區域大小為3 x 3。現在，讓我們假設這個手電筒滑過輸入圖像的所有區域。在機器學習術語中，這個手電筒被稱為過濾器（filter）或内核（kernel），或者有時被稱為權重（weights）或掩模（mask），它所照射的區域稱為感受野（receptive field）。

現在，此過濾器也是一個數字數組，數組中的數字稱為權重或參數，在這裡要着重注意一點，此過濾器的深度必須與輸入圖像的深度相同，即通道數相同，因此此過濾器的尺寸為3 x 3 x 3。

圖像内核或過濾器是一個小矩陣，用于應用我們可能在Photoshop或Gimp中找到的效果，例如模糊、銳化、輪廓或浮雕等。此外，它們還被用于在機器學習中進行圖像特征提取（CNN），這是一種用于确定圖像最重要部分的技術。更多相關信息，請查看Gimp關于使用Image kernel的文檔，我們可以該文檔中找到最常見的内核列表。

現在，讓我們将過濾器放在圖像的左上角。當濾波器圍繞輸入圖像滑動或卷積時，它将濾波器中的值乘以圖像的原始像素值（也稱為計算元素乘法）。這些乘法操作最後都會求和，所以卷積操作後隻得到一個數字值。請記住，此數字僅代表過濾器位于圖像的左上角。現在，我們對輸入圖像上的每個位置重複此過程，移動過濾器使其與圖像矩陣的每個像素值進行卷積操作，這個過程需要設置移動步幅，依此類推，完成整幅圖像的卷積操作。輸入圖中的每個唯一位置都會生成一個數字。步幅的取值一般為1，也可以取其它大小的值，但我們關心的是它是否适合輸入圖像。

pythonopencv圖像特征檢測（使用Numpy和Opencv完成圖像的基本數據分析）6

過濾器滑過輸入圖像上的所有位置後，我們會發現，我們剩下的是一個30 x 30 x 1的數組，我們将其稱為激活圖或特征圖。将3 x 3過濾器可以放在32 x 32輸入圖像上，可以得到30 x 30大小的陣列，原因是有300個不同的位置，這900個數字映射到30 x 30陣列。我們可以通過以下方式計算卷積圖像後圖像的大小：

卷積：(N-F)/ S 1

其中N和F分别代表輸入圖像大小和卷積核大小，S代表步幅或步長。因此，對于上述情況，輸出圖像的大小将是

32-31 1 = 30

假設我們有一個3x3濾波器，在5x5大小的矩陣上進行卷積，根據等式，我們應該得到一個3x3矩陣，現在讓我們看一下：

pythonopencv圖像特征檢測（使用Numpy和Opencv完成圖像的基本數據分析）7

此外，我們實際上使用的過濾器不止一個，過濾器的數量自己設定，假設過濾器的數量設置為n，則我們的輸出将是28x28xn大小（其中n是特征圖的數量）。

通過使用更多的過濾器，我們能夠更好地保留空間維度信息。

然而，對于圖像矩陣邊界上的像素，卷積核的一些元素移動時會出現在圖像矩陣之外，因此不具有來自圖像矩陣的任何對應元素。在這種情況下，我們可以消除這些位置的卷積運算，最終輸出矩陣大小将會小于輸入圖像，或者我們可以對輸入圖像矩陣進行填充（padding），以保證輸出圖像大小維度不變。

為了保持本系列的簡潔而保持内容的完整性，本文提供了全部的資源鍊接，在其中更詳細地解釋了有關内容。

下面，讓我們首先将一些自定義卷積核個數的窗口應用于圖像中，這可以通過平均每個像素值與附近的像素值來處理圖像：

%%time import numpy as np import imageio import matplotlib.pyplot as plt from scipy.signal import convolve2d def Convolution(image, kernel): conv_bucket= [] for d in range(image.ndim): conv_channel= convolve2d(image[:,:,d], kernel, mode="same", boundary="symm") conv_bucket.append(conv_channel) returnnp.stack(conv_bucket, axis=2).astype("uint8") kernel_sizes= [9,15,30,60] fig, axs=plt.subplots(nrows=1, ncols=len(kernel_sizes), figsize=(15,15)); pic =imageio.imread('img:/parrot.jpg') for k, ax in zip(kernel_sizes, axs): kernel =np.ones((k,k)) kernel /=np.sum(kernel) ax.imshow(Convolution(pic, kernel)); ax.set_title("Convolved By Kernel: {}".format(k)); ax.set_axis_off(); Wall time: 43.5 s

pythonopencv圖像特征檢測（使用Numpy和Opencv完成圖像的基本數據分析）8

更多内容可以在此查看，其中已經深入讨論了各種類型的内核，并展示了它們之間的差異。

作者信息

Mohammed Innat，機器學習和數據科學研究者

本文由阿裡雲雲栖社區組織翻譯。

文章原标題《Basic Image Data Analysis Using Numpy and OpenCV – Part 3》，譯者：海棠，審校：Uncle_LLD。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技 iphone11為什麼會發熱嚴重
1、處理器問題首先要說的就是處理器，處理的作用是非常大，遊戲和日常使用都離不開，iphone11這一款手機搭載的是A13的處理器，性能是非常強悍的，我們平時玩大型的手機遊戲都有着很不錯的體驗。不過剛好這個發熱的問題也是出現在處理器上面。據有專業人士的拆機來看，iPhone11系列所使用的處理器都是用的雙層主闆結構的設計，在内部的空間結構上就相當的緊湊，這就是導緻了發熱的最大原因。對于這個問題，估計 2023-07-08
科技我手機抖音怎麼沒有聲音
1、可能是不小心開啟了【靜音】按鍵，隻需将靜音模式關閉即可恢複聲音。2、設置了【勿擾模式】，手動關閉掉【勿擾模式】設定即可恢複正常。3、可能是手機進入了耳機模式狀态還未恢複，将耳機線重新插入再撥出，然後播放聲音聽是否恢複正常。4、手機系統出現錯誤了，可以嘗試重新啟動一下手機，看看能不能解決，如不能解決的話可以先備份手機資料，再嘗試還原手機出廠設置。 2023-07-08
科技 ie腳本錯誤怎麼解決
1、打開IE浏覽器，點擊設置”，選擇Internet選項”。2、點擊删除”，勾選全部選項，點擊删除”按鈕。3、點擊安全”，點擊将所有區域重置為默認級别”。4、點擊高級”，點擊還原高級設置”。 2023-07-08
科技 vivo不是原裝充電頭能快充嗎
1、vivo手機不用原裝充電器沒有閃充功能。手機上要實現快充充電功能需要滿足三要素，三者缺一不可。充電器、電池、chargeIC。充電器需要滿足足夠的輸出電流以及輸出電壓，因為充電器的走線有很大的寄生電阻，如果要實現較大的充電電流，充電器的帶載輸出電壓需要較高。2、手機在使用過程中電池續航能力是一個主要問題，解決續航問題的方法就是使用快速充電技術讓手機電池迅速充滿電，也叫閃充功能。 2023-07-08
科技 shs文件怎麼打開
1、首先在文件夾中或者桌面上新建一個空白的word文檔。2、然後雙擊打開Word文檔。接着右鍵shs... 2023-07-08
科技 U盤文件怎麼導入
1、把u盤插入電腦的usb插口。2、有的電腦會自動彈出文件夾，裡面是u盤裡的文件。3、沒有彈出也沒關... 2023-07-08
科技拖拉機液壓自落的原因
1、拖拉機液壓自落是拖拉機液壓上典型的自動沉降現象，原因是因為外漏或内漏。2、液壓系統由缸、泵、閥及... 2023-07-08
科技手機56G現在隻有16G了怎麼辦
1、對手機進行清理，連接網絡進入手機管家清理，會将手機緩存、垃圾文件、應用數據、軟件殘留等進行清理，... 2023-07-08
科技标簽失效怎麼重新激活
1、連續插拔ETC卡兩次直至電子标簽屏幕顯示“藍牙已開”，如果在沒貼電子标簽時插拔兩次顯示“标簽失效... 2023-07-08
科技火星有人上去過嗎
1、沒有，人制造的飛行器上過火星。2、因為火星距離地球也非常遠，從地球到火星需要花費上半年的時間。往... 2023-07-08
科技江西省永新縣是與湖南省那個縣交界？
1、湖南茶陵縣與江西永新縣相鄰。2、茶陵縣，隸屬株洲市，位于湖南東部。北抵長沙，南通廣州，西接衡陽、... 2023-07-08
科技為什麼蘋果手機關閉不了自動更新
1、打開手機設置2、在設置裡點擊iTunesStore和AppStore3、然後這個位置将更新關閉4... 2023-07-08
科技鼠标鍵盤燈亮但是沒反應
1、檢查下是不是誤删除了驅動程序。因為鍵盤的驅動程序都是操作系統自帶着的，所以，驅動删除後是可以很簡... 2023-07-08
科技上鎖挂簽是什麼意思
上鎖挂簽測試就是在檢維修作業中過程中，在工藝确保能量隔離（切斷物料、排空、清洗、置換）合格後，用安全鎖具将閥門、電氣開關、蓄能配件等設定在合适的位置使其不能運轉、并挂上标牌，以保證能量隔離不要被意外破壞的一種方法。主要适用于檢維修作業、工藝長期切斷、長期停用設備的物料能量隔離。 2023-07-08
科技主闆帶wifi和不帶wifi區别
演示機型：華為MateBookX系統版本：win10兩種主闆的其餘參數外觀沒有任何區别，隻有帶不帶WiFi的區别，帶WiFi的可以使用WiFi，不帶WiFi的無法使用WiFi。主流主闆的WiFi網卡都是IntelWiFi6AX200無線網卡，采用了最新一代WiFi标準，速度和質量俱佳。主闆的作用：1、将不同電壓的用電器連接在一起，并提供相應的電源。2、将不同功能的用電器連接在一起，使它們相互傳遞信 2023-07-08
科技孕期羊水過多對胎兒有何影響
第一、孕期正常羊水量為多少？孕期羊水在孕晚期前一直會增加，孕34-36周時達到頂峰值，約1誇脫946毫升。之後羊水量會慢慢減少直至生産。第二、如何判斷羊水過多？如果孕媽媽發現自己的肚子增大過快，或者覺得肚子異常不舒服、腰痛頻發、呼吸急促、腳部腫脹厲害等等，則有可能是羊水過多。一旦有上述情況發生，趕緊去醫院做B超。超聲波醫生會測量子宮四個不同位置上最大的羊水囊，然後将四個數值相加，并對羊水指數評分A 2023-07-08
科技 oppo手機gps在哪裡打開
1、打開手機，找到設置”圖标，點擊。2、點擊後，進入新界面，點擊其他設置”。3、進入新界面，點擊安全與隐私”進入。4、點擊位置信息”。5、進入界面，點擊定位服務”後方的按鈕，顯示打開狀态即可。 2023-07-08
科技 ip地址劃分方法
1、根據網絡号和主機号的不同，分為A，B，C，D，E類。其中，A類網絡号少，網絡内主機号多，通常是比... 2023-07-08
科技現值和終值計算公式
1、複利終值公式:F＝P×（1＋i）n，其中，（1＋i）n稱為複利終值系數，用符号（F/P，i，n）... 2023-07-08
科技鋁合金硬度怎樣測試
1、硬度應選擇在較小的溫度變化範圍内進行，因為溫度變化可能會對試驗結果有影響。所以試驗一般規定在10... 2023-07-08
科技入門級單反相機使用技巧大全
1、光圈優先大多用在拍人像以及風景時光圈優先就是手動定義光圈的大小，相機會根據這個光圈值确定快門速度... 2023-07-08
科技鉛酸蓄電池修複方法
1、脈沖修複法：采用高頻正負脈沖發生器，對電池不斷的産生高低變頻脈沖，破壞了大硫酸鉛繼續生長的條件，... 2023-07-08
科技 ai導出内存不足怎麼辦
1、打開AdobeIllustrator軟件，然後在頂部菜單欄點擊AdobeIllustrator，... 2023-07-08
科技手機系統自動禁止安裝軟件怎麼辦
1、首先，出現這種情況一般是我們禁止安裝外來應用導緻的，我們點擊設置。2、彈出的界面，我們點擊安全和隐私。3、彈出的界面，我們點擊更多安全設置。4、彈出的界面，我們将未知來源應用下載的開關向右滑動。5、彈出的界面，我們點擊确定，之後我們就可以安裝應用了。 2023-07-08
科技怎麼能删掉鬧鐘
删掉手機鬧鐘步驟如下：1、需要先找到手機上的鬧鐘設置。2、打開之後我們首先點擊左下角的鬧鐘選項，或者... 2023-07-08
科技蘋果6s的屏幕尺寸是多少
以iPhone6s、iOS12.4.1為例。4.7英寸。iPhone6s是美國蘋果公司于北京時間2015年9月10日發布的一款智能手機。iPhone6s的配色有金色、銀色、深空灰色、玫瑰金色。其内部具有壓力感應觸摸屏技術3DTouch，屏幕采用高強度的Ion-X玻璃，采用了蘋果A9處理器，後置攝像頭1200萬像素，前置攝像頭500萬像素，CMOS為了降噪采用“深槽隔離”技術，支持4K視頻攝錄。iP 2023-07-08
科技蘋果airpods與自帶有線耳機區别
1、外觀不同。蘋果有線耳機EarPods主要通過線材傳遞音頻信号，相對更加穩定；而無線耳機AirPo... 2023-07-08
科技流量gb是什麼意思
1、流量中GB是記錄設備訪問互聯網消耗的字節數。2、8字節=1B；1024B=1KB；1024KB=... 2023-07-08
科技 w10怎麼恢複出廠設置
演示機型：華為MateBookX系統版本：win101、在系統可以正常工作時，點擊開始按鈕，選擇設置。2、點擊右下角的“更新和安全”。3、在左側列表點擊“恢複”，找到“重置此電腦”，點擊“開始”。4、選擇一個選項，點擊“保留我的文件”或者“删除所有内容”， 2023-07-08
科技 10倍光學變焦手機有哪些
1、OPPO手機：10倍混合光學變焦技術，采用三枚攝像頭相互協作，最大限度地發揮各自優勢，在不同變焦區間上都能獲得更好的成像品質，以接棒式的方式實現了10倍變焦，滿足用戶從超廣角到遠攝的多場景構圖創作需求。2、MotoZ：10倍光學變焦，魔影哈蘇攝影模塊的10倍光變絕對是首屈一指的賣點與使用之處，35mm等效焦距下的250mm焦距已經超過了各品牌單反鏡頭群普遍采用的70-200mm遠攝變焦鏡頭，單 2023-07-08

tft每日頭條

> 科技

> pythonopencv圖像特征檢測

pythonopencv圖像特征檢測

相关科技资讯推荐

热门科技资讯推荐

网友关注