程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

Opencv-python_圖像基本操作和處理_函數方法簡單歸納

編輯:Python

內容目錄

  • 圖像基本操作
  • 圖像處理
  • 邊緣檢測、圖像輪廓處理和模板匹配
  • 圖像金字塔、直方圖
  • 傅裡葉變換和低通/高通濾波

圖像基本操作

方法含義數據讀取:圖像具體含義imread()從路徑中讀取圖片imshow()顯示圖像到窗口waitKey(0/ms)窗口顯示等待時間,0表示手動終止,ms表示毫秒後終止destroyAllWindows()關閉窗口操作IMREAD_GRAYSCALE讀取灰度圖IMREAD_GRAYSCALE讀取RGB三色圖imwrite()保存圖片至路徑數據讀取:視頻具體含義VideoCapture(path/0/1)讀取視頻,path視頻路徑,0/1表示攝像頭vc.isOpened()檢測視頻是否讀取/檢測攝像頭是否打開open, frame = vc.read()將視頻按幀讀取,open變量表示讀取是否成功(bool),frame表示讀取到的每一幀cvtColor( frame, cv2.COLOR_BGR2GRAY)將視頻幀從BGR圖片轉換成灰度圖vc.release()釋放攝像頭,或者關閉視頻文件數據讀取:分離或組織通道具體含義b,g,r=cv2.split( img )分離圖像的BGR三個通道img=cv2.merge( (b,g,r) )將三個單通道的圖像組織成BGR彩色圖cur_img = img.copy()對圖片進行復制操作,復制後的結果就是cur_img邊界填充具體含義cv2.copyMakeBorder( img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)BORDER_REPLICATE:復制法,也就是復制最邊緣像素。函數同上,最後一個參數:borderType=cv2.BORDER_REFLECTBORDER_REFLECT:反射法,對感興趣的圖像中的像素在兩邊進行復制函數同上,最後一個參數:borderType=cv2.BORDER_REFLECT_101BORDER_REFLECT_101:反射法,也就是以最邊緣像素為軸,對稱函數同上,最後一個參數:borderType=cv2.BORDER_WRAPBORDER_WRAP:外包裝法函數同上,最後一個參數:borderType=cv2.BORDER_CONSTANTBORDER_CONSTANT:常量法數值計算具體含義圖片 + 數字對圖片的所有像素點都增加這個數字圖片 + 圖片兩圖片對應像素點位置相加,當像素點之和大於255時,會對像素點和求256的余數作為最終結果cv2.add( img_cat,img_cat2 )兩圖片對應像素點位置相加,當像素點之和大於255時,值設置成255img_new = cv2.convertScaleAbs( img )對圖片裡面的像素取絕對值圖像融合具體含義img_dog = cv2.resize( img_dog, (500, 414) )對圖片重新設置w值和h值res = cv2.resize( img, (0, 0), fx=4, fy=4 )在x方向或者y方向增大fx,fy的倍數res = cv2.addWeighted( img_cat, 0.5, img_dog, 0.5, 0 )圖像融合,img_cat設置權重0.5,img_dog設置權重0.5,0偏置

圖像處理

方法含義阈值處理具體含義ret, dst = cv2.threshold(src, thresh, maxval, type)src:輸入圖,只能輸入單通道圖像,通常來說為灰度圖;dst:輸出圖;thresh:阈值;maxval:當像素值超過了阈值(或者小於阈值,根據type來決定),所賦予的值。type = cv2.THRESH_BINARY超過阈值部分取maxval(最大值),否則取0。亮的地方變得最亮,暗的地方變得最暗。type = cv2.THRESH_BINARY_INVcv2.THRESH_BINARY的反轉操作type = cv2.THRESH_TRUNC大於阈值部分設為阈值,否則不變,相當於向上截斷的操作type = cv2.THRESH_TOZERO大於阈值部分不改變,否則設為0,相當於向下截斷的操作type = cv2.THRESH_TOZERO_INVTHRESH_TOZERO的反轉圖像平滑濾波操作具體含義blur = cv2.blur(img, (3, 3))簡單的平均卷積操作,(3,3)是卷積核box = cv2.boxFilter(img,-1,(3,3), normalize=True)方框濾波,可以選擇進行歸一化處理Gaussian = cv2.GaussianBlur(img, (5, 5), 1)高斯濾波的卷積核裡的數值是滿足高斯分布,相當於更重視中間的median = cv2.medianBlur(img, 5)相當於用中值代替,目前來看效果最好圖像形態學操作(灰度圖)具體含義erosion = cv2.erode(img,kernel,iterations=1)腐蝕操作,周圍邊界向中心區域腐蝕,kernel是腐蝕的核,iterations表示腐蝕操作進行的次數dige_dilate = cv2.dilate(dige_erosion,kernel,iterations = 1)膨脹操作,中心區域向周圍區域膨脹,kernel是膨脹的核,iterations表示膨脹操作進行的次數opening = cv2.morphologyEx(img, cv2.MORPH_OPEN, kernel)開運算:先腐蝕,再膨脹closing = cv2.morphologyEx(img, cv2.MORPH_CLOSE, kernel)開運算:先膨脹,再腐蝕圖像梯度運算具體含義gradient = cv2.morphologyEx(img, cv2.MORPH_GRADIENT, kernel)求梯度操作,梯度=膨脹-腐蝕,kernel是梯度的核tophat = cv2.morphologyEx(img, cv2.MORPH_TOPHAT, kernel)求禮帽操作,禮帽=原始輸入-開運算結果,kernel是禮帽的核blackhat = cv2.morphologyEx(img,cv2.MORPH_BLACKHAT, kernel)求黑帽操作,黑帽=閉運算結果-原始輸入,kernel是黑帽的核dst = cv2.Sobel(src, ddepth, dx, dy, ksize)Sobel算子求梯度。ddepth:圖像的深度,當圖像涉及到負值的時候,選用cv2.CV_64F這個type;dx和dy分別表示水平和豎直方向,兩者中只能一個為1另一個為0,同時為1效果不好;ksize是Sobel算子的大小,基本上選取(奇數,奇數)類型dst = cv2.Scharr(src, ddepth, dx, dy, ksize)Scharr算子求梯度。ddepth:圖像的深度,當圖像涉及到負值的時候,選用cv2.CV_64F這個type;dx和dy分別表示水平和豎直方向,兩者中只能一個為1另一個為0,同時為1效果不好;ksize是SCharr算子的大小,基本上選取(奇數,奇數)類型。與Sobel算子類似,只是Scharr算子的數值差異較大一些。laplacian = cv2.Laplacian(src, ddepth)Laplace算子求梯度。ddepth:圖像的深度,當圖像涉及到負值的時候,選用cv2.CV_64F這個type。基本圖形繪制具體含義img = cv2.rectangle(img,(x,y),(x+w,y+h),(0,255,0),2)在圖片上繪制矩形。img:進行操作的圖片;(x,y):矩形繪制的起始點;(x+w,y+h):舉行繪制的終點;(0,255,0):矩形繪制的顏色;2:矩形繪制的線條粗細度。img = cv2.circle(img,center,radius,(0,255,0),2)在圖片上繪制圓形。img:進行操作的圖片;center:圓心坐標;radius:半徑長度;(0,255,0):矩形繪制的顏色;2:矩形繪制的線條粗細度。

邊緣檢測、圖像輪廓處理和模板匹配

方法含義Canny邊緣檢測方法含義v1=cv2.Canny(img, minValue, maxValue)Canny邊緣檢測。(1) 使用高斯濾波器(隨後進行核歸一化操作),以平滑圖像,濾除噪聲。(2) 計算圖像中每個像素點的梯度強度(Sobel/Scharr)和方向(求 a r c t a n ( d y d x ) \mathbf{arctan}(\frac{\mathbf{d}y}{\mathbf{d}x}) arctan(dxdy​))。(3) 應用非極大值(Non-Maximum Suppression)抑制,以消除邊緣檢測帶來的雜散響應。具體方法是線性插值法八方向法。通過這兩個方法計算一條梯度線前後的兩個梯度的大小,當前後的兩個梯度的大小均小於中間的這個梯度,那麼這個梯度值就是梯度了。(4) 應用雙阈值(Double-Threshold)檢測來確定真實的和潛在的邊緣。當梯度值大於maxValue,則處理為邊界;當梯度值處在(minValue,maxValue)之間,與邊界連接的就保留,沒有與邊界連接的就捨去;當梯度值小於minValue,必定捨棄。(5) 通過抑制孤立的弱邊緣最終完成邊緣檢測。minValue, maxValue選值兩者較高,相當於邊緣檢測較嚴格,呈現結果的邊緣較少;兩者較低,相當於邊緣檢測不嚴格,呈現結果的邊緣較多輪廓檢測方法含義binary, contours, hierarchy = cv2.findContours(img,mode,method)尋找邊緣的方法。img:輸入的圖片;mode:邊緣檢測的模式;method:邊緣檢測的方法。【注意】需要將BGR圖像轉成灰度圖,再經過阈值處理(方法:cv2.THRESH_BINARY)。mode = RETR_EXTERNAL只檢索最外面的輪廓mode = RETR_LIST檢索所有的輪廓,並將其保存到一條鏈表當中mode = RETR_CCOMP檢索所有的輪廓,並將他們組織為兩層:頂層是各部分的外部邊界,第二層是空洞的邊界mode = RETR_TREE檢索所有的輪廓,並重構嵌套輪廓的整個層次(常用)method = CHAIN_APPROX_NONEFreeman鏈碼的方式輸出輪廓,所有其他方法輸出多邊形(頂點的序列)。method = CHAIN_APPROX_SIMPLE壓縮水平的、垂直的和斜的部分,也就是,函數只保留他們的終點部分。(常用)return:contours輪廓本身return:hierarchy每條輪廓對應的屬性cv2.drawContours(img, contours, -1, (0, 0, 255), 2)繪制邊緣的方法。img:原圖,即在原圖上進行邊緣繪制;contours:存儲邊緣數據的變量;-1:繪制出全部邊緣,-1改成1/2/3時表示繪制第1/2/3邊緣;(0, 0, 255):繪制邊緣的BGR顏色(當前是純紅色);2:繪制邊緣的線條粗細。cv2.contourArea(cnt)計算輪廓圍成的面積。cnt:變量contours中的一個,contours本身是一個列表。cv2.arcLength(cnt,True)計算輪廓的周長。cnt:變量contours中的一個,contours本身是一個列表。True:表示是閉合輪廓;False表示張開輪廓。approx = cv2.approxPolyDP(cnt,epsilon,True)處理輪廓近似。目的:有時候不需要太精確的輪廓。cnt:變量contours中的一個,contours本身是一個列表。epsilon:參數,設置成輪廓周長的參數倍,參數要自己調參。第三個參數未說明默認為True。return:approx返回的也是一個輪廓,也需要用drawContours方法進行繪制。x,y,w,h = cv2.boundingRect(cnt)繪制包圍輪廓的矩形。cnt:變量contours中的一個,contours本身是一個列表。return:x,y繪制矩形的坐標起始點 (x,y) 。return:w,h繪制矩形的寬(w: width)和高(h: height)。(x,y),radius = cv2.minEnclosingCircle(cnt)繪制包圍輪廓的圓形。cnt:變量contours中的一個,contours本身是一個列表。return:(x,y)繪制圓形的坐標起始點 (x,y) 。return:radius繪制圓形的半徑。模板匹配方法含義res = cv2.matchTemplate(img, template, type)模板匹配方法。img:原圖片;template:模板圖片;type:進行模板匹配的方法。type = cv2.TM_SQDIFF計算平方不同,計算出來的值越,越相關type = cv2.TM_CCORR計算相關性,計算出來的值越,越相關type = cv2.TM_CCOEFF計算相關系數,計算出來的值越,越相關type = cv2.TM_SQDIFF_NORMED計算歸一化平方不同,計算出來的值越接近0,越相關(准一些)type = TM_CCORR_NORMED計算歸一化相關性,計算出來的值越接近1,越相關(准一些)type = TM_CCOEFF_NORMED計算歸一化相關系數,計算出來的值越接近1,越相關(准一些)return:res假如原圖形是 A × B A \times B A×B 大小,而模板是 a × b a \times b a×b 大小,則輸出結果的矩陣是 ( A − a + 1 ) × ( B − b + 1 ) (A-a+1) \times (B-b+1) (A−a+1)×(B−b+1) 。min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)尋找最匹配/不匹配模板的方法。res:用matchTemplate生成的二維匹配值數組。return:min_val,max_val匹配程度的最小值和最大值。return:min_loc, max_loc當匹配程度達到最小值和最大值時候對應的位置。

圖像金字塔、直方圖

項目內容為什麼要進行金字塔生成?圖片放大/縮小後提取的特征可能不一樣down=cv2.pyrDown(img)高斯金字塔:向下采樣法。先將圖像與高斯內核進行卷積,然後減少偶數行和偶數列up=cv2.pyrUp(img)高斯金字塔:向上采樣法。先將圖像的每個方向擴大為原來的兩倍,新增的行和列以0填充;使用先前同樣的內核(乘以4)對擴充後的圖像進行卷積。down=cv2.pyrDown(img) // down_up=img - cv2.pyrUp(down)拉普拉斯金字塔:先對圖像做向下采樣,再對圖像做向上采樣,最後用原圖減去這個生成的圖,即可得到這次拉普拉斯金字塔的一層。為什麼要進行直方圖生成?查看圖片中0~255每個像素值的分布,有利於後面的均衡res = cv2.calcHist(images,channels,mask,histSize,ranges)用於生成直方圖的方法。images:原圖像圖像格式為uint8或float32。當傳入函數時應用中括號。channels:同樣用中括號括來它會告訴我們圖像的直方圖通道。如果入圖像是灰度圖它的值就是0+中括號;如果是彩色圖像,傳入的參數可以是0/1/2+中括號,它們分別對應著B/G/R。mask:掩模圖像。統計整幅圖像的直方圖就把它為None。但是想統計圖像某一部分的直方圖,就制作一個掩模圖像並使用它。histSize:BIN的數目,也應用中括號。ranges: 像素值范圍常為[0~256]。return:res每一個bin對應的統計結果。plt.hist(img.ravel(),256);調用生成直方圖的方法。注意要使用img的ravel()方法。mask = np.zeros(img.shape[:2], np.uint8) mask[100:300, 100:400] = 255生成mask的方法。采用與img同樣的shape,每個像素點的數據類型是無符號8位,其取值范圍正好是0~255。對mask的部分區域進行賦值,賦值255。使用時,將calcHist的None直接換成mask變量即可。masked_img = cv2.bitwise_and(img, img, mask=mask)操作。將img圖像與mask掩膜圖像按像素與操作。equ = cv2.equalizeHist(img)對圖像進行均衡化操作。return:equ返回的是均衡後的圖片。clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(8,8))創建一個自適應均衡化實例。clipLimit:默認參數;tileGridSize:自適應均衡化的“小掩膜”,也可以說是窗口。res_clahe = clahe.apply(img)自適應均衡化實例作用在圖片上的方法。return:res_clahe返回的是自適應均衡化後的圖片結果。

傅裡葉變換和低通/高通濾波

方法含義傅裡葉變換的作用?可以檢測出高頻信息和低頻信息。高頻:變化劇烈的灰度分量;低頻:變化緩慢的灰度分量。傅裡葉變換的意義?在原圖像上檢測高頻/低頻信息很困難,轉換成頻域就很簡單。低通濾波器只保留低頻,會使得圖像模糊高通濾波器只保留高頻,會使得圖像細節增強img_float32 = np.float32(img)在進行頻域變換前需要將數據類型轉換成float32類型dft = cv2.dft(img_float32, flags = cv2.DFT_COMPLEX_OUTPUT)對圖像進行傅裡葉變換的方法。img_float32是輸入的圖片;flags=cv2.DFT_COMPLEX_OUTPUT指的是傅裡葉變換輸出復數,這是默認值。return:dft返回值是一個頻譜。低頻信息在主要分布在右上角。dft_shift = np.fft.fftshift(dft)將低頻信息從右上角搬移到圖像中心。magnitude_spectrum = 20*np.log(cv2.magnitude(dft_shift[:,:,0],dft_shift[:,:,1]))將頻譜轉換成可見圖片的形式。固定格式。rows, cols = img.shape \ crow, ccol = int(rows/2) , int(cols/2) \ mask = np.zeros((rows, cols, 2), np.uint8) \ mask[crow-30:crow+30, ccol-30:ccol+30] = 1低通濾波器的制作過程。在圖片中實際上是制作一個掩膜。fshift = dft_shift*mask頻譜與掩膜的合並只需要做乘法即可。f_ishift = np.fft.ifftshift(fshift)將頻譜圖像從中心處轉移到左上角處。img_back = cv2.idft(f_ishift)傅裡葉反變換,將頻譜信息轉移成圖片信息。img_back = cv2.magnitude(img_back[:,:,0],img_back[:,:,1])最後將圖片合成可見圖片的形式。
  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved