前言
1.加載圖片
2.對圖片做灰度處理
3.對圖片做二值化處理
3.1.自定義阈值
4.提取輪廓
5.對輪廓畫矩形框
6.分割圖片並保存
7.查看分割圖片
8.完整代碼
前言所需要安裝的庫有:
pip install opencv-python
pip install matplotlib
Python接口幫助文檔網址:https://docs.opencv.org/4.5.2/d6/d00/tutorial_py_root.html
本文所用到的圖片素材:
首先,導入所用到的庫:
import cv2import os,shutilfrom matplotlib import pyplot as plt
1.加載圖片注意:這裡在傳入圖像路徑時,路徑中不能包含有中文名,否則會報錯!!!
###1,加載圖片filepath = './testImage.png' ###圖像路徑,注意:這裡的路徑不能包含有中文名img = cv2.imread(filepath)cv2.imshow('Orignal img', img) ###顯示圖片cv2.waitKey(0) ###防止一閃而過,是一個鍵盤綁定函數(0表示按下任意鍵終止)
2.對圖片做灰度處理###2,將彩色圖片變為灰色(進行灰度處理)img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)cv2.imshow('img_gray', img_gray)cv2.waitKey(0)
3.對圖片做二值化處理thresh=220是自定義設定的阈值(通過分析print(img_gray)的圖像數據大概得到的),像素值大於220被置成了0,小於220的被置成了255。
maxval=與 THRESH_BINARY 和 THRESH_BINARY_INV 阈值一起使用的最大值,可理解是填充色,范圍為(0~255)。
type:參數類型阈值類型( cv2.THRESH_BINARY 大於阈值的部分被置為255,小於部分被置為0(黑白二值) cv2.THRESH_BINARY_INV 大於阈值部分被置為0,小於部分被置為255(黑白二值反轉——白黑) 等其它的類型...... )
###3,將圖片做二值化處理 ''' thresh=220是自定義設定的阈值(通過分析print(img_gray)的圖像數據大概得到的),像素值大於220被置成了0,小於220的被置成了255 maxval=與 THRESH_BINARY 和 THRESH_BINARY_INV 阈值一起使用的最大值,可理解是填充色,范圍為(0~255)。 type:參數類型阈值類型( cv2.THRESH_BINARY 大於阈值的部分被置為255,小於部分被置為0(黑白二值) cv2.THRESH_BINARY_INV 大於阈值部分被置為0,小於部分被置為255(黑白二值反轉——白黑) 等其它的類型...... ) '''ret, img_inv = cv2.threshold(src=img_gray, thresh=220, maxval=255, type=cv2.THRESH_BINARY_INV)cv2.imshow('img_inv', img_inv)cv2.waitKey(0)
3.1.自定義阈值###阈值對比(全局阈值(v = 127),自適應平均阈值,自適應高斯阈值)def threshContrast(): filepath = './testImage.png' img = cv2.imread(filepath) img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) img_gray = cv2.medianBlur(img_gray, 5) ret1, th1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY) th2 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2) th3 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2) title = ['原始圖像(灰度)','全局阈值(v = 127)','自適應平均阈值','自適應高斯阈值'] images = [img_gray, th1, th2, th3] for i in range(4): plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray') # plt.title(title[i]) ###plt繪圖時不能使用中文 plt.xticks([]), plt.yticks([]) plt.show()
4.提取輪廓img_inv是尋找輪廓的圖像;
cv2.RETR_EXTERNAL:表示只檢索極端外部輪廓;
cv2.CHAIN_APPROX_SIMPLE:壓縮水平, 垂直和對角線方向的元素,只保留它們的端點坐標,例如,一個直立的矩形輪廓用 4 個點進行編碼。
###4,提取輪廓 ''' https://docs.opencv.org/4.5.2/d4/d73/tutorial_py_contours_begin.html img_inv是尋找輪廓的圖像; cv2.RETR_EXTERNAL:表示只檢索極端外部輪廓; cv2.CHAIN_APPROX_SIMPLE:壓縮水平, 垂直和對角線方向的元素,只保留它們的端點坐標,例如,一個直立的矩形輪廓用 4 個點進行編碼。 ''' contours,hierarchy = cv2.findContours(img_inv, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) print(f'檢測出輪廓數量有:{len(contours)}個') print('返回值為各層輪廓的索引:\n', hierarchy)
5.對輪廓畫矩形框###5,找出每一個輪廓繪畫出的矩形位置br = []cntid = 0for cnt in contours: '''cnt表示輸入的輪廓值,x,y, w, h 分別表示外接矩形的x軸和y軸的坐標,以及矩形的w寬和h高,''' x, y, w, h = cv2.boundingRect(cnt) cntid += 1 print(f'檢測出第{cntid}個輪廓畫出的矩形位置為:x={x},y={y},w={w},h={h}') br.append(cv2.boundingRect(cnt)) '''img表示輸入的需要畫的圖片(這裡就是在原圖上繪制輪廓),cnt表示輸入的輪廓值,-1表示contours中輪廓的索引(這裡繪制所有的輪廓),(0, 0, 255)表示rgb顏色——紅色,2表示線條粗細''' cv2.drawContours(img, [cnt], -1, (0, 0, 255), 2) cv2.imshow('cnt', img) cv2.waitKey(0)br.sort() ###將列表中的每一個元組裡面的進行升序排序(這裡其實想的是按照對應的x軸坐標進行升序)
對每個字符畫輪廓的過程(順序從右到左畫,期間也有可能斷續,如下圖)。
6.分割圖片並保存###6,分割圖片並保存(這裡對前面處理過的二值化圖片數據(img_inv)進行分割)if not os.path.exists('./imageSplit'): os.mkdir('./imageSplit')else: shutil.rmtree('./imageSplit') os.mkdir('./imageSplit')for x,y,w,h in br: # print(x,y,w,h) # split_image = img_inv[y:y + h, x:x + w] split_image = img_inv[y - 2:y + h + 2, x - 2:x + w + 2] ###這樣分割感覺好看些 cv2.imshow('split_image', split_image) cv2.waitKey(0) save_filepath = './imageSplit/' filename = f'{x}.jpg' ###這裡由每張圖片對應的x軸坐標命名 cv2.imwrite(save_filepath + filename, split_image) print(f'\033[31m{filename}圖片分割完畢!\033[0m')
這裡是對前面處理過的二值化圖片數據(img_inv)進行一個一個字符分割展示的過程。
這裡是這行代碼的意思,下面的圖是手動繪制的,太丑了,哈哈哈!!!
# split_image = img_inv[y:y + h, x:x + w]
7.查看分割圖片最後,我們在pyplot上來查看我們分割圖片後的效果,也就終於完成了。
###7,用pyplot來查看我們分割完成後的圖片imagefile_list = os.listdir('./imageSplit')imagefile_list.sort(key=lambda x: int(x[:-4]))for i in range(len(imagefile_list)): img = cv2.imread(f'./imageSplit/{imagefile_list[i]}') plt.subplot(1, len(imagefile_list), i + 1), plt.imshow(img, 'gray') plt.title(imagefile_list[i]) plt.xticks([]), plt.yticks([])plt.show()
8.完整代碼import cv2import os,shutilfrom matplotlib import pyplot as plt''' 這是使用文檔網址:https://docs.opencv.org/4.5.2/index.html 這是提供的Python接口教程網址:https://docs.opencv.org/4.5.2/d6/d00/tutorial_py_root.html'''def imageSplit(): ###1,加載圖片 filepath = './testImage.png' ###圖像路徑,注意:這裡的路徑不能包含有中文名 img = cv2.imread(filepath) cv2.imshow('Orignal img', img) ###顯示圖片 cv2.waitKey(0) ###防止一閃而過,是一個鍵盤綁定函數(0表示按下任意鍵終止) ###2,將彩色圖片變為灰色(進行灰度處理) img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) cv2.imshow('img_gray', img_gray) cv2.waitKey(0) ###3,將圖片做二值化處理 ''' thresh=220是自定義設定的阈值(通過分析print(img_gray)的圖像數據大概得到的),像素值大於220被置成了0,小於220的被置成了255 maxval=與 THRESH_BINARY 和 THRESH_BINARY_INV 阈值一起使用的最大值,可理解是填充色,范圍為(0~255)。 type:參數類型阈值類型( cv2.THRESH_BINARY 大於阈值的部分被置為255,小於部分被置為0(黑白二值) cv2.THRESH_BINARY_INV 大於阈值部分被置為0,小於部分被置為255(黑白二值反轉——白黑) 等其它的類型...... ) ''' ret, img_inv = cv2.threshold(src=img_gray, thresh=220, maxval=255, type=cv2.THRESH_BINARY_INV) cv2.imshow('img_inv', img_inv) cv2.waitKey(0) ###4,提取輪廓 ''' https://docs.opencv.org/4.5.2/d4/d73/tutorial_py_contours_begin.html img_inv是尋找輪廓的圖像; cv2.RETR_EXTERNAL:表示只檢索極端外部輪廓; cv2.CHAIN_APPROX_SIMPLE:壓縮水平, 垂直和對角線方向的元素,只保留它們的端點坐標,例如,一個直立的矩形輪廓用 4 個點進行編碼。 ''' contours,hierarchy = cv2.findContours(img_inv, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) print(f'檢測出輪廓數量有:{len(contours)}個') print('返回值為各層輪廓的索引:\n', hierarchy) ###5,找出每一個輪廓繪畫出的矩形位置 br = [] cntid = 0 for cnt in contours: '''cnt表示輸入的輪廓值,x,y, w, h 分別表示外接矩形的x軸和y軸的坐標,以及矩形的w寬和h高,''' x, y, w, h = cv2.boundingRect(cnt) cntid += 1 print(f'檢測出第{cntid}個輪廓畫出的矩形位置為:x={x},y={y},w={w},h={h}') br.append(cv2.boundingRect(cnt)) '''img表示輸入的需要畫的圖片(這裡就是在原圖上繪制輪廓),cnt表示輸入的輪廓值,-1表示contours中輪廓的索引(這裡繪制所有的輪廓),(0, 0, 255)表示rgb顏色——紅色,2表示線條粗細''' cv2.drawContours(img, [cnt], -1, (0, 0, 255), 2) cv2.imshow('cnt', img) cv2.waitKey(0) br.sort() ###將列表中的每一個元組裡面的進行升序排序(這裡其實想的是按照對應的x軸坐標進行升序) ###6,分割圖片並保存(這裡對前面處理過的二值化圖片數據(img_inv)進行分割) if not os.path.exists('./imageSplit'): os.mkdir('./imageSplit') else: shutil.rmtree('./imageSplit') os.mkdir('./imageSplit') for x,y,w,h in br: # print(x,y,w,h) # split_image = img_inv[y:y + h, x:x + w] split_image = img_inv[y - 2:y + h + 2, x - 2:x + w + 2] ###這樣分割感覺好看些 cv2.imshow('split_image', split_image) cv2.waitKey(0) save_filepath = './imageSplit/' filename = f'{x}.jpg' ###這裡由每張圖片對應的x軸坐標命名 cv2.imwrite(save_filepath + filename, split_image) print(f'\033[31m{filename}圖片分割完畢!\033[0m') cv2.destroyAllWindows() ###刪除所有窗口 ###7,用pyplot來查看我們分割完成後的圖片 imagefile_list = os.listdir('./imageSplit') imagefile_list.sort(key=lambda x: int(x[:-4])) for i in range(len(imagefile_list)): img = cv2.imread(f'./imageSplit/{imagefile_list[i]}') plt.subplot(1, len(imagefile_list), i + 1), plt.imshow(img, 'gray') plt.title(imagefile_list[i]) plt.xticks([]), plt.yticks([]) plt.show() print('\nperfect!!!')###阈值對比(全局阈值(v = 127),自適應平均阈值,自適應高斯阈值)def threshContrast(): filepath = './testImage.png' img = cv2.imread(filepath) img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) img_gray = cv2.medianBlur(img_gray, 5) ret1, th1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY) th2 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2) th3 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2) title = ['原始圖像(灰度)','全局阈值(v = 127)','自適應平均阈值','自適應高斯阈值'] images = [img_gray, th1, th2, th3] for i in range(4): plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray') # plt.title(title[i]) ###plt繪圖時不能使用中文 plt.xticks([]), plt.yticks([]) plt.show()if __name__ == '__main__': imageSplit() ###阈值對比 # threshContrast()
到此這篇關於Python 第三方opencv庫實現圖像分割處理的文章就介紹到這了,更多相關python圖片處理內容請搜索軟件開發網以前的文章或繼續浏覽下面的相關文章希望大家以後多多支持軟件開發網!