您现在的位置：程式師世界 >> 編程語言 > >> 更多編程語言 >> Python

用Python實現簡單的驗證碼處理

編輯：Python

文章目錄

序言
環境模塊
代碼展示
實現效果
完整代碼

序言

我們在做采集數據的時候，過快或者訪問頻繁，或者一訪問就給彈出驗證碼，然後就蚌珠了~

今天就給大家來一個簡單處理驗證碼的方法

環境模塊

Python和pycharm如果還有小伙伴沒安裝的話，可以在文章最下方掃碼獲取安裝包。

這裡需要用到一個 ddddocr 模塊，這是別人開源寫好的一個東西，簡單又好用，但是精確度差一點點，但是還是非常好用的。

如果你追求精確度的話，可以調用別人寫好的一些API 。

咱們直接 win+r 彈出搜索框後輸入 cmd ，點擊確定彈出命令提示符窗口，輸入pip install ddddocr 即可安裝。

不會的話詳細參考我置頂文章有詳細講解。

代碼展示

代碼不多，非常簡單。

模塊安裝好之後咱們先導入一下

import ddddocr

然後實例化一下，用一個 cor 接收一下這個數據。

ocr = ddddocr.DdddOcr()

我這裡准備了四個驗證碼

這該死的博客水印，擋住了，但是我是不會關掉滴，嘿嘿~

回到正題，分別實現一下驗證碼。

首先我們用 with open 來讀取一下這文件，讀取方式使用 rb ，因為是圖片的話就讀取它的二進制數據

with open('img_3.png', 'rb') as f:

使用 f.read() 將數據讀取出來，再自定義一個變量接收一下。

img_bytes = f.read()

然後我們通過 classification 將它傳進去，把結果打印出來就可以了。

result = ocr.classification(img_bytes)
print(result)

實現效果

純數字的

字母+數字的

可以看到都完整的識別出來了，即使上面有一些花裡胡哨的橫線啥的。

完整代碼

import ddddocr
ocr = ddddocr.DdddOcr()
with open('img_3.png', 'rb') as f:
img_bytes = f.read()
result = ocr.classification(img_bytes)
print(result)

大家可以自己去試試，也可以直接應用在采集數據實踐當中~

創作不易，大家幫忙點個收藏吧~

上一篇文章： Python小技巧：兩行代碼實現批量給圖片填加水印，這也太簡單了~
下一篇文章：現代編程語言：Python(蛇形遍歷一顆樹)

Python

Python makes new shares. I suggest you do this!

I dont know if you have 「

Sequence traversal of ＜ leetcode ladder ＞ day033 binary tree (breadth first search) | primary algorithm | Python

Make a little progress every d

python之二分查找

二分查找1. 順序查找2. 二分查找1. 順序查找順序查找就

戲說python * 與 **

python與c++不同，並沒有指針1.是一個乘法運算符號a

Using Python to make rotating lanterns, I wish you a happy Lantern Festival

1、 raw material 1.1 Lantern pa

基於Python字典（列表）Lambda函數的排序問題

相信很多學Python的小伙伴都

没有相关文章

熱門圖文

C#基礎系列：實現自己的ORM（MiniORM的測試代碼） ECMall的MySQL數據調用的簡單方法 Java提高篇——Java 異常處理，java提高異常處理局域網多人對戰飛行棋的實現有趣的分形圖形-遞歸和數學方法解決-POJ 2083 ios-在指定位置上一層創建View Python automatic refresh 12306 ticket grabbing 12個最重要的J2EE最佳實踐

欄目導航