您现在的位置：程式師世界 >> 編程語言 > >> 更多編程語言 >> Python

python簡單處理驗證碼，三分鐘，不能再多了

編輯：Python

序言

大家好鴨，又是我小熊貓啦

我們在做采集數據的時候，過快或者訪問頻繁，或者一訪問就給彈出驗證碼，然後就蚌珠了~

今天就給大家來一個簡單處理驗證碼的方法

環境模塊

Python和pycharm如果還有小伙伴沒安裝的話，可以在文章最下方掃碼獲取安裝包。

這裡需要用到一個 ddddocr 模塊，這是別人開源寫好的一個東西，簡單又好用，但是精確度差一點點，但是還是非常好用的。

如果你追求精確度的話，可以調用別人寫好的一些API 。

咱們直接 win+r 彈出搜索框後輸入 cmd ，點擊確定彈出命令提示符窗口，輸入pip install ddddocr 即可安裝。

不會的話詳細參考我置頂文章有詳細講解。

代碼展示 https://jq.qq.com/?_wv=1027&k=3uTc6UFb

代碼不多，非常簡單。

模塊安裝好之後咱們先導入一下

import ddddocr

然後實例化一下，用一個 cor 接收一下這個數據。

ocr = ddddocr.DdddOcr()

我這裡准備了四個驗證碼

博客水印好像擋住了，但是我是不會關掉滴，嘿嘿~

回到正題，分別實現一下驗證碼。

首先我們用 with open 來讀取一下這文件，讀取方式使用 rb ，因為是圖片的話就讀取它的二進制數據

with open('img_3.png', 'rb') as f:

使用 f.read() 將數據讀取出來，再自定義一個變量接收一下。

img_bytes = f.read()

然後我們通過 classification 將它傳進去，把結果打印出來就可以了。

result = ocr.classification(img_bytes)
print(result)

實現效果 (https://jq.qq.com/?_wv=1027&k=3uTc6UFb)

純數字的

字母+數字的

可以看到都完整的識別出來了，即使上面有一些花裡胡哨的橫線啥的。

完整代碼 (https://jq.qq.com/?_wv=1027&k=3uTc6UFb)

import ddddocr
ocr = ddddocr.DdddOcr()
with open('img_3.png', 'rb') as f:
img_bytes = f.read()
result = ocr.classification(img_bytes)
print(result)
(https://jq.qq.com/?_wv=1027&k=3uTc6UFb)

大家可以自己去試試，也可以直接應用在采集數據實踐當中~

創作不易，大家幫忙點個收藏吧~

我是小熊貓，咱下篇文章見(*◡‿◡)

上一篇文章：機器學習筆記 - LUX：用於自動探索性數據分析的 Python API
下一篇文章： Python實現簡繁體轉換，真的玩得花

Python

Python大作業——爬蟲+可視化+數據分析+數據庫（數據分析篇）

個人博客Python大作業——爬蟲+可視化+數據分析+數據庫

一個專科生的 Python 轉行之路，雖然很艱險，但是改變了人生

最近有一位小伙伴，在微信上告訴我，他找到通過自學 Pytho

關於 Python 中的數字你可能不知道的 3 件事

如果您使用 Python 進行過任何編碼，那麼您很有可能在某

Python variables

be based on python：3.7.

Python is invincible in the world, a little hacking technology, it can be captured in a few minutes, super awesome

很多人會有這樣的誤解.Its like the functi

有過一定的編程基礎，如何快速入門Python?

c++和processing看了一半，其他都自學看完了，今年

没有相关文章

熱門圖文

Java的輸入輸出與文件讀寫（二） poj3311(Hie with the Pie)狀壓dp PHP Warning: Module modulename already loaded in問題解決辦法 EJB數據驗證出現在什麼地方最合適高並發、海量數據處理盡量少使用using也能提升效率，海量using sql-小白提問：SQL 上如何取當前時間的前7天的數據？這樣寫應該沒錯！ c++完成簡略的線程池 c# winform 懸浮窗-C#winform 的問題，具體如圖

欄目導航