本文承接 識別地圖上的地名-- 筆記一 一文。非常抱歉地過了這麼久了才打算把這個事情給完結了 。其實很早就做完的。但是事情比較多。一直都沒有寫出來。
二值化圖像
關於文字分割:
如上圖所示我們已經得到一個二值化的圖像了。
可以發現文字都是黑色的。並且文字都是在一個11*11的方格裡面的。也就是說一個單獨的文字最大長 度和寬度都是11,例如“田” 字 。這裡面的文字都比較正規。而且是統一大小的。
遍歷整個圖像,當出現第一個黑點的時候記錄該黑點的坐標為(X1,Y1),尋找這個黑點左下方10*11的 范圍內的文字左邊界,記錄左邊界的X坐標為 X2,尋找黑點右下方10*11的范圍內的文字右邊界,記錄右邊 界的X坐標為X3.然後以Y1為上限,X2至X3之間為范圍。向下尋找11個像素范圍內,文字的下邊界得到 Y坐 標Y2.
由上即可以得到一個文字的范圍坐標 (X2,Y1)和(X3,Y2)
下面是一些分割出來的樣本
得到這些樣本之後,我們就需要人工來為這些樣本標記其對應的文字。
以標准的樣本和文字作為一個 key-value的字典庫。