朱天賦
0獲贊0關(guān)注0粉絲
Python--文字識別--Tesseract
1.介紹
Tesseract 是一個(gè) OCR 庫,目前由 Google 贊助(Google 也是一家以 OCR 和機(jī)器學(xué)習(xí)技術(shù)聞名于世的公司)。Tesseract 是目前公認(rèn)最優(yōu)秀、最精確的開源 OCR 系統(tǒng)。 除了極高的精確度,Tesseract 也具有很高的靈活性。它可以通過訓(xùn)練識別出任何字體,也可以識別出任何 Unicode 字符。
2.安裝
以下所有都是在mac上安裝實(shí)現(xiàn)的
//安裝tesseract的同時(shí)安裝訓(xùn)練工具
brew install --with-training-tools tesseract
//安裝tesseract的同時(shí)安裝所有語言,語言包比較大,如果安裝的話時(shí)間較長,建議不安裝,按需選擇
b
朱天賦
0
