OCR 中文識別用哪種軟件識別率比較高?
共 4796字,需瀏覽 10分鐘
·
2022-02-09 17:37
給大家介紹兩個非常好用的OCR工具,一個是電腦端的,一個是手機端的,此文較長,但值得你花點時間。
https://xg.zhihu.com/plugin/58a4943b07d6c3967ce687c45136f42e?BIZ=ECOMMERCE1。電腦端:天若 ocr
圖片轉(zhuǎn)文字(OCR)是大家經(jīng)常用到的一個功能,大多數(shù)時候我們都是在電腦上編輯文檔,經(jīng)常會碰到一些網(wǎng)頁文字無法復(fù)制,比如百度文庫的一些文檔,會彈出這樣的提示——
或者圖片中文字需要識別用來復(fù)制編輯,比如。。。太多場景了——
所以這時候就需要一款 PC 端專用的 OCR 文字識別工具了。
在 OCR 領(lǐng)域內(nèi),有一個高山仰止般的存在是繞不過的,那就是 ABBYY 公司,向來是以識別率高領(lǐng)先業(yè)內(nèi),不過這種面向辦公用戶的商業(yè)軟件正版費用不菲,不是一般用戶可以承受的。
abbyy 中國官網(wǎng)截圖
并且還有一個問題,就是太重,對于很多功能可能一般用戶根本用不到,大多數(shù)情況我們的需求其實很簡單:只需要快速識別網(wǎng)頁文字或者圖片文字就好,不需要打開過重的專業(yè)軟件,輕巧準(zhǔn)確即可。
那么,這款適用于 Windows 平臺的天若 OCR 文字識別工具一定更適合你,嗯,就是天若有情天亦老的「天若」。
軟件作者來自吾愛破解的天若幽心,發(fā)布半年以來,深受好評,并且更新很快,而且最近又加入了批量識別功能,黑哥使用起來,最大的感受就是:輕、強、準(zhǔn)。
輕
軟件無需安裝,打開后就會安靜地在后臺待著,需要使用時按默認(rèn)的 F4 鍵呼出截圖框,就可以框選你需要識別的內(nèi)容,截圖之后松開左鍵即可識別文字。
識別圖中這么一段文字也就用了 0.776 秒。
獲取到文字后直接關(guān)閉就又會回到狀態(tài)欄等待下次召喚,事了拂衣去,活好不粘人。
當(dāng)然,天若 OCR 工具的截圖快捷鍵是還可以自定義修改,小伙伴們也可以在托盤圖標(biāo)中右鍵設(shè)置里根據(jù)使用習(xí)慣自行修改。
強
除了可以識別無法復(fù)制的網(wǎng)頁文字,天若識別圖片文字同樣不在話下,找本書拍一頁測試給大家看——
對于一些變形的藝術(shù)體甚至是手寫體都有不錯的識別效果——
還可以識別豎排文字——


圖源軟件作者介紹頁
不僅可以識別文字,還自帶翻譯功能,支持中英文快速識別并且在線翻譯——
可以說,這些功能足以滿足平時在網(wǎng)頁或圖片中復(fù)制文字的需求了。
準(zhǔn)
天若 OCR 之所以識別又準(zhǔn)又快,是因為它是在線云端識別,即在截圖后通過網(wǎng)絡(luò)調(diào)用百度、騰訊、搜狗、有道等幾大平臺提供的文字識別接口來完成的,所以天若 OCR 的識別成功率和正確率都很高,當(dāng)然必須在聯(lián)網(wǎng)環(huán)境下才能使用。
如果一家接口識別效果偶爾不理想或者識別不出來,還可以更換其他選擇。
軟件作者也對幾大平臺的 OCR 文字識別 API 接口的特點做了一些實際測試,以及簡短的介紹說明。這些僅供參考,大家在使用時要根據(jù)實際情況選擇。
1. 搜狗 OCR 接口:這個接口識別效果很好,速度、準(zhǔn)確率都沒的說!也是作者重點推薦的,但其對干圖片的尺寸有規(guī)定,所以作者已對軟件截圖進行了尺寸優(yōu)化,保證較小的文字也能識別。
2. 百度 OCR 接口:其識別的精確度還可以,但是標(biāo)點符號識別不太準(zhǔn)確,速度一般。
3. 騰訊 OCR 接口:也是比較準(zhǔn)確的,但速度比較慢。
4. 有道 OCR 接口:速度很快,平均 0.3-0.4 秒就可識別出來,但是接口有 IP 請求的限制。
2。手機端 :白描
手機上這么多的 OCR 工具,到底哪款軟件最好用呢?網(wǎng)上有不少文章介紹了很多各種各樣的 OCR 工具,多是從功能方面介紹,很少有針對識別率進行對比的,到底哪個識別率最高呢?
黑哥今天就嘗試著做個小實驗,對比一下到底哪款軟件最給力!
特別說明:為充分對比軟件識別效果,本文圖多,如果不想看細(xì)節(jié)對比(都是我的心血啊,好意思嗎?)可以直接拉到最后看結(jié)果。
一、評測準(zhǔn)備
本次選中的是 Textgrabber、掃描全能王以及白描這三款。

1、主角背景:
A.textgrabber 如果你在電腦上用過 ABBYY FineReader Professional,那么你就不會對這款軟件感到陌生,都是由 OCR 界的扛把子 ABBYY 開發(fā)的,在文檔識別,數(shù)據(jù)捕獲和語言技術(shù)的開發(fā)中居世界領(lǐng)先地位。
B. 掃描全能王 一款國產(chǎn)軟件,其公司在 OCR、人工智能、手寫識別、圖像處理及自動圖像增強等領(lǐng)域達到世界領(lǐng)先水平。核心產(chǎn)品名片全能王全球下載用戶超過 3 億人,掃描全能王全球下載用戶 3.4 億。
C. 白描 這個軟件名氣不大,出自國人獨立開發(fā)者之手,開發(fā)者陶新樂,一名 iOS 軟件工程師。
為什么會拿一款獨立軟件去跟大廠去懟呢,別著急,往下看你就明白了。
大家知道,作為 OCR 軟件,我們最關(guān)心的就是識別率,因此,本次主要從這個方面進行評測對比。
另外,考慮到大家最常用的使用環(huán)境是中文、英文文檔識別,將對中文、英文、中英文混排三種應(yīng)用場景分別進行對比。
2、參評軟件版本號:
Textgrabber:iOS 平臺 6.5.0.1
掃描全能王:Android 平臺 5.4.0
白描:Android 平臺 1.0.4
別問我為啥平臺不統(tǒng)一,textgrabber 是 App Store 限免的時候入的,為了省錢唄。。。
目前三款軟件均支持 iOS 和 Android。
3、校對軟件:Word 2016
簡單介紹一下校對過程,在 Word 2016 里面打開審閱標(biāo)簽,選中對比,即可對原文本與目標(biāo)文本進行對比。中間為校對區(qū),右上為軟件識別文本,右下為原稿。
實際過程中發(fā)現(xiàn)對比也會有判斷錯誤的地方,如果大家有更好的文本對比軟件,可以介紹給我。

4、原文件 為了盡量減少拍照這一環(huán)節(jié)對識別結(jié)果的影響,在識別對比時,采用的是同一張照片導(dǎo)入三個軟件進行分別識別,字號均為五號字。

二、中文文檔識別
本文檔來自《三體》,共 1155 個字符。
Textgrabber

經(jīng)與原文對比,共檢查出 113 處修訂。

錯誤表現(xiàn):
1、首行縮進均未能正確識別。
2、標(biāo)點符號識別錯誤,中文雙引號 “識別為英文引號"。
3、部分字符識別錯誤,汪淼識別為汪森。
4、文本識別丟失。

5、右側(cè)邊緣文本會莫名其妙插入空格。

掃描全能王

經(jīng)與原文對比,共檢查出 103 處修訂。

錯誤表現(xiàn):
1、首行縮進均未能正確識別。
2、標(biāo)點符號識別錯誤,中文雙引號識別為英文引號,省略號…… 識別為 ······

3、在原文換行處錯誤識別為斷行,沒有糾正為自動連接。

4、字符識別錯誤比例低于 abbyy,更多來自于格式以及換行錯誤。
白描


共檢查出 71 處修訂。

錯誤表現(xiàn):
1、首行縮進均未能正確識別。(目前所有 OCR 軟件的通病,后邊不再一一列出。)
2、大部分錯誤來自標(biāo)點符號識別錯誤,特別是段首的標(biāo)點部分丟失,段尾的標(biāo)點符號幾乎全部丟失,但識別到的中文雙引號基本正確,不存在錯誤識別為英文引號。
3、亮點在于文字的識別率幾乎是 100%,僅就本測試文檔來說,文字全部識別正確。

小結(jié):白描的文字識別率出乎意料地高,而且對原文版式的還原最準(zhǔn)確,很少出現(xiàn)錯誤斷行的情況。缺點在于對標(biāo)點符號的識別上,段首標(biāo)點部分識別,段末全部陣亡,經(jīng)與作者反饋,證實確實存在這種情況,將在后續(xù)版本進行優(yōu)化。
中文識別率排名:白描>textgrabber>掃描全能王
三、英文文檔
出處忘了,好像是來自一篇小說吧,共 498 字。
Textgrabber

共檢查出 27 處修訂。

錯誤表現(xiàn):
1、單詞識別率很高,個別單詞存在識別錯誤。
2、部分單詞識別丟失。
3、個別標(biāo)點符號識別錯誤。整體來說識別率很高。

掃描全能王

共檢查出 107 處修訂。

錯誤表現(xiàn):
1、部分單詞識別錯誤,準(zhǔn)確率要低于 abbyy,但優(yōu)于白描。
2、一個奇怪的發(fā)現(xiàn)是 word 文檔對比時將掃描全能王的部分識別結(jié)果全部判定為錯誤,而實際上當(dāng)我把眼看瞎了也沒發(fā)現(xiàn)錯在何處,所以實際的正確率是要高于對比結(jié)果的,難道 word 跟這貨有仇嗎?

4、掃描全能王一貫的老毛病依然存在,在換行處未能正確識別,出現(xiàn)多處斷行。
5、部分大小寫識別錯誤。
白描

共檢查出 141 處修訂。

錯誤表現(xiàn):
1、單詞識別正確率較高,但由于多處大小寫未能正確識別,拉低了識別率。

2、單詞之間的空格出現(xiàn)大面積識別丟失。
3、習(xí)慣性未能識別出每段段尾的標(biāo)點符號,及部分段首的標(biāo)點符號。
4、個別情況出現(xiàn)斷行錯誤。
小結(jié):在這個環(huán)節(jié),國際大廠出品的 textgrabber 不負(fù)眾望,對英文的識別率及其優(yōu)異,包括對原文版式的還原也非常不錯。從校對結(jié)果就能看出很少出現(xiàn)紅色勘誤。白描在這個環(huán)節(jié)表現(xiàn)較差,容易出現(xiàn)空格丟失以及大小寫識別錯誤,在英文文本識別中非常吃虧。掃描全能王的表現(xiàn)介于兩者之間,同樣是識別率不錯,但斷行習(xí)慣性出錯。
英文識別率排名:textgrabber>掃描全能王>白描
四、中英文混排文檔
出處來自于威鋒一篇帖子,759 字。
Textgrabber

共檢查出 69 處修訂。

錯誤表現(xiàn):
1、文本識別結(jié)果習(xí)慣性在右側(cè)邊緣會莫名其妙插入空格。
2、部分字符識別錯誤,如將 mbp15 識別為 mbpl5。
3、個別標(biāo)點識別錯誤。
掃描全能王

共檢查出 182 處修訂。

錯誤表現(xiàn):
1、依然在換行處未能正確識別,出現(xiàn)多處錯誤斷行。
2、中英文混排的字符出現(xiàn)部分識別錯誤,如 fy 識別為行,firefox 識別為 firefo×。

3、標(biāo)點符號識別錯誤率較高。
白描

共檢查出 142 處修訂。

錯誤表現(xiàn):
1、習(xí)慣性問題依然存在,未能識別出每段段尾的標(biāo)點符號,及部分段首的標(biāo)點符號。
2、中文識別率較高,中英文混排識別率一般,如將 html5test 識別為 ntml5test。

3、標(biāo)點符號錯誤率較高。
小結(jié):該環(huán)節(jié)各家表現(xiàn)綜合了前兩輪表現(xiàn)特點,textgrabber 在該環(huán)節(jié)依然穩(wěn)健,沒有特別明顯的短板,白描和掃描全能王在前兩環(huán)節(jié)的亮點和缺點也延續(xù)在此環(huán)節(jié),綜合來看,textgrabber 表現(xiàn)最佳。
中英文混排識別率排名:textgrabber>白描>掃描全能王
五、綜合對比
1、識別率
白描作為一款獨立應(yīng)用,中文的識別率出乎意料地令人印象深刻,同時對原文版式的還原度最高,如果后期對標(biāo)點符號識別繼續(xù)優(yōu)化的話,在中文識別領(lǐng)域里幾乎就不存在對手了。
大廠出品的 textgrabber 表現(xiàn)最為穩(wěn)定,畢竟是號稱 OCR 界的老大,延續(xù)了桌面到手機端的優(yōu)勢,其對英文識別的準(zhǔn)確度可謂賞心悅目。
掃描全能王的識別率在于兩者之間,沒有特別明顯的短板,但也沒有特別優(yōu)異的亮點。它的優(yōu)勢在于對文檔掃描及文檔管理上,但在識別這個環(huán)節(jié)表現(xiàn)中庸。
總的來說,識別中文文檔推薦白描,識別英文文檔推薦 Textgrabber。
2、性價比
相較于 TextGrabber 30 元,和掃描全能王 30 元 / 月的相比,白描 Android 版普通版免費,iOS 版 6 元的入門價格幾乎稱得上是白菜價啦!

必須值得一提的是,白描的 iOS 版還支持表格掃描,其余兩款均不支持。為了嘗試這個功能,我還特地付費下載測試了一下,雖然在識別格式上還存在很多優(yōu)化的空間,但總歸邁出了值得期待的一步!

對了,白描還有個特別酷炫的功能,其他兩款都沒有,那就是支持最多 9 張圖片的批量 OCR 識別,并且還能合并為一個文檔!

不然這些爆炸好評怎么來的——

你說,識別率這么高,還賣得這么便宜,你還讓不讓別人活了,黑哥覺得這款軟件賣個三四十塊它一點都不貴呀!要下的趁早,說不定哪天就真的提價了,我已經(jīng)在 iOS 和 Android 上都已付費購買,這款良心軟件真的值得付費支持!
蘋果黨可以直接去 App Store 搜索下載,安卓黨可以去酷安下載,這么好的貨您不在云盤存一份嗎?
https://xg.zhihu.com/plugin/58a4943b07d6c3967ce687c45136f42e?BIZ=ECOMMERCE辛苦碼字,辛苦評測,隨手點贊,暖人心懷!
