Umi-OCR離線(xiàn)文字識(shí)別工具
Umi-OCR 是一款免費(fèi)、開(kāi)源、可批量的離線(xiàn) OCR 軟件,基于 PaddleOCR,適用于 Windows10/11 平臺(tái)。
特性
- 免費(fèi):本項(xiàng)目所有代碼開(kāi)源,完全免費(fèi)。
- 方便:解壓即用,離線(xiàn)運(yùn)行,無(wú)需網(wǎng)絡(luò)。
- 批量:可批量導(dǎo)入處理圖片,結(jié)果保存到本地 txt / md / jsonl 多種格式文件。也可以即時(shí)截屏識(shí)別。
- 高效:采用 PaddleOCR-json C++ 識(shí)別引擎。只要電腦性能足夠,通常比在線(xiàn)OCR服務(wù)更快。
- 精準(zhǔn):默認(rèn)使用PPOCR-v3模型庫(kù)。除了能準(zhǔn)確辨認(rèn)常規(guī)文字,對(duì)手寫(xiě)、方向不正、雜亂背景等情景也有不錯(cuò)的識(shí)別率??稍O(shè)置忽略區(qū)域排除水印、設(shè)置文塊后處理合并排版段落,得到規(guī)整的文本。
說(shuō)明目錄
- 簡(jiǎn)單上手 截圖、批量識(shí)別~
- 排版優(yōu)化 如何合并一個(gè)自然段內(nèi)的文字?
- 忽略區(qū)域 如何排除截圖水印處的文字?
- 多國(guó)語(yǔ)言 添加更多PP-OCR支持的語(yǔ)言模型庫(kù)!
- 命令行調(diào)用 用命令行或第三方工具來(lái)調(diào)用Umi-OCR!
- 更多小技巧
- 問(wèn)題排除 無(wú)法啟動(dòng)引擎 / 多屏幕截圖異常 ?
下載
Umi-OCR 軟件本體含 簡(jiǎn)體中文&英文 通用識(shí)別庫(kù)。
配套 多國(guó)語(yǔ)言識(shí)別擴(kuò)展包 可導(dǎo)入繁中,英,日,韓,俄,德,法識(shí)別庫(kù),請(qǐng)按需下載。
Github下載:Release v1.3.3
藍(lán)奏云下載:https://hiroi-sora.lanzoul.com/s/umi-ocr
兼容性
- 系統(tǒng)支持 Win10 x64 及以上版本。
- CPU必須具有AVX指令集。
- 出現(xiàn)初始化引擎失敗等問(wèn)題時(shí)請(qǐng)參考 問(wèn)題排除 。
前言
關(guān)于忽略指定區(qū)域的特殊功能:
類(lèi)似含水印的視頻截圖、含有UI/按鈕的游戲截圖等,往往只需要提取字幕區(qū)域的文本,而避免提取到水印和UI文本。本軟件可設(shè)置忽略某些區(qū)域內(nèi)的文字,來(lái)實(shí)現(xiàn)這一目的。
當(dāng)有大量的影視和游戲截圖需要整理歸檔,或者想翻找包含某一段臺(tái)詞/字幕的截圖;將這些圖片提取出文字、然后Ctrl+F是一個(gè)很有效的方法。這是開(kāi)發(fā)本軟件的初衷。
關(guān)于離線(xiàn)OCR引擎 PaddleOCR-json :
對(duì) PaddleOCR 2.6 cpu_avx_mkl C++ 的封裝。效率高于Python版本PPOCR及部分Python編寫(xiě)的OCR引擎,通常比在線(xiàn)OCR服務(wù)更快(省去網(wǎng)絡(luò)傳輸?shù)臅r(shí)間)。支持更換Paddle官方模型(兼容v2和v3版本)或自己訓(xùn)練的模型,支持修改PPOCR各項(xiàng)參數(shù)。通過(guò)添加不同的語(yǔ)言模型,軟件可識(shí)別多國(guó)語(yǔ)言。
簡(jiǎn)單上手
準(zhǔn)備
下載壓縮包并解壓全部文件即可。
截圖識(shí)別
點(diǎn)擊截圖按鈕或自定義快捷鍵,喚起截圖識(shí)別。
粘貼圖片到軟件
在任何地方(如文件管理器,網(wǎng)頁(yè),微信)復(fù)制圖片,軟件上點(diǎn)擊粘貼按鈕,自動(dòng)識(shí)別。
批量識(shí)別本地圖片文件
將圖片或文件夾拖進(jìn)軟件,批量轉(zhuǎn)換文字。也可以點(diǎn)擊按鈕打開(kāi)瀏覽窗口導(dǎo)入。
識(shí)別結(jié)果將保存到本地。可選生成純文本txt文件、帶鏈接Markdown文件、原始信息jsonl文件等不同格式??膳渲萌蝿?wù)完成后執(zhí)行關(guān)機(jī)/待機(jī)。
文本塊后處理(排版優(yōu)化)
OCR識(shí)別出的文本是按“塊”劃分的,通常一行文字分為一塊,有時(shí)還會(huì)將一行誤劃分為多塊,這給閱讀帶來(lái)了不便。文本塊后處理就是對(duì)文本塊進(jìn)行再加工的過(guò)程,合并同一行或同一段落內(nèi)的文字,按正確的順序排序。
