1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        Umi-OCR離線(xiàn)文字識(shí)別工具

        聯(lián)合創(chuàng)作 · 2023-09-30 13:29

        Umi-OCR 是一款免費(fèi)、開(kāi)源、可批量的離線(xiàn) OCR 軟件,基于 PaddleOCR,適用于 Windows10/11 平臺(tái)。

        特性

        • 免費(fèi):本項(xiàng)目所有代碼開(kāi)源,完全免費(fèi)。
        • 方便:解壓即用,離線(xiàn)運(yùn)行,無(wú)需網(wǎng)絡(luò)。
        • 批量:可批量導(dǎo)入處理圖片,結(jié)果保存到本地 txt / md / jsonl 多種格式文件。也可以即時(shí)截屏識(shí)別。
        • 高效:采用 PaddleOCR-json C++ 識(shí)別引擎。只要電腦性能足夠,通常比在線(xiàn)OCR服務(wù)更快。
        • 精準(zhǔn):默認(rèn)使用PPOCR-v3模型庫(kù)。除了能準(zhǔn)確辨認(rèn)常規(guī)文字,對(duì)手寫(xiě)、方向不正、雜亂背景等情景也有不錯(cuò)的識(shí)別率??稍O(shè)置忽略區(qū)域排除水印、設(shè)置文塊后處理合并排版段落,得到規(guī)整的文本。

        說(shuō)明目錄

        下載

        Umi-OCR 軟件本體含 簡(jiǎn)體中文&英文 通用識(shí)別庫(kù)。
        配套 多國(guó)語(yǔ)言識(shí)別擴(kuò)展包 可導(dǎo)入 繁中,英,日,韓,俄,德,法 識(shí)別庫(kù),請(qǐng)按需下載。

        Github下載:Release v1.3.3

        藍(lán)奏云下載:https://hiroi-sora.lanzoul.com/s/umi-ocr

        兼容性

        • 系統(tǒng)支持 Win10 x64 及以上版本。
        • CPU必須具有AVX指令集。
        • 出現(xiàn)初始化引擎失敗等問(wèn)題時(shí)請(qǐng)參考 問(wèn)題排除 

        前言

        關(guān)于忽略指定區(qū)域的特殊功能:

        類(lèi)似含水印的視頻截圖、含有UI/按鈕的游戲截圖等,往往只需要提取字幕區(qū)域的文本,而避免提取到水印和UI文本。本軟件可設(shè)置忽略某些區(qū)域內(nèi)的文字,來(lái)實(shí)現(xiàn)這一目的。

        當(dāng)有大量的影視和游戲截圖需要整理歸檔,或者想翻找包含某一段臺(tái)詞/字幕的截圖;將這些圖片提取出文字、然后Ctrl+F是一個(gè)很有效的方法。這是開(kāi)發(fā)本軟件的初衷。

        關(guān)于離線(xiàn)OCR引擎 PaddleOCR-json 

        對(duì) PaddleOCR 2.6 cpu_avx_mkl C++ 的封裝。效率高于Python版本PPOCR及部分Python編寫(xiě)的OCR引擎,通常比在線(xiàn)OCR服務(wù)更快(省去網(wǎng)絡(luò)傳輸?shù)臅r(shí)間)。支持更換Paddle官方模型(兼容v2和v3版本)或自己訓(xùn)練的模型,支持修改PPOCR各項(xiàng)參數(shù)。通過(guò)添加不同的語(yǔ)言模型,軟件可識(shí)別多國(guó)語(yǔ)言。

        簡(jiǎn)單上手

        準(zhǔn)備

        下載壓縮包并解壓全部文件即可。

        截圖識(shí)別

        點(diǎn)擊截圖按鈕或自定義快捷鍵,喚起截圖識(shí)別。

        粘貼圖片到軟件

        在任何地方(如文件管理器,網(wǎng)頁(yè),微信)復(fù)制圖片,軟件上點(diǎn)擊粘貼按鈕,自動(dòng)識(shí)別。

        批量識(shí)別本地圖片文件

        將圖片或文件夾拖進(jìn)軟件,批量轉(zhuǎn)換文字。也可以點(diǎn)擊按鈕打開(kāi)瀏覽窗口導(dǎo)入。

        識(shí)別結(jié)果將保存到本地。可選生成純文本txt文件、帶鏈接Markdown文件、原始信息jsonl文件等不同格式??膳渲萌蝿?wù)完成后執(zhí)行關(guān)機(jī)/待機(jī)。

         

        文本塊后處理(排版優(yōu)化)

        OCR識(shí)別出的文本是按“塊”劃分的,通常一行文字分為一塊,有時(shí)還會(huì)將一行誤劃分為多塊,這給閱讀帶來(lái)了不便。文本塊后處理就是對(duì)文本塊進(jìn)行再加工的過(guò)程,合并同一行或同一段落內(nèi)的文字,按正確的順序排序。

        下圖表示不同排版應(yīng)該選用何種處理方案:

        瀏覽 46
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        編輯 分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        編輯 分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            中国美女一级特黄大片片 | 欧洲午夜激情 | 亚洲无码电影天堂 | 国产一级婬乱A片无码视频黑人 | 伊人久久网站 | 自拍偷拍在线第一页 | 中文字幕精品一区二区精品绿巨人 | 97鸡巴在线| 国产情侣一区二区三区 | 男女做爰猛烈吃奶摸馒头的照片 |