1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        Python文字識(shí)別OCR案例:百度AI實(shí)現(xiàn)OCR識(shí)別(源代碼) !

        共 1062字,需瀏覽 3分鐘

         ·

        2022-02-09 17:36

        最近研究OCR技術(shù)實(shí)現(xiàn)較多,各種OCR實(shí)現(xiàn)方式做了一些測(cè)試和對(duì)比,針對(duì)不同的業(yè)務(wù)需要采用不同的實(shí)現(xiàn)方式,今天寫的這個(gè)案例是利用百度AI來實(shí)現(xiàn)的通用OCR文字識(shí)別。實(shí)現(xiàn)方式非常簡單,十幾行代碼就能搞定,但識(shí)別率如何就要看圖片質(zhì)量和所用字體了。


        從根本上來說,OCR的技術(shù)實(shí)現(xiàn)有兩種方式:


        第一種較為簡單,就是調(diào)用各個(gè)云平臺(tái)提供的OCR服務(wù)來識(shí)別圖片上的文字。這種實(shí)現(xiàn)方式的優(yōu)點(diǎn)是簡單易用,識(shí)別率較高,靈活性較弱,定制化不容易實(shí)現(xiàn),但是需要上傳圖片信息,如果圖片上包含敏感信息就有數(shù)據(jù)安全性和隱私性方面可能的問題,而正是這最后一點(diǎn)讓很多客戶對(duì)這種OCR實(shí)現(xiàn)方式敬謝不敏。


        第二種實(shí)現(xiàn)起來較為復(fù)雜,就是在本地實(shí)現(xiàn)OCR文字識(shí)別,需要在本機(jī)安裝OCR識(shí)別軟件和類庫——這些軟件和類庫可以是第三方提供的,例如Google Tesseract OCR軟件和類庫,也可以是自開發(fā)的機(jī)器學(xué)習(xí)基礎(chǔ)上的OCR文字識(shí)別程序。這種實(shí)現(xiàn)方式的優(yōu)點(diǎn)是數(shù)據(jù)安全性和隱私性較強(qiáng),不需要上傳圖片信息,OCR識(shí)別完全在本地完成,效率較高,而且可定制化高(圖片處理,指定字體等),靈活性較強(qiáng),但是缺點(diǎn)就是需要在本地安裝和配置OCR識(shí)別的軟件或程序。識(shí)別率要看本地安裝的OCR識(shí)別軟件和程序的算法實(shí)現(xiàn),在性能上依賴于本地硬件配置。從數(shù)據(jù)安全性和隱私性角度,客戶更多傾向于這一種實(shí)現(xiàn)方式。


        第二種OCR實(shí)現(xiàn)方式的案例已經(jīng)寫了,就是利用Google Tesseract OCR本地軟件和類庫來實(shí)現(xiàn)的OCR文字識(shí)別,具體可參考我寫的一個(gè)案例(Python文字識(shí)別OCR案例:搞定PDF掃描件和圖片文字內(nèi)容(源代碼))。


        今天這個(gè)OCR文字識(shí)別的案例是采用第一種實(shí)現(xiàn)方式,調(diào)用百度AI的OCR服務(wù)來實(shí)現(xiàn)圖片上的文字識(shí)別。在百度AI平臺(tái)上注冊(cè)一個(gè)賬號(hào),然后就可以調(diào)用OCR服務(wù)了,每天5000次內(nèi)調(diào)用免費(fèi)。


        從百度圖片下載了一個(gè)新聞圖片:





        運(yùn)行寫的Python程序調(diào)用百度AI的OCR服務(wù)來識(shí)別這個(gè)新聞圖片:





        百度AI的OCR服務(wù)返回內(nèi)容寫入了一個(gè)文本文件:





        這個(gè)案例的Python程序的源代碼已經(jīng)上傳到github,需要的可以直接點(diǎn)擊下載(下載前請(qǐng)點(diǎn)個(gè)贊,加個(gè)星star):


        github.com/hanshiqiang3


        百度AI平臺(tái)提供的各種人工智能服務(wù)還是非常好用的,從學(xué)習(xí)和研究人工智能的實(shí)現(xiàn)效果,或者用來實(shí)際處理不是敏感的信息的應(yīng)用角度而言,實(shí)現(xiàn)起來非常簡單,測(cè)試效果也非常不錯(cuò)。最重要的,很多服務(wù)是有免費(fèi)使用次數(shù)的。


        故有此文,與君分享。

        瀏覽 16
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            做爱成人视频 | 99精品女女视频 | 揉胸舔下面看片免费网站 | 日韩美女tickle挠双乳 | 五月天激情国产综合 | 熟女淫荡视频 | 伊人影院麻豆 | 国产福利一区视频 | 欧美婬荡老太大一级视频 | 又硬又粗又硬又长又大时间持久 |