1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        GitHub Star 4.6K 百度開(kāi)源力作

        共 2284字,需瀏覽 5分鐘

         ·

        2020-10-28 12:36

        導(dǎo)讀


        如果你是OCR方向的工程師,你一定需要知道這個(gè)OCR開(kāi)源項(xiàng)目:PaddleOCR


        先看下PaddleOCR自今年開(kāi)源以來(lái),短短幾個(gè)月在GitHub上的表現(xiàn):


        • 7月,8.6M超輕量模型發(fā)布,GitHub Trending 全球趨勢(shì)榜日榜第一。

        • 8月,開(kāi)源CVPR2020頂會(huì)SOTA算法,再上GitHub趨勢(shì)榜單!

        • 9月,發(fā)布PP-OCR算法,開(kāi)源3.5M超超輕量模型,再下Paperswithcode 趨勢(shì)榜第一




        有圖有真相,這個(gè)含金量,廣大的Github開(kāi)發(fā)者們自然懂,目前,項(xiàng)目累計(jì)Star數(shù)量已超過(guò)4.6K,并且仍然持續(xù)增長(zhǎng),這樣的成績(jī)到底是如何做到的?讓小編帶你一探究竟。


        我們先看repo里面的特性,確實(shí)是干貨滿滿,直接看官方介紹:



        數(shù)量上,這次PaddleOCR一口氣發(fā)布了三個(gè)系列模型,滿足移動(dòng)端、服務(wù)器端各種場(chǎng)景需求。而且,多語(yǔ)言也妥妥安排上了,全部訓(xùn)練代碼和模型毫無(wú)保留開(kāi)源。其中3.5M超輕量文字識(shí)別模型,堪稱目前業(yè)界開(kāi)源的最輕量OCR模型了。


        質(zhì)量上,如此輕量的模型,效果有保障嗎?不看廣告,直接看療效。

        先看幾個(gè)常見(jiàn)的通用場(chǎng)景識(shí)別效果:



        火車票、表格、金屬銘牌、翻轉(zhuǎn)圖片,外語(yǔ)都是妥妥的

        3.5M的模型能達(dá)到這個(gè)識(shí)別精度,絕對(duì)是良心之作了!


        傳送門:

        Github:https://github.com/PaddlePaddle/PaddleOCR

        論文下載鏈接:https://arxiv.org/abs/2009.09941


        快速體驗(yàn)PaddleOCR的3.5M超輕量OCR模型

        • PC端快速嘗試:(打開(kāi)網(wǎng)頁(yè),選一張圖片,即可實(shí)時(shí)看到結(jié)果)


        https://www.paddlepaddle.org.cn/hub/scene/ocr



        • 手機(jī)端App安裝體驗(yàn)

        PaddleOCR在百度大腦EasyEdge上開(kāi)放了文字識(shí)別APP demo。

        示例效果如下(可以在github首頁(yè)找到下載二維碼)



        多個(gè)開(kāi)源repo測(cè)試對(duì)比

        簡(jiǎn)單對(duì)比一下目前主流OCR方向開(kāi)源repo的核心能力:



        從性能指標(biāo)來(lái)看:


        • 針對(duì)OCR實(shí)際應(yīng)用場(chǎng)景,包括合同,車牌,銘牌,火車票,化驗(yàn)單,表格,證書(shū),街景文字,名片,數(shù)碼顯示屏等,收集的300張圖像,每張圖平均有17個(gè)文本框,PaddleOCR的F1-Score超過(guò)0.5,這個(gè)性能已經(jīng)很不錯(cuò)了。


        從功能完備來(lái)看:


        • 預(yù)訓(xùn)練模型大小:EasyOCR目前暫無(wú)超輕量模型,chineseocr_lite最新的模型是4.7M左右,而PaddleOCR提供的3.5M無(wú)疑是目前業(yè)界已知最輕量的。

        • PIP安裝:目前僅PaddleOCR和EasyOCR支持。

        • 自定義訓(xùn)練:實(shí)際業(yè)務(wù)場(chǎng)景中,預(yù)訓(xùn)練模型往往不能滿足需求,對(duì)于自定義訓(xùn)練和模型Finetuning,chineseocr_lite和EasyOCR都是不支持的

        • 部署方面:EasyOCR模型較大不適合端側(cè)部署,Chineseocr_lite和PaddleOCR都具備端側(cè)部署能力。


        開(kāi)發(fā)者可以根據(jù)自己的實(shí)際需求,選擇適合自己的開(kāi)源方案。


        對(duì)于PaddleOCR 3.5MB的超輕量模型,是如何做到的,repo中也給出了解釋。



        3.5M超輕量模型應(yīng)用了一套超輕量OCR系統(tǒng)PP-OCR,主要由DB文本檢測(cè)、檢測(cè)框矯正和CRNN文本識(shí)別三部分組成。該系統(tǒng)從骨干網(wǎng)絡(luò)選擇和調(diào)整、預(yù)測(cè)頭部的設(shè)計(jì)、數(shù)據(jù)增強(qiáng)、學(xué)習(xí)率變換策略、正則化參數(shù)選擇、預(yù)訓(xùn)練模型使用以及模型自動(dòng)裁剪量化8個(gè)方面,采用19個(gè)有效策略,對(duì)各個(gè)模塊的模型進(jìn)行效果調(diào)優(yōu)和瘦身。其中,飛槳模型壓縮庫(kù)PaddleSlim為PaddleOCR超輕量化模型的實(shí)現(xiàn)提供了核心的技術(shù)支撐。從超輕量模型8.1M的壓縮到3.5M,模型大小降低了56.79%,其中檢測(cè)模型速度提升21%,而且整體模型精度還有提升。



        除了3.5M超輕量OCR模型,PaddleOCR提供了多語(yǔ)言預(yù)訓(xùn)練模型(英、德、法、韓、日),支持自定義訓(xùn)練和豐富的部署方式。


        如果覺(jué)得這個(gè)項(xiàng)目還不錯(cuò),支持開(kāi)源工作,也希望您可以star關(guān)注哦



        想了解更多,歡迎加入PaddleOCR技術(shù)交流群,第一時(shí)間獲得技術(shù)支持。

        注:小編發(fā)現(xiàn)現(xiàn)在已經(jīng)加到6群了,開(kāi)發(fā)者朋友趕緊上車啊。



        招募活動(dòng)預(yù)告

        10月31日,百度AI快車道將走進(jìn)南京,屆時(shí)將有PaddleOCR研發(fā)團(tuán)隊(duì)空降南京,歡迎OCR方向南京的開(kāi)發(fā)者們,我們相聚江蘇保險(xiǎn)大廈。后續(xù)的每一周我們還將走進(jìn)成都(11月7日)、西安(11月14日)、武漢、廈門、北京等城市。



        更多飛槳的相關(guān)內(nèi)容,請(qǐng)參閱以下內(nèi)容。

        官網(wǎng)地址:https://www.paddlepaddle.org.cn

        飛槳PaddleOCR項(xiàng)目地址:

        GitHub: https://github.com/PaddlePaddle/PaddleOCR

        Gitee: https://gitee.com/paddlepaddle/PaddleOCR

        飛槳PaddleSlim項(xiàng)目地址:

        GitHub: https://github.com/PaddlePaddle/PaddleSlim

        Gitee: https://gitee.com/paddlepaddle/PaddleSlim

        PP-OCR技術(shù)文章:

        論文下載鏈接:https://arxiv.org/abs/2009.09941


        點(diǎn)擊“閱讀原文”參與活動(dòng)報(bào)名。

        瀏覽 81
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            亚洲精品一区二区三区四区五区六区 | 亚洲电影一区二区三区 | A三级片 欧美操逼的视频 | 一级黄色片aaa | 无码三级 | 办公室av | 久久久久成人电影 | 国产偷ⅴ国产偷v精品 | 性色av无码久久久久久免费大尺度 | 日本性爱一区二区三区 |