1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        文字識別經(jīng)驗(yàn)

        共 515字,需瀏覽 2分鐘

         ·

        2022-02-09 17:36

        整個文字識別的算法流程可以分成四部分:預(yù)處理、文本行檢測、文字識別、后處理。預(yù)處理包括圖像方向校正(例如圖像偏轉(zhuǎn)90度,倒置)、文本行校正、圖像質(zhì)量增強(qiáng)(例如去除屏拍摩爾紋等)。預(yù)處理是為了處理特殊情況、提高檢測和識別的精度。文本行檢測目前以EAST和PSENET比較常見,目前來看,psenet精度更高,適用的場景豐富,對于文本行比較密集的場景和彎曲文本性能更優(yōu),但是psenet速度低于EAST,尤其是文本行越多,后處理占用時間較長。對于單字符情況,psenet的文本框的置信度較低,在較高置信度閾值時,容易導(dǎo)致最終檢測不到,而較小的閾值容易引入噪聲,所以需要根據(jù)具體場景設(shè)置一個合理的閾值。對于文本行識別,CRNN、attention ocr、bert等算法占據(jù)主流。后處理部分包括文字糾正、結(jié)構(gòu)化輸出等內(nèi)容。

        算法通用性:以檢測算法為例,單一場景的數(shù)據(jù)訓(xùn)練往往只能在某一些場景中達(dá)到比較好的效果,當(dāng)需要擴(kuò)展新業(yè)務(wù)時,需要重新訓(xùn)練,費(fèi)時費(fèi)力。采用十幾個場景的數(shù)據(jù)集訓(xùn)練檢測算法則可以解決該問題,提升算法的通用性。

        (后續(xù)更新...)

        算法優(yōu)化\ 算法工程化經(jīng)驗(yàn)

        瀏覽 21
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評論
        圖片
        表情
        推薦
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            国产专业剧情av在线 | 中文字幕精品av乱喷 | 热久久这里只有精品 | 女人上床靠逼 | 成人区人妻精品一区二 | 手机免费av | 日日骚av一区二区三区 | 爱搞搞电影网 | 欧美色就是色操逼视频 | 一级电影在线 |