Andy
0獲贊0關(guān)注0粉絲
文字識(shí)別經(jīng)驗(yàn)
整個(gè)文字識(shí)別的算法流程可以分成四部分:預(yù)處理、文本行檢測(cè)、文字識(shí)別、后處理。預(yù)處理包括圖像方向校正(例如圖像偏轉(zhuǎn)90度,倒置)、文本行校正、圖像質(zhì)量增強(qiáng)(例如去除屏拍摩爾紋等)。預(yù)處理是為了處理特殊情況、提高檢測(cè)和識(shí)別的精度。文本行檢測(cè)目前以EAST和PSENET比較常見(jiàn),目前來(lái)看,psenet精度更高,適用的場(chǎng)景豐富,對(duì)于文本行比較密集的場(chǎng)景和彎曲文本性能更優(yōu),但是psenet速度低于EAST,尤其是文本行越多,后處理占用時(shí)間較長(zhǎng)。對(duì)于單字符情況,psenet的文本框的置信度較低,在較高置信度閾值時(shí),容易導(dǎo)致最終檢測(cè)不到,而較小的閾值容易引入噪聲,所以需要根據(jù)具體場(chǎng)景設(shè)置一個(gè)合理的閾值。對(duì)于文本行識(shí)別,CRNN、attention
Andy
0
