Vedastr:基于PyTorch的場(chǎng)景文本識(shí)別工具箱
加入極市專(zhuān)業(yè)CV交流群,與?10000+來(lái)自港科大、北大、清華、中科院、CMU、騰訊、百度?等名校名企視覺(jué)開(kāi)發(fā)者互動(dòng)交流!
同時(shí)提供每月大咖直播分享、真實(shí)項(xiàng)目需求對(duì)接、干貨資訊匯總,行業(yè)技術(shù)交流。關(guān)注?極市平臺(tái)?公眾號(hào)?,回復(fù)?加群,立刻申請(qǐng)入群~
就在明天,極市平臺(tái)與重磅邀請(qǐng)到ICML 2020杰出論文一作魏愷軒,為我們深度講解論文相關(guān)工作:免調(diào)試即插即用的近端優(yōu)化算法。請(qǐng)大家鎖定直播時(shí)間7月22日(周三)20:00。詳情戳這里,在極市平臺(tái)后臺(tái)回復(fù)“62”,即可獲取直播鏈接。本次直播由極市平臺(tái)和中國(guó)圖象圖形學(xué)學(xué)會(huì)青年工作委員聯(lián)合組織。
1. Vedastr的特性STR(Scene Text Recognition)的任務(wù)是識(shí)別文字框中的內(nèi)容。我們?cè)谧鲫P(guān)于STR的項(xiàng)目時(shí)發(fā)現(xiàn),相關(guān)開(kāi)源的toolbox較少,調(diào)研后發(fā)現(xiàn)現(xiàn)有的toolbox存在以下幾個(gè)問(wèn)題:
模塊化程度較低
提供可配置接口較少
更新維護(hù)較少
模塊化
易拓展性
配置簡(jiǎn)單
較完善的日志系統(tǒng)
及時(shí)的更新維護(hù)
2. Vedastr的運(yùn)行方式
2.1 配置文件
optimizer = dict(type='Adam', lr=0.001)lr_scheduler = dict(type='StepLR', max_epochs=3, milestones=[100000, 200000])
2.2 Train、test和demo
Train
python tools/train.py config-pathTest
python tools/test.py config-path checkpoint-pathDemo
python tools/demo.py config-path checkpoint-path img-path3. 預(yù)訓(xùn)練模型
3.1 使用Vedastr復(fù)現(xiàn)的模型性能

TPS-ResNet-BiLSTM-Attention:What Is Wrong With Scene Text Recognition Model Comparisons?
Small-SATRN:On Recognizing Texts of Arbitrary Shapes with 2D Self-Attention
下載 TPS-ResNet-BiLSTM-Attention
下載vedastr,按照Installation進(jìn)行安裝
激活conda環(huán)境,運(yùn)行demo文件,識(shí)別的結(jié)果就會(huì)顯示在你的終端窗口上
python tools/demo.py configs/tps-resnet-bilstm-attention TPS-ResNet-BiLSTM-Attention.pth input-imginput-img:


終端窗口:

Vedastr項(xiàng)目鏈接如下,歡迎使用和star!https://github.com/Media-Smart/vedastr
推薦閱讀
比OCR更強(qiáng)大的PPT圖片一鍵轉(zhuǎn)文檔重建技術(shù)
文字識(shí)別方法全面整理
ECCV2020|PlugNet:可插拔的超分辨學(xué)習(xí)單元文本識(shí)別,解決低質(zhì)量圖像識(shí)別難題
添加極市小助手微信(ID : cv-mart),備注:研究方向-姓名-學(xué)校/公司-城市(如:目標(biāo)檢測(cè)-小極-北大-深圳),即可申請(qǐng)加入極市技術(shù)交流群,更有每月大咖直播分享、真實(shí)項(xiàng)目需求對(duì)接、求職內(nèi)推、算法競(jìng)賽、干貨資訊匯總、行業(yè)技術(shù)交流,一起來(lái)讓思想之光照的更遠(yuǎn)吧~
△長(zhǎng)按添加極市小助手
△長(zhǎng)按關(guān)注極市平臺(tái),獲取最新CV干貨
覺(jué)得有用麻煩給個(gè)在看啦~??

