趣玩日語(yǔ)
0獲贊0關(guān)注0粉絲
Python識(shí)別圖片中的文字
一、前言
不知道大家有沒(méi)有遇到過(guò)這樣的問(wèn)題,就是在某個(gè)軟件或者某個(gè)網(wǎng)頁(yè)里面有一篇文章,你非常喜歡,但是不能復(fù)制?;蛘呦癜俣任臋n一樣,只能復(fù)制一部分,這個(gè)時(shí)候我們就會(huì)選擇截圖保存。但是當(dāng)我們想用到里面的文字時(shí),還是要一個(gè)字一個(gè)字打出來(lái)。那么我們能不能直接識(shí)別圖片中的文字呢?答案是肯定的。
二、TESSERACT
文字識(shí)別是ORC的一部分內(nèi)容,ORC的意思是光學(xué)字符識(shí)別,通俗講就是文字識(shí)別。Tesseract是一個(gè)用于文字識(shí)別的工具,我們結(jié)合Python使用可以很快的實(shí)現(xiàn)文字識(shí)別。但是在此之前我們需要完成一個(gè)繁瑣的工作。
(1)Tesseract的安裝及配置
Tesseract的安裝我們可以移步到該網(wǎng)址 https://di
趣玩日語(yǔ)
0
