1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        傻瓜式 Python OCR 識別庫 -- ddddocr

        共 1604字,需瀏覽 4分鐘

         ·

        2022-02-28 05:24

        ↑?關(guān)注 + 星標(biāo)?,每天學(xué)Python新技能

        后臺回復(fù)【大禮包】送你Python自學(xué)大禮包


        在使用爬蟲登錄網(wǎng)站的時(shí)候,經(jīng)常輸入用戶名和密碼后會遇到驗(yàn)證碼,簡單一點(diǎn)的有字母驗(yàn)證碼,復(fù)雜一點(diǎn)的有滑塊驗(yàn)證碼,點(diǎn)選文章和點(diǎn)選圖片驗(yàn)證碼。這些都是爬蟲中的老大難問題,今天介紹一款通用驗(yàn)證碼識別 SDK 對他們徹底說拜拜,它的名字是 ddddocr 帶帶弟弟 OCR 通用驗(yàn)證碼識別 SDK 免費(fèi)開源版。

        安裝

        將自動安裝符合自己電腦環(huán)境的最新 ddddocr。Python 環(huán)境需要小于等于 3.9。

        pip?install?ddddocr

        使用

        帶帶弟弟 OCR 可以識別三種驗(yàn)證碼,小編就用這三種來實(shí)驗(yàn)一下。

        滑塊驗(yàn)證碼

        滑塊驗(yàn)證碼這里用的是豆瓣的滑塊驗(yàn)證。下滑塊是單獨(dú)的透明背景圖 hycdn.png。

        hycdn.png

        背景圖是帶小滑塊坑位的 background.jpg。

        background
        import?ddddocr

        det?=?ddddocr.DdddOcr(det=False,?ocr=False)

        with?open('hycdn.png',?'rb')?as?f:
        ????????target_bytes?=?f.read()
        ????
        with?open('background.jpg',?'rb')?as?f:
        ????background_bytes?=?f.read()

        res?=?det.slide_match(target_bytes,?background_bytes,?simple_target=True)

        print(res)

        識別結(jié)果

        {'target_y':?0,?'target':?[486,?126,?622,?262]}

        target 屬性的前兩個(gè)值正好和豆瓣驗(yàn)證滑塊 url 中提交的 ans 差不多。

        點(diǎn)選類驗(yàn)證碼

        點(diǎn)選類驗(yàn)證碼用的是網(wǎng)易登錄

        eb.jpg
        det?=?ddddocr.DdddOcr(det=True)

        ????with?open("eb.jpg",?'rb')?as?f:
        ????????image?=?f.read()

        ????poses?=?det.detection(image)

        ????im?=?cv2.imread("eb.jpg")

        ????for?box?in?poses:
        ????????x1,?y1,?x2,?y2?=?box
        ????????im?=?cv2.rectangle(im,?(x1,?y1),?(x2,?y2),?color=(0,?0,?255),?thickness=2)

        ????cv2.imwrite("result.jpg",?im)

        識別結(jié)果

        字母數(shù)字驗(yàn)證碼

        字母數(shù)字驗(yàn)證碼的圖片來自于 google 搜索

        ocr?=?ddddocr.DdddOcr(old=True)

        with?open("z1.jpg",?'rb')?as?f:
        ????image?=?f.read()

        res?=?ocr.classification(image)
        print(res)

        識別結(jié)果

        3n3d
        8342

        總結(jié)

        ddddocr 讓驗(yàn)證碼變得如此簡單與易用,,讓不會用 opencv, pytorch, tensorflow 的小伙伴也能快速的破解網(wǎng)站的登錄驗(yàn)證碼。小伙伴們?nèi)绻衅渌玫?ocr 識別也可以在留言中分享出來。

        推薦閱讀

        1. 又一款超酷的可視化神器:cutecharts

        2. 消息稱騰訊微信試行“1065”工作制,晚 18 點(diǎn)強(qiáng)制下班?

        3. 爬取網(wǎng)站內(nèi)容,合并Excel數(shù)據(jù)…推薦一個(gè)自動化辦公神器!


        您看此文用???分??秒,轉(zhuǎn)發(fā)只需1秒哦~

        瀏覽 878
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評論
        圖片
        表情
        推薦
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            色撸撸在线视频 | 国产男女激情视频 | 91狠狠 | 香蕉视频啊啊啊啊 | 天天久久综合 | 亚洲理论视频在线免费观看 | 欧美熟女视频无码视 | 国产在线第一页 | 人人摸人人操人人摸 | 日韩午夜精品视频 |