1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        作為一只 Python 爬蟲:如何破解滑動驗證碼

        共 2672字,需瀏覽 6分鐘

         ·

        2021-03-27 12:26

        作者:劉志軍
        來源:Python之禪

        做爬蟲總會遇到各種各樣的反爬限制,反爬的第一道防線往往在登錄就出現了,為了限制爬蟲自動登錄,各家使出了渾身解數,所謂道高一尺魔高一丈。

        今天分享個如何簡單處理滑動圖片的驗證碼的案例。


        類似這種拖動滑塊移動到圖片中缺口位置與之重合的登錄驗證在很多網站或者 APP 都比較常見,因為它對真實用戶體驗友好,容易識別。同時也能攔截掉大部分初級爬蟲。

        作為一只 python 爬蟲,如何正確地自動完成這個驗證過程呢?

        先來分析下,核心問題其實是要怎么樣找到目標缺口的位置,一旦知道了位置,我們就可以借用 selenium 等工具完成拖動的操作。

        我們可以借用 opencv 來解決這個問題,主要步驟:


        opencv 是什么?

        OpenCV(Open Source Computer Vision Library)是開放源代碼計算機視覺庫,主要算法涉及圖像處理、計算機視覺和機器學習相關方法,可用于開發(fā)實時的圖像處理、計算機視覺以及模式識別程序。

        直接安裝

        pip install opencv-python

        首先將圖片進行高斯模糊處理,高斯模糊的主要作用是減少圖像的噪聲,用于預處理階段。

        import cv2 as cv
        image = cv.imread(image_path)
        blurred = cv.GaussianBlur(image, (55), 0)
        cv.imshow("blurred", blurred)

        處理后的效果

        接著用 Canny 邊緣檢測到得到一個包含“窄邊界”的二值圖像。所謂二值圖像就是黑白圖,只有黑色和白色。

        canny = cv.Canny(blurred, 200400)
        cv.imshow("canny", canny)


        輪廓檢測

        contours, hierarchy = cv.findContours(canny, cv.RETR_CCOMP, cv.CHAIN_APPROX_SIMPLE)
        for i, contour in enumerate(contours):  # 所有輪廓
            x, y, w, h = cv.boundingRect(contour)  # 外接矩形
            cv.rectangle(image, (x, y), (x + w, y + h), (00255), 2)
        cv.imshow('image', image)

        找出所有的輪廓,并用紅色線框將其繪制標識出來了,看出來大大小小有幾十個輪廓

        剩下的問題就好辦了,我們只需要對輪廓的面積或者周長范圍做限制,就能過濾出目標輪廓的位置, 前提是我們對目標位置的輪廓大小是預先確定的。

        for i, contour in enumerate(contours):  # 所有輪廓
            if 6000 < cv.contourArea(contour) <= 8000 and 300 < cv.arcLength(contour, True) < 500:
                x, y, w, h = cv.boundingRect(contour)  # 外接矩形
                print(x, y, w, h)
                cv.rectangle(image, (x, y), (x + w, y + h), (00255), 2)
                cv.imshow('image', image)
                # 找目標缺口,第一個可能是滑塊
                if x <= 200:
                    continue
                return x + int(w / 2), 675

        輪廓的面積大概是 6000 到 8000 之間,周長在 300 到 500 之間, 最后用外接矩形獲取該輪廓圖的坐標位置和寬高大小。

        如上就找到了目標位置,剩下的工作就是將滑塊移動到指定位置即可。

        瀏覽 44
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            a网站免费观看 | 国产免费无码 | 99精品热 | 国产女爽123视频.cno | 在线无码高清观看 | 动态啪啪图| 三级小说片 | 美女搞基视频网站 | 国产精品无套无码码在线 | 亚洲好逼|