1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        手把手教你使用Python網(wǎng)絡(luò)爬蟲獲取基金信息

        共 1806字,需瀏覽 4分鐘

         ·

        2022-04-13 08:57

        點(diǎn)擊上方“Python爬蟲與數(shù)據(jù)挖掘”,進(jìn)行關(guān)注

        回復(fù)“書籍”即可獲贈(zèng)Python從入門到進(jìn)階共10本電子書

        世亂同南去,時(shí)清獨(dú)北還。

        大家好,我是Python進(jìn)階者。

        一、前言

        前幾天有個(gè)粉絲找我獲取基金信息,這里拿出來分享一下,感興趣的小伙伴們,也可以積極嘗試。

        二、數(shù)據(jù)獲取

        這里我們的目標(biāo)網(wǎng)站是某基金官網(wǎng),需要抓取的數(shù)據(jù)如下圖所示。

        可以看到上圖中基金代碼那一列,有不同的數(shù)字,隨機(jī)點(diǎn)擊一個(gè),可以進(jìn)入到基金詳情頁,鏈接也非常有規(guī)律,以基金代碼作為標(biāo)志的。

        其實(shí)這個(gè)網(wǎng)站倒是不難,數(shù)據(jù)什么的,都沒有加密,網(wǎng)頁上的信息,在源碼中都可以直接看到。

        這樣就降低了抓取難度了。通過瀏覽器抓包的方法,可以看到具體的請求參數(shù),而且可以看到請求參數(shù)中只有pi在變化,而這個(gè)值恰好對應(yīng)的是頁面,直接構(gòu)造請求參數(shù)就可以了。

        代碼實(shí)現(xiàn)過程

        找到數(shù)據(jù)源之后,接下來就是代碼實(shí)現(xiàn)了,一起來看看吧,這里給出部分關(guān)鍵代碼。

        獲取股票id數(shù)據(jù)

        response?=?requests.get(url,?headers=headers,?params=params,?verify=False)
        ????pattern?=?re.compile(r'.*?"(?P.*?)".*?',?re.S)
        ????result?=?re.finditer(pattern,?response.text)
        ????ids?=?[]
        ????for?item?in?result:
        ????????#?print(item.group('items'))
        ????????gp_id?=?item.group('items').split(',')[0]

        結(jié)果如下圖所示:

        之后構(gòu)造詳情頁鏈接,獲取詳情頁的基金信息,關(guān)鍵代碼如下:

        response?=?requests.get(url,?headers=headers)
        response.encoding?=?response.apparent_encoding
        selectors?=?etree.HTML(response.text)
        danweijingzhi1?=?selectors.xpath('//dl[@class="dataItem02"]/dd[1]/span[1]/text()')[0]
        danweijingzhi2?=?selectors.xpath('//dl[@class="dataItem02"]/dd[1]/span[2]/text()')[0]
        leijijingzhi?=?selectors.xpath('//dl[@class="dataItem03"]/dd[1]/span/text()')[0]
        lst?=?selectors.xpath('//div[@class="infoOfFund"]/table//text()')

        結(jié)果如下圖所示:

        將具體的信息做相應(yīng)的字符串處理,然后保存到csv文件中,結(jié)果如下圖所示:

        有了這個(gè),你可以做進(jìn)一步的統(tǒng)計(jì)和數(shù)據(jù)分析了。

        三、總結(jié)

        大家好,我是Python進(jìn)階者。這篇文章主要分享了使用Python網(wǎng)絡(luò)爬蟲獲取基金數(shù)據(jù)信息,這個(gè)項(xiàng)目不算太難,里邊稍微有點(diǎn)小坑,歡迎大家積極嘗試,如果有遇到問題,請?zhí)砑游液糜眩規(guī)椭鉀Q。

        這篇文章主要是以【股票型】的分類做了抓取,其他的類型,我就沒做了,歡迎大家嘗試,其實(shí)邏輯都是一樣的,改下參數(shù)就可以了。

        最后需要本文代碼的小伙伴們,可以添加我v獲??!此外,方便大家學(xué)習(xí)Python,我還建立了一個(gè)Python高質(zhì)量學(xué)習(xí)交流群,遇到Python問題都可以隨便問,需要進(jìn)來的小伙伴們,加我v,我拉你!

        小伙伴們,快快用實(shí)踐一下吧!如果在學(xué)習(xí)過程中,有遇到任何Python問題,歡迎加我好友,我拉你進(jìn)Python學(xué)習(xí)交流群共同探討學(xué)習(xí)。

        -------------------?End?-------------------

        往期精彩文章推薦:

        歡迎大家點(diǎn)贊,留言,轉(zhuǎn)發(fā),轉(zhuǎn)載,感謝大家的相伴與支持

        想加入Python學(xué)習(xí)群請?jiān)诤笈_(tái)回復(fù)【

        萬水千山總是情,點(diǎn)個(gè)【在看】行不行

        瀏覽 57
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評論
        圖片
        表情
        推薦
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            在电影院被陌生人揉到高潮 | 免费在线看污片 | 久操视频在线免费看 | 无码123| 岳的胸好大好白 | 操美逼 | 操淫在线 | 天天色天天爽 | 国产精品自拍一 | 精品视频在线观看免费 |