電影荒嗎?教你爬取豆瓣電影top250
點(diǎn)擊上方藍(lán)字關(guān)注我們
爬蟲目標(biāo)
項(xiàng)目準(zhǔn)備
軟件:Pycharm
第三方庫(kù):requests,parsel,pandas,lxml,os
網(wǎng)站地址:https://movie.douban.com/top250?start=
網(wǎng)站分析
網(wǎng)站首頁(yè)如下:


反爬分析

鏈接分析
第一頁(yè):https://movie.douban.com/top250?start=第二頁(yè):https://movie.douban.com/top250?start=25&filter=第三頁(yè):https://movie.douban.com/top250?start=50&filter=
可以發(fā)現(xiàn),每頁(yè)的電影信息會(huì)隨著網(wǎng)站鏈接末尾數(shù)字變化而變化。
代碼實(shí)現(xiàn)
1.獲取網(wǎng)頁(yè)源碼信息



25部電影信息打印如下:

數(shù)據(jù)保存
數(shù)據(jù)保存我們需要用到pandas,首先我們導(dǎo)入
import pandas as pd

效果展示

csv文件如下:

圖片文件如下:

想要學(xué)習(xí)或者對(duì)源碼有興趣的小伙伴掃碼回復(fù)'電影'即可
掃描二維碼
獲取更多精彩
python學(xué)前班
回復(fù)下方 「關(guān)鍵詞」,獲取優(yōu)質(zhì)資源
![]()
回復(fù)關(guān)鍵詞 「linux」,即可獲取 185 頁(yè) Linux 工具快速教程手冊(cè)和154頁(yè)的Linux筆記。
回復(fù)關(guān)鍵詞 「Python進(jìn)階」,即可獲取 106 頁(yè) Python 進(jìn)階文檔 PDF
回復(fù)關(guān)鍵詞 「Python面試題」,即可獲取最新 100道 面試題 PDF
回復(fù)關(guān)鍵詞 「python數(shù)據(jù)分析」,即可獲取47頁(yè)python數(shù)據(jù)分析與自然語(yǔ)言處理的 PDF
回復(fù)關(guān)鍵詞 「python爬蟲」,滿滿五份PPT爬蟲教程和70多個(gè)案例
回復(fù)關(guān)鍵詞 「Python最強(qiáng)基礎(chǔ)學(xué)習(xí)文檔」,即可獲取 168 頁(yè) Python 最強(qiáng)基礎(chǔ)學(xué)習(xí)文檔 PDF,讓你快速入門Python
![]()
推薦我的微信號(hào)
來(lái)圍觀我的朋友圈,我的經(jīng)驗(yàn)分享,技術(shù)更新,不定期送書,坑位有限,速速掃碼添加!
備注:開(kāi)發(fā)方向_昵稱_城市,另送你10本Python電子書。![]()
![]()
點(diǎn)個(gè)在看你最好看
