1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        超詳細(xì)! 生成DataFrame、讀取和保存各種格式數(shù)據(jù)

        共 1991字,需瀏覽 4分鐘

         ·

        2021-09-10 15:39

        一、生成DataFrame

        以字典形式生成
        import pandas as pd

        datas = {
            '排名': [12345],
            '綜合得分': [894603589570569],
            '粉絲數(shù)': [309147937049875712471259847],
            '獲贊數(shù)': [1220031637498717368996]
        }

        df = pd.DataFrame(datas)
        df

        結(jié)果如下:

        以列表形式生成
        datas1 = [
            {'排名'1'綜合得分'894'粉絲數(shù)'309147'獲贊數(shù)'12200},
            {'排名'2'綜合得分'603'粉絲數(shù)'93704'獲贊數(shù)'31637},
            {'排名'3'綜合得分'589'粉絲數(shù)'98757'獲贊數(shù)'4987},
            {'排名'4'綜合得分'570'粉絲數(shù)'124712'獲贊數(shù)'1736},
            {'排名'5'綜合得分'569'粉絲數(shù)'59847'獲贊數(shù)'8996}
        ]

        df1 = pd.DataFrame(datas1)
        df1

        結(jié)果如下:

        在爬取數(shù)據(jù)時,保存數(shù)據(jù)如果用pandas,需要組織數(shù)據(jù)生成DataFrame,以上兩種方法是很常用的,熟練掌握這兩種方法在保存爬取下來的數(shù)據(jù)時很有幫助。

        二、讀取數(shù)據(jù)

        pd.read_excel( ):讀取 Excel 表格數(shù)據(jù)
        # 讀取 Excel 數(shù)據(jù)
        df2 = pd.read_excel('rank_datas.xlsx')
        # 隨機(jī)抽取5行數(shù)據(jù)
        df2.sample(5)
        pd.read_csv( ):讀取 csv 表格數(shù)據(jù)
        # 讀取 csv 數(shù)據(jù)
        df3 = pd.read_csv('job_info.csv')
        # 隨機(jī)抽取5行數(shù)據(jù)
        df3.sample(5)
        pd.read_html( ):讀取 html 網(wǎng)頁上的表格數(shù)據(jù)

        # 讀取 html 數(shù)據(jù)
        df4 = pd.read_html('aliyun-ddns.html')[0]
        # 隨機(jī)抽取5行數(shù)據(jù)
        df4.sample(5)

        結(jié)果如下:pd.read_html( )這個方法雖然少用,但它的功能非常強(qiáng)大,有時可以用做爬蟲,直接抓取網(wǎng)頁 Table 表格型數(shù)據(jù),得到DataFrame。

        pd.read_json( ):讀取 json 數(shù)據(jù)
        # 讀取 json 數(shù)據(jù)
        df5 = pd.read_json('fake_useragent.json')
        df5.head()
        pd.read_clipboard( ):從剪切板讀取數(shù)據(jù)

        三、保存數(shù)據(jù)

        df.to_csv( ):保存到csv

        結(jié)果如下:

        df.to_excel( ):保存到 Excel

        結(jié)果如下:

        df.to_html():保存到html
        結(jié)果如下:


        點(diǎn)擊下方閱讀原文加入社區(qū)會員

        瀏覽 43
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評論
        圖片
        表情
        推薦
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            请播放黄色录像 | 色婷婷在线视频观看 | 特级西西WWW.444人体聚色 | 欧美精品成人片 | 91丝袜国产在线观看 | 操逼高潮喷水网站 | 9人成午夜电影 | 国产精品久久久久久久毛片 | 三级经典在线视频 | 美女自慰网站免费观看 |