1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        對比Excel,學習pandas數據透視表

        共 3610字,需瀏覽 8分鐘

         ·

        2021-06-08 04:21


        導讀:更簡單了呢~


        作者:黃同學
        來源:凹凸數據(ID:alltodata)




        01 Excel中做數據透視表


        1. 選中整個數據源


        2. 依次點擊“插入”—“數據透視表”


        3. 選擇在Excel中的哪個位置,插入數據透視表


        4. 然后根據實際需求,從不同維度展示結果


        5. 結果如下



        02 pandas用pivot_table()做數據透視表


        1. 語法格式

        pd.pivot_table(data,index=None,columns=None,
                      values=None,aggfunc='mean',
                      margins=False,margins_name='All',
                      dropna=True,fill_value=None)

        2. 對比excel,說明上述參數的具體含義


        參數說明:

        • data 相當于Excel中的"選中數據源";
        • index 相當于上述"數據透視表字段"中的行;
        • columns 相當于上述"數據透視表字段"中的列;
        • values 相當于上述"數據透視表字段"中的值;
        • aggfunc 相當于上述"結果"中的計算類型;
        • margins 相當于上述"結果"中的總計;
        • margins_name 相當于修改"總計"名,為其它名稱。

        下面幾個參數,用的較少,記住干嘛的,等以后需要就百度。

        • dropna 表示是否刪除缺失值,如果為True時,則把一整行全作為缺失值刪除;
        • fill_value 表示將缺失值,用某個指定值填充。



        03 案例說明


        1. 求出不同品牌下,每個月份的銷售數量之和

        ① 在Excel中的操作結果如下


        ② 在pandas中的操作如下

        df = pd.read_excel(r"C:\Users\黃偉\Desktop\pivot_table.xlsx")
        display(df.sample(5))

        df.insert(1,"月份",df["銷售日期"].apply(lambda x:x.month))
        display(df.sample(5))

        df1 = pd.pivot_table(df,index="品牌",columns="月份",
                            values="銷售數量",aggfunc=np.sum)
        display(df1)

        結果如下:


        2. 求出不同品牌下,每個地區(qū)、每個月份的銷售數量之和

        ① 在Excel中的操作結果如下


        ② 在pandas中的操作如下

        df = pd.read_excel(r"C:\Users\黃偉\Desktop\pivot_table.xlsx")
        display(df.sample(5))

        df.insert(1,"月份",df["銷售日期"].apply(lambda x:x.month))
        display(df.sample(5))

        df1 = pd.pivot_table(df,index="品牌",columns=["銷售區(qū)域","月份"],
                            values="銷售數量",aggfunc=np.sum)
        display(df1)

        結果如下:


        3. 求出不同品牌不同地區(qū)下,每個月份的銷售數量之和

        ① 在Excel中的操作結果如下


        ② 在pandas中的操作如下

        df = pd.read_excel(r"C:\Users\黃偉\Desktop\pivot_table.xlsx")
        display(df.sample(5))

        df.insert(1,"月份",df["銷售日期"].apply(lambda x:x.month))
        display(df.sample(5))

        df1 = pd.pivot_table(df,index=["品牌","銷售區(qū)域"],columns="月份",
                            values="銷售數量",aggfunc=np.sum)
        display(df1)

        結果如下:


        4. 求出不同品牌下的“銷售數量之和”與“貨號計數”

        ① 在Excel中的操作結果如下


        ② 在pandas中的操作如下

        df = pd.read_excel(r"C:\Users\黃偉\Desktop\pivot_table.xlsx")
        display(df.sample(5))

        df.insert(1,"月份",df["銷售日期"].apply(lambda x:x.month))
        display(df.sample(5))

        df1 = pd.pivot_table(df,index="品牌",columns="月份",
                            values=["銷售數量","貨號"],
                            aggfunc={"銷售數量":"sum","貨號":"count"},
                            margins=True,margins_name="總計")
        display(df1)

        結果如下:



        延伸閱讀??

        利用Python進行數據分析》(原書第2版)

        干貨直達??


        更多精彩??

        在公眾號對話框輸入以下關鍵詞
        查看更多優(yōu)質內容!

        PPT | 讀書 | 書單 | 硬核 | 干貨 | 講明白 | 神操作
        大數據 | 云計算 | 數據庫 | Python | 爬蟲 | 可視化
        AI | 人工智能 | 機器學習 | 深度學習 | NLP
        5G | 中臺 | 用戶畫像 1024 | 數學 | 算法 數字孿生

        據統(tǒng)計,99%的大咖都關注了這個公眾號
        ??
        瀏覽 18
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            国产一级卖婬片AAAAA痧女 | 成人一区二区三区久久精品嫩草 | 午夜精品18 视频国产 | 欧美888XXⅩ成人片 | 被公牛日到了高潮爽文 | 欧美女人日b | 美女嫩逼逼 | 老司机一区二区 | 女同一区二区免费aⅴ | 波多野结衣无码视频在线观看 |