1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        【Python】Pandas數(shù)據(jù)排序?qū)崿F(xiàn)

        共 2101字,需瀏覽 5分鐘

         ·

        2022-01-10 02:36

        公眾號:尤而小屋
        作者:Peter
        編輯:Peter

        在以前的一篇文章? ?圖解Pandas的排序機(jī)制sort_values? ?詳細(xì)介紹了如何使用pandas的內(nèi)置函數(shù)sort_values來實(shí)現(xiàn)數(shù)據(jù)的排序。本文講解的是如何使用自定義方式來實(shí)現(xiàn)排序:

        • 映射關(guān)系實(shí)現(xiàn)
        • CategoricalDtype類型實(shí)現(xiàn)

        模擬數(shù)據(jù)

        先模擬一份簡單的數(shù)據(jù):

        import?pandas?as?pd
        import?numpy?as?np

        df?=?pd.DataFrame({
        ????"nick":["aaa","bbb","aba","abc","cac","ccc"],??#?昵稱
        ????"math":[100,120,130,111,100,128],??#?數(shù)學(xué)
        ????"english":[140,80,120,90,125,116],??#?英語
        ????"size":["S","M","L","XS","XL","L"]???#?衣服大小
        ????})

        df

        sort_values

        DataFrame.sort_values(by,?
        ???????????????axis=0,?
        ???????????????ascending=True,?
        ???????????????inplace=False,?
        ???????????????kind='quicksort',?
        ???????????????na_position='last',?# last,first;默認(rèn)是last
        ???????????????ignore_index=False,?
        ???????????????key=None)

        參數(shù)的具體解釋為:

        • by:表示根據(jù)什么字段或者索引進(jìn)行排序,可以是一個或多個
        • axis:排序是在橫軸還是縱軸,默認(rèn)是縱軸axis=0
        • ascending:排序結(jié)果是升序還是降序,默認(rèn)是升序
        • inplace:表示排序的結(jié)果是直接在原數(shù)據(jù)上的就地修改還是生成新的DatFrame
        • kind:表示使用排序的算法,快排quicksort,,歸并mergesort, 堆排序heapsort,穩(wěn)定排序stable ,默認(rèn)是 :快排quicksort
        • na_position:缺失值的位置處理,默認(rèn)是最后,另一個選擇是首位
        • ignore_index:新生成的數(shù)據(jù)幀的索引是否重排,默認(rèn)False(采用原數(shù)據(jù)的索引)
        • key:排序之前使用的函數(shù)

        下面通過幾個簡單的例子來復(fù)習(xí)下sort_values的使用:

        單個字段排序

        通過nick字段排序,字符串是根據(jù)字母的ASCII碼;默認(rèn)是從小到大的升序。第一個字母相同,則比較第二個,類推:

        根據(jù)數(shù)值的大小來升序排列:

        可以將排序方式改為降序:

        多個字段排序

        多個字段的同時排序,默認(rèn)也是升序。當(dāng)?shù)谝粋€字段的取值相同,再根據(jù)第二個字段來升序排列

        給不同的字段指定不同的排序方式:

        再完整地對比下兩種不同的方式:

        上面的就是sort_values方法的常見排序方式。

        自定義排序

        使用sort_values方法排序的時候都是內(nèi)置的字母或者數(shù)值型數(shù)據(jù)的大小直接來排序,當(dāng)遇到下面的情況,該如何操作?

        當(dāng)我們根據(jù)衣服的大小size來排序,得到的結(jié)果是:

        明顯這樣的排序方式不是我們理想中的樣子,在我們的認(rèn)知中:

        • XS:很小
        • S:小
        • M:中等
        • L:大
        • XL:超大

        該如何解決這個問題?提供兩種方式:

        方法1:通過映射

        1、先找到每個size的順序?qū)?yīng)的數(shù)值大小

        2、生成新的字段order

        3、我們對order進(jìn)行排序

        方法2:使用CategoricalDtype

        CategoricalDtype是具有類別和順序的分類數(shù)據(jù)的類型,能夠創(chuàng)建我們自定義的排序數(shù)據(jù)類型。官網(wǎng)地址:

        https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.CategoricalDtype.html

        1、指定一個分類的數(shù)據(jù)類型CategoricalDtype

        category_size?=?pd.CategoricalDtype(
        ????['XS',?'S',?'M',?'L',?'XL'],?
        ????ordered=True)

        category_size

        2、將size字段設(shè)置成上面的CategoricalDtype類型

        3、我們直接對size使用sort_values就可以達(dá)到我們的目的,和上面的map映射的效果是相同的

        而且通過查看df的數(shù)據(jù)類型,我們也看到size的類型是category:

        往期精彩回顧




        站qq群955171419,加入微信群請掃碼:
        瀏覽 62
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            双女主电影大尺度日剧她 | 东京热高清无码 | 成人精品一区日本无码网站45P | 久久亚洲天堂网 | 黑粗硬大欧美在线视频免费 | 国免产女人18毛片水真多1 | 国产白丝一区二区三区 | 插插电影 | 女人与拘性猛交视频 | 久久婷婷视频 |