99热123,国内伊人,极品国模叶桐啪啪大尺度,亚洲图片乱伦小说,18岁禁止入内,91久久久无码精品不卡A片直播,囯产精品久久久久久久久久粉嫩,粉嫩AV无码一区二区三区软件

公眾號：尤而小屋
作者：Peter
編輯：Peter

在以前的一篇文章? ?圖解Pandas的排序機(jī)制sort_values? ?詳細(xì)介紹了如何使用pandas的內(nèi)置函數(shù)sort_values來實(shí)現(xiàn)數(shù)據(jù)的排序。本文講解的是如何使用自定義方式來實(shí)現(xiàn)排序：

映射關(guān)系實(shí)現(xiàn)
CategoricalDtype類型實(shí)現(xiàn)

模擬數(shù)據(jù)

先模擬一份簡單的數(shù)據(jù)：

import?pandas?as?pd
import?numpy?as?np

df?=?pd.DataFrame({
????"nick":["aaa","bbb","aba","abc","cac","ccc"],??#?昵稱
????"math":[100,120,130,111,100,128],??#?數(shù)學(xué)
????"english":[140,80,120,90,125,116],??#?英語
????"size":["S","M","L","XS","XL","L"]???#?衣服大小
????})

df

sort_values

DataFrame.sort_values(by,?
???????????????axis=0,?
???????????????ascending=True,?
???????????????inplace=False,?
???????????????kind='quicksort',?
???????????????na_position='last',?# last，first；默認(rèn)是last
???????????????ignore_index=False,?
???????????????key=None)

參數(shù)的具體解釋為：

by：表示根據(jù)什么字段或者索引進(jìn)行排序，可以是一個或多個
axis：排序是在橫軸還是縱軸，默認(rèn)是縱軸axis=0
ascending：排序結(jié)果是升序還是降序，默認(rèn)是升序
inplace：表示排序的結(jié)果是直接在原數(shù)據(jù)上的就地修改還是生成新的DatFrame
kind：表示使用排序的算法，快排quicksort,，歸并mergesort，堆排序heapsort，穩(wěn)定排序stable ，默認(rèn)是：快排quicksort
na_position：缺失值的位置處理，默認(rèn)是最后，另一個選擇是首位
ignore_index：新生成的數(shù)據(jù)幀的索引是否重排，默認(rèn)False（采用原數(shù)據(jù)的索引）
key：排序之前使用的函數(shù)

下面通過幾個簡單的例子來復(fù)習(xí)下sort_values的使用：

單個字段排序

通過nick字段排序，字符串是根據(jù)字母的ASCII碼；默認(rèn)是從小到大的升序。第一個字母相同，則比較第二個，類推：

根據(jù)數(shù)值的大小來升序排列：

可以將排序方式改為降序：

多個字段排序

多個字段的同時排序，默認(rèn)也是升序。當(dāng)?shù)谝粋€字段的取值相同，再根據(jù)第二個字段來升序排列

給不同的字段指定不同的排序方式：

再完整地對比下兩種不同的方式：

上面的就是sort_values方法的常見排序方式。

自定義排序

使用sort_values方法排序的時候都是內(nèi)置的字母或者數(shù)值型數(shù)據(jù)的大小直接來排序，當(dāng)遇到下面的情況，該如何操作？

當(dāng)我們根據(jù)衣服的大小size來排序，得到的結(jié)果是：

明顯這樣的排序方式不是我們理想中的樣子，在我們的認(rèn)知中：

XS：很小
S：小
M：中等
L：大
XL：超大

該如何解決這個問題？提供兩種方式：

方法1：通過映射

1、先找到每個size的順序?qū)?yīng)的數(shù)值大小

2、生成新的字段order

3、我們對order進(jìn)行排序

方法2：使用CategoricalDtype

CategoricalDtype是具有類別和順序的分類數(shù)據(jù)的類型，能夠創(chuàng)建我們自定義的排序數(shù)據(jù)類型。官網(wǎng)地址：

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.CategoricalDtype.html

1、指定一個分類的數(shù)據(jù)類型CategoricalDtype

category_size?=?pd.CategoricalDtype(
????['XS',?'S',?'M',?'L',?'XL'],?
????ordered=True)

category_size

2、將size字段設(shè)置成上面的CategoricalDtype類型

3、我們直接對size使用sort_values就可以達(dá)到我們的目的，和上面的map映射的效果是相同的

而且通過查看df的數(shù)據(jù)類型，我們也看到size的類型是category：


往期精彩回顧




適合初學(xué)者入門人工智能的路線及資料下載
機(jī)器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印
機(jī)器學(xué)習(xí)在線手冊
深度學(xué)習(xí)筆記專輯
《統(tǒng)計(jì)學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯
AI基礎(chǔ)下載
黃海廣老師《機(jī)器學(xué)習(xí)課程》視頻課
黃海廣老師《機(jī)器學(xué)習(xí)課程》711頁完整版課件
本站qq群955171419，加入微信群請掃碼：

【Python】Pandas數(shù)據(jù)排序?qū)崿F(xiàn)