日本操逼黄色大片,人人操学生妹,特级西西444Ww高清大胆,伊人精品视频在线观看,久久国产乱子伦精品一区二区,免费伊人大香蕉,天干天干天啪啪夜爽爽av,大鸡巴欧美

↑?關注 + 星標?，每天學Python新技能
后臺回復【大禮包】送你Python自學大禮包

我們知道數(shù)據(jù)是一項寶貴的資產(chǎn)，近年來經(jīng)歷了指數(shù)級增長。但是原始數(shù)據(jù)通常不能立即使用，它需要進行大量清理和轉(zhuǎn)換。

Pandas 是 Python 的數(shù)據(jù)分析和操作庫，它有多種清理數(shù)據(jù)的方法和函數(shù)。在本文中，我將做5個示例來幫助大家掌握數(shù)據(jù)清理技能。

這是一個包含臟數(shù)據(jù)的示例數(shù)據(jù)框讓我們看看可以做些什么來使這個數(shù)據(jù)集變得干凈。

刪除列是使用 drop 函數(shù)的簡單操作。除了寫列名外，我們還需要指定軸參數(shù)的值，因為 drop 函數(shù)用于刪除行和列。最后，我們可以使用 inplace 參數(shù)來保存更改。

import?pandas?as?pd
df.drop("Unnamed:?0",?axis=1,?inplace=True)

我們有多種選擇將日期值轉(zhuǎn)換為適當?shù)母袷?。一種更簡單的方法是使用 astype 函數(shù)來更改列的數(shù)據(jù)類型。它能夠處理范圍廣泛的值并將它們轉(zhuǎn)換為整潔、標準的日期格式。

df["Date"]?=?df["Date"].astype("datetime64[ns]")

關于名稱列，我們首先需要解決如下問題：

df["Name"].str.split(",",?expand=True)

然后，我將取第二列與第一列結(jié)合起來，中間有一個空格。最后一步是使用 lower 函數(shù)將字母轉(zhuǎn)換為小寫。

df["Name"]?=?(df["Name"].str.split(",",?expand=True)[1]?+?"?"?+?df["Name"].str.split(",",?expand=True)[0]).str.lower()

支付Payment的數(shù)據(jù)類型是不能用于數(shù)值分析的。在將其轉(zhuǎn)換為數(shù)字數(shù)據(jù)類型(即整數(shù)或浮點數(shù))之前，我們需要刪除美元符號并將第一行中的逗號替換為點。

我們可以使用 Pandas 在一行代碼中完成所有這些操作

df["Payment"]?=?df["Payment"].str[1:].str.replace(",",?".").astype("float")

Note 列中的一些字符也需要刪除。在處理大型數(shù)據(jù)集時，可能很難手動替換它們。

我們可以做的是刪除非字母數(shù)字字符（例如？、！、-、. 等）。在這種情況下也可以使用 replace 函數(shù)，因為它接受正則表達式。

如果我們只想要字母字符，下面是我們?nèi)绾问褂锰鎿Q函數(shù)：

df["Note"].str.replace('[^a-zA-Z]',?'')
0??????Unhappy
1????Satisfied
2??????Neutral
3??????Unhappy
4??????Neutral
Name:?Note,?dtype:?object

如果我們想要字母和數(shù)字（即字母數(shù)字），我們需要在我們的正則表達式中添加數(shù)字：

df["Note"].str.replace('[^a-zA-Z0-9]',?'')
0??????Unhappy
1????Satisfied
2??????Neutral
3??????Unhappy
4??????Neutral0
Name:?Note,?dtype:?object

請注意，這次沒有刪除最后一行中的 0，我只需選擇第一個選項。如果我還想在刪除非字母數(shù)字字符后將字母轉(zhuǎn)換為小寫

df["Note"]?=?df["Note"].str.replace('[^a-zA-Z]',?'').str.lower()

與初始形式相比，數(shù)據(jù)集看起來要好得多。當然，它是一個簡單的數(shù)據(jù)集，但這些清理操作在處理大型數(shù)據(jù)集時肯定會對你有所幫助。

推薦閱讀
爬取網(wǎng)站內(nèi)容，合并Excel數(shù)據(jù)…推薦一個自動化辦公神器！
分享一個我最近用的國產(chǎn)神器， ApiPost！
來了，最強 Python 學習資料（全彩打印）

您看此文用???分??秒，轉(zhuǎn)發(fā)只需1秒哦~

值得收藏！這是 Python 數(shù)據(jù)預處理最頻繁使用的5個技巧！