盤點一個Pandas數(shù)據(jù)清洗題目
回復“資源”即可獲贈Python學習資料
大家好,我是皮皮。
一、前言
前幾天在Python白銀交流群有個叫【凍豺】的粉絲問了一道Python清洗數(shù)據(jù)的問題,這里拿出來給大家分享下,一起學習下。

如何才能把pandas serise里亂七八糟的字符清理干凈呢?
二、解決過程
【dcpeng】解答
這里給出了一個示例的代碼,使用了apply和lambda和正則表達式,一氣呵成,只需要稍微修改下,匹配自己的數(shù)據(jù)就可以了。
df['主營業(yè)務']=df['主營業(yè)務'].astype('str').apply(lambda?x:?re.sub('[0-9+,,.?!?、“”^_?::’‘''""()();;【】!!*?]+',?'',?x))

不過這個是通用的,也會把數(shù)字干掉,如果想適配自己的數(shù)據(jù),還需要稍微修改下。
這樣問題就完美解決了,另外的話,遇到特殊字符什么的,都可以優(yōu)先使用re.sub或者replace()函數(shù),事半功倍。
三、總結(jié)
大家好,我是皮皮。這篇文章主要分享了一個Pandas數(shù)據(jù)清洗題目,針對該問題給出了具體的解析和代碼演示,一共兩個方法,幫助粉絲順利解決了問題。相信肯定還有其他方法的,歡迎大家積極嘗試,如果有好方法,記得也分享給我噢,我?guī)椭窒淼饺豪?,大家一起學習交流!
最后感謝【凍豺】提問,感謝【dcpeng】和【月神】大佬給出的具體解析和代碼演示,感謝【馮誠】等人參與學習交流。
小伙伴們,快快用實踐一下吧!如果在學習過程中,有遇到任何問題,歡迎加我好友,我拉你進Python學習交流群共同探討學習。
-------------------?End?-------------------
往期精彩文章推薦:

歡迎大家點贊,留言,轉(zhuǎn)發(fā),轉(zhuǎn)載,感謝大家的相伴與支持
想加入Python學習群請在后臺回復【入群】
萬水千山總是情,點個【在看】行不行
評論
圖片
表情
