【Python】Autoviz: 一行代碼搞定數(shù)據(jù)集探索并可視化
數(shù)據(jù)集各個特征有什么變化趨勢、各個特征之間有何關系,我們可以借助Matplotlib、Seaborn等諸多工具來可視化展示,那么有沒有一種工具能一次展示所有的關系了?
本文要介紹的Python工具Autoviz,一行代碼即可完成對數(shù)據(jù)集所有關系的探索 (Exploratory Data Analysis,EDA)。
安裝
pip?install?autoviz
一行代碼搞定數(shù)據(jù)探索
本次以探索鳶尾花 (iris)數(shù)據(jù)集為例子,數(shù)據(jù)集詳細介紹????鳶尾花數(shù)據(jù)集詳細介紹,大概是這樣
autoviz使用,
from?autoviz.AutoViz_Class?import?AutoViz_Class
#AutoViz實例化
AV?=?AutoViz_Class()
#一行代碼實現(xiàn)數(shù)據(jù)探索
dft?=?AV.AutoViz(
????filename='/Users/xmy/Desktop/jobs/py/iris.csv',??#讀入數(shù)據(jù)集,注意和dfte的區(qū)別
????sep=",",??#設置數(shù)據(jù)集分隔符,默認為逗號
????depVar="species",??#設置因變量
????dfte=None,??#傳入一個pandas.DataFrame,如果filename已設置,此處為None,反之亦然
????header=0,
????verbose=0,??#可選0,?1或者2,設置圖形的保存形式
????lowess=False,??#是否啟用lowess回歸,適合小數(shù)據(jù)量數(shù)據(jù)集,100,000行以上數(shù)據(jù)不建議用
????chart_format="svg",??#設置圖形保存格式
????max_rows_analyzed=150000,??#設置數(shù)據(jù)集待分析的行數(shù)
????max_cols_analyzed=30,??#設置數(shù)據(jù)集待分析的列數(shù)
)
結果輸出一部分為Dataset的簡單介紹,
結果輸出另一部分為大量可視化圖表,?




以上整個過程僅僅需要4.226秒
No categorical or boolean vars in data set. Hence no pivot plots...
No categorical or numeric vars in data set. Hence no bar charts.Time to run AutoViz \(in seconds\) = 4.226
###################### VISUALIZATION Completed ########################
參考:https://github.com/AutoViML/AutoViz
-END-
往期精彩回顧 本站qq群851320808,加入微信群請掃碼:
評論
圖片
表情
