1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        真大神!1行代碼實現(xiàn)數(shù)據(jù)集可視化、分析與比較 !

        共 1715字,需瀏覽 4分鐘

         ·

        2020-07-28 12:14

        點擊關注上方“SQL數(shù)據(jù)庫開發(fā)”,

        設為“置頂或星標”,第一時間送達干貨

        你是否也在朋友圈看過這樣的小廣告:

        0ca7f0dee26056c1e1f0fbae7612718f.webp

        「你要悄悄學Python,然后驚艷所有人?!?/p>

        現(xiàn)在,GitHub上一位博主告訴你:不用學,用sweetviz就行。

        這是一個基于Python編寫的數(shù)據(jù)分析軟件,只要掌握3種函數(shù)用法,一行Python代碼就能實現(xiàn)數(shù)據(jù)集可視化、分析與比較。

        我們以Titanic數(shù)據(jù)集為例,輸入一行代碼:

        b42d147bcaf71003c9e521167dbb3c9e.webp

        一個1080p的清晰網(wǎng)頁界面就出現(xiàn)在了眼前。

        3249bb2d7059a43f386881110b96141c.webp

        不僅根據(jù)性別、年齡等不同欄目縱向分析數(shù)據(jù),每個欄目下還有眾數(shù)、最大值、最小值等橫向對比。

        所有輸入的數(shù)值、文本信息都會被自動檢測,并進行數(shù)據(jù)分析、可視化和對比,最后幫你進行數(shù)據(jù)總結。

        在這樣的數(shù)據(jù)分析下,結果一目了然。

        50ce2c72874e77c2e5175a9f4d9af9ee.webp

        Titanic數(shù)據(jù)集部分功能細節(jié)展示

        這樣的效果,是基于3個主函數(shù)實現(xiàn)的。

        3種函數(shù)用法

        analyze()丨數(shù)據(jù)分析

        dbad0de14ba01f2e591f274ad52ae00a.webp

        數(shù)據(jù)分析函數(shù)中,有4個參數(shù)source,target_feat,feat_cfg和pairwise_analysis需要被設置。

        source:以pandas中的DataFrame數(shù)據(jù)結構、或是DataFrame中的某一類字符串作為分析對象。

        target_feat:需要被標記為目標對象的字符串。

        feat_cfg:需要被跳過、或是需要被強制轉換為某種數(shù)據(jù)類型的特征。

        pairwise_analysis:相關性和其他類型的數(shù)據(jù)關聯(lián)可能需要花費較長時間。如果超過了某個閾值,就需要設置這個參數(shù)為on或者off,以判斷是否需要分析數(shù)據(jù)相關性。

        f06c053c1ecec3c221bc9fd927baf042.webp

        數(shù)據(jù)相關性分析效果,可能需要花費一定時間

        compare()丨兩個數(shù)據(jù)集比較

        86f79836e8f9e552bb5a8e9719984419.webp

        如果想要對兩個數(shù)據(jù)集進行對比分析,就使用這個比較函數(shù)。

        例子中的my_dataframe和test_df是兩個數(shù)據(jù)集,分別被命名為訓練數(shù)據(jù)和測試數(shù)據(jù)。

        除了這個被插入的數(shù)據(jù)集,剩余的參數(shù)與analyze中的一致。

        compare_intra()丨數(shù)據(jù)集欄目比較

        01251be1da4518ab189b2364ff3b31a6.webp

        想要對數(shù)據(jù)集中某個欄目下的參數(shù)進行分析,就采用這個函數(shù)進行。

        例如,如果需要比較“性別”欄目下的“男性”和“女性”,就可以采用這個函數(shù)。

        理解這幾種函數(shù)的變量后,一行代碼就能實現(xiàn)Python數(shù)據(jù)分析。

        使用指南

        sweetviz支持Python 3.6+和Pandas0.25.3+環(huán)境,配置好環(huán)境后,使用萬能的pip下載安裝包:

        ccffc36f19a4b55b1572431b4a3681a1.webp

        但有一個條件需要注意:sweetviz需要用到基礎「os」模塊。所以,如果你在使用類似于Google Colab的自定義環(huán)境,可能會無法使用sweetviz,目前開發(fā)者也在探索解決方案。

        下載好后,使用import快速導入sweetviz,就可以開始使用了~

        cc9c8011fb21072148ab43600c0ce36c.webp

        sweetviz使用的原理是,使用一行代碼,生成一個數(shù)據(jù)報告的對象(其中,my_dataframe是pandas中的DataFrame,一種表格型數(shù)據(jù)結構)

        a9c7844e125edc949f4431fc15b10c22.webp

        在這里,analyze函數(shù)可以被替換為compare或compare_intra函數(shù),使用方法在上面已經(jīng)給出,全看你需要什么類型的數(shù)據(jù)報告了。

        最后,用show一鍵輸出。(結果會以SWEETVIZ_REPORT.html網(wǎng)頁形式展示)

        a24501fb1e4a7440556420dd53761a56.webp

        由于在這個過程中,實際上真正需要編寫的只有第二行的生成對象代碼,可以說是名副其實的1行代碼生成數(shù)據(jù)分析。

        展示界面也非常簡潔,只要鼠標停留在感興趣的欄目上,右側就會自動顯示出數(shù)據(jù)分析的圖表和報告。

        09f674e156326e71f57f2b84c6604085.webp

        感興趣的小伙伴,快戳下方的傳送門用起來吧~

        傳送門:

        https://github.com/fbdesignpro/sweetviz

        蕭簫 發(fā)自 凹非寺
        量子位 報道 | 公眾號 QbitAI
        ——End——

        后臺回復關鍵字:1024,獲取一份精心整理的技術干貨后臺回復關鍵字:進群,帶你進入高手如云的交流群。推薦閱讀

        這是一個能學到技術的公眾號,歡迎關注點擊「閱讀原文」了解SQL訓練營
        瀏覽 44
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            好男人一区二区三区在线观看 | 日韩中文字幕有码 | 欧美日韩成人在线视频 | 插美女小穴黄色视频网站免费观看 | 美女福利视频网 | 大香蕉网在线 | 黄色一级大片在线免费看国产 | 操日本美女逼 | 69av在线观看视频 | 打开双腿扒开灌红酒play |