1. 再見,Matplotlib!

        共 3943字,需瀏覽 8分鐘

         ·

        2020-11-22 08:04

        如果你經(jīng)常使用Python進(jìn)行數(shù)據(jù)分析,那么對于Pandas一定不會(huì)陌生,但是Pandas除了在數(shù)據(jù)處理上大放異彩,隨著版本的不斷更新,Pandas的繪圖功能在某些情況下甚至要比Matplotlib更加適用,本文就將介紹如何用Pandas更快的進(jìn)行數(shù)據(jù)可視化!

          基本使用,學(xué)會(huì)制作套路

        首先我們使用pandas隨機(jī)生成示例數(shù)據(jù)

        import pandas as pd
        df= pd.DataFrame(np.random.rand(84), columns=['A','B','C','D'])

        現(xiàn)在只要一行代碼,即可完成柱狀圖的繪制df.plot.bar()

        同樣是這個(gè)圖,如果使用Matplotlib制作的話?

        import matplotlib.pyplot as plt

        x = np.array(df.index.tolist())
        y1 = df.A.tolist()
        y2 = df.B.tolist()
        y3 = df.C.tolist()
        y4 = df.D.tolist()
        y5 = df.E.tolist()

        total_width, n = 0.85
        width = total_width / n
        x = x - (total_width - width) / 2

        plt.bar(x, y1,  width=width, label='A')
        plt.bar(x + width, y2, width=width, label='B')
        plt.bar(x + 2*width, y3, width=width, label='C')
        plt.bar(x + 3*width, y4, width=width, label='D')
        plt.bar(x + 4*width, y5, width=width, label='E')

        plt.legend()
        plt.show()

        可以看到,雖然結(jié)果差不多,不過代碼量瞬間就上去了,如果你是Matplotlib高手可能會(huì)用更簡潔的代碼制作,但一定沒有pandas一行代碼來的方便!

          更多圖表,一覽Pandas強(qiáng)大

        下面我們繼續(xù)看看,一行pandas代碼能做出哪些常用的圖!

        堆疊柱狀圖,添加一個(gè)參數(shù)即可df.plot.barh(stacked=True)

        堆疊面積圖df.plot.area(stacked=True,alpha = 0.9)

        密度估計(jì)圖df.plot.kde()

        直方圖的話,我們需要換一組數(shù)據(jù)

        df = pd.DataFrame({'a': np.random.randn(1000) + 1,
                           'b': np.random.randn(1000),
                           'c': np.random.randn(1000) - 1},
                          columns=['a''b''c'])

        下面,兩行代碼就能制作堆疊/不堆疊的直方圖

        df.plot.hist(stacked=True, bins=20)
        df.plot.hist(alpha=0.5)

        當(dāng)然包括什么箱線圖、散點(diǎn)圖等常用圖形,都可以通過一行代碼輕松搞定?

        df.plot.box()
        df['value'].plot()
        df.plot.scatter()
        data.plot.hexbin(x='A',y='B')

        制作子圖可以嗎? 只需要設(shè)置subplots=True就行了,子圖位置、大小調(diào)整方式和Matplotlib設(shè)置一樣!

        data.plot(subplots=True,layout=(32), figsize=(158));

        更多的圖表,本文就不再一一展示,從官方文檔中可以看到(我的版本是0.23.4),Pandas一共支持14種常見圖表的直接繪制,感興趣的讀者可以進(jìn)一步閱讀官方文檔!

        其實(shí)對圖片敏感的讀者可以發(fā)現(xiàn),這不就是基于Matplotlib做出來的嗎?所以它支持像調(diào)整Matplotlib圖表一樣,在作圖時(shí)修改一些參數(shù)來控制圖片的大小、圖例、顏色、位置等因素。

          修改主題,解鎖酷炫樣式

        最后,如果你覺得默認(rèn)生成的圖表不夠好看(我是這么覺得),而它又是基于Matoplotlib制作的,所以我們可以使用同樣套著Matplotlib殼的Seaborn調(diào)色板,從而調(diào)整圖片主題。

        還是上面的數(shù)據(jù),下面讓我們換個(gè)主題重新繪制

        import seaborn as sns
        sns.set_palette("pastel", 8)
        import seaborn as sns
        sns.set_palette("Blues_r", 8)
        import seaborn as sns
        sns.set_palette("magma", 8)

        上面是我常用的幾種配色,更多的顏色搭配你可以在seaborn相關(guān)文檔中找到并使用!

        以上就是關(guān)于如何在使用Python更快速的對數(shù)據(jù)進(jìn)行可視化,我們可以發(fā)現(xiàn),在很多情況下,使用Pandas直接進(jìn)行繪圖會(huì)顯得更加高效便捷!

        但本文的目的并不是讓你徹底放棄Matplotlib,在使用pandas繪圖時(shí)很多參數(shù)設(shè)置都需要參考Matplotlib,所以我們應(yīng)該在點(diǎn)亮這項(xiàng)技能后,能根數(shù)據(jù)和場景的不同,選擇一個(gè)最合適的工具來完成可視化!

        -END-

        文末推薦一本書《趣學(xué)Python算法100例專為Python初學(xué)者量身打造!詳解100個(gè)趣味編程算法實(shí)例,培養(yǎng)編程興趣,拓寬編程思維,提高編程能力和算法設(shè)計(jì)能力。實(shí)例代碼完備,注釋詳盡,均通過了測試可以正常運(yùn)行,點(diǎn)擊下方圖片可以直達(dá)購買頁面查看本書詳情!

        作為早起Python粉絲的福利,我將送出上方圖書5本。但由于留言功能暫時(shí)不能使用,如果你想?yún)⒓踊顒?dòng),請掃碼添加早小起微信?,并備注【送書】

        瀏覽 140
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評論
        圖片
        表情
        推薦
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
          
          

            1. 国产福利在线观看视频 | 久久欧美一区二区三区 | 99re免费视频精品全部 | 日日操天天摸日韩精品 | 国产精品日韩欧美在线第3页天美 |