數(shù)據(jù)分析應(yīng)該用什么?6款常用工具對(duì)比
大家好,歡迎來(lái)到 Crossin的編程教室~ “數(shù)據(jù)分析” 可謂是當(dāng)今社會(huì)一個(gè)超級(jí)火爆的崗位,不論是科班的,還是非科班的,都想從事這個(gè)行業(yè),畢竟都覺(jué)得這個(gè)行業(yè)賺錢多嘛。 “數(shù)據(jù)分析” 大致可以分為業(yè)務(wù)和技術(shù)兩個(gè)方向,不管你是從事哪個(gè)方向,都對(duì)技能有一定的要求。業(yè)務(wù)方向,像數(shù)據(jù)運(yùn)營(yíng)、商業(yè)分析、產(chǎn)品經(jīng)理等,對(duì)技術(shù)的要求相對(duì)來(lái)說(shuō)低一點(diǎn),編程工具你只要會(huì)用即可(肯定是越精通越好)。技術(shù)方向,像數(shù)據(jù)算法工程師、數(shù)據(jù)挖掘工程師等,對(duì)技術(shù)的要求就很高了,必須要有很好的編程能力。 工欲善其事必先利其器 ,說(shuō)起數(shù)據(jù)分析工具,大家都會(huì)感覺(jué)很迷茫,有這么多數(shù)據(jù)分析工具,我應(yīng)該學(xué)習(xí)哪個(gè)工具,它們之間的區(qū)別到底是什么?今天我們從 “工具” 層面帶大家盤點(diǎn)一下,作為一名數(shù)據(jù)分析師,應(yīng)該學(xué)習(xí)哪些工具呢?
說(shuō)起用什么做數(shù)據(jù)分析,很多人的腦海中都會(huì)不約而同地想到Python、R、SQL、Hive等看似很難掌握的數(shù)據(jù)分析工具,它們就像數(shù)據(jù)分析路上的攔路虎一樣,讓人踟躕不前。 其實(shí),在眾多的數(shù)據(jù)分析工具中,Excel屬于最常用、最基礎(chǔ)、最易上手的一款數(shù)據(jù)分析工具。Excel的功能十分強(qiáng)大,它不僅提供了眾多的數(shù)據(jù)處理功能,像Excel函數(shù)能夠幫助我們做數(shù)據(jù)整理,數(shù)據(jù)透視表幫助我們快速、高效的做各種維度分析,形形色色的圖表能幫我們形象地展示出數(shù)據(jù)背后隱藏的規(guī)律,同時(shí)Excel還有很專業(yè)的數(shù)據(jù)分析工具庫(kù),包括描述性統(tǒng)計(jì)分析、相關(guān)系數(shù)分析等。 Excel對(duì)于轉(zhuǎn)行數(shù)據(jù)分析的小白來(lái)說(shuō),應(yīng)該是最友好的。大家都知道“轉(zhuǎn)行”其實(shí)是一件很困難的事兒,但是你學(xué)會(huì)了Excel,是完全可以找到一份“數(shù)據(jù)”相關(guān)的工作的,只有踏進(jìn)數(shù)據(jù)領(lǐng)域,你才有可能從事其它更多的數(shù)據(jù)崗位。
Tableau是三位斯坦福人 Dr. Pat Hanrahan, Dr. Chris Stotle, Christian Chabot 于2003年成立的,這是一款交互式數(shù)據(jù)可視化軟件,它的本質(zhì)其實(shí)也是Excel的數(shù)據(jù)透視表和數(shù)據(jù)透視圖。 Tableau也是很好的延續(xù)了Excel,只需要簡(jiǎn)單地拖拽,就能很快地實(shí)現(xiàn)數(shù)據(jù)的分類匯總,然后拖拽實(shí)現(xiàn)各種圖形的繪制,并且可以實(shí)現(xiàn)不同圖表之間的聯(lián)合。 Tableau同時(shí)支持?jǐn)?shù)百種數(shù)據(jù)連接器,包括在線分析處理(OLAP)和大數(shù)據(jù)(例如NoSQL,Hadoop)以及云數(shù)據(jù),至少現(xiàn)在你能學(xué)到的數(shù)據(jù)庫(kù)軟件,Tableau基本都能夠?qū)崿F(xiàn)與其數(shù)據(jù)之間的互動(dòng)。
Power-BI是一款(BI)商業(yè)智能軟件,于2014年發(fā)布,旨在為用戶提供交互式的可視化和商業(yè)智能,簡(jiǎn)單的數(shù)據(jù)共享,數(shù)據(jù)評(píng)估和可擴(kuò)展的儀表板等功能。。 大家可能都知道,Power BI以前是一款Excel插件,依附于Excel,比如Power Query,PowerPrivot, Power View和Power Map等,這些插件讓Excel如同裝上了翅膀,瞬間高大上,慢慢地就發(fā)展成為現(xiàn)在的Power BI數(shù)據(jù)可視化工具。 Power BI 簡(jiǎn)單且快速,能夠從 Excel電子表格或本地?cái)?shù)據(jù)庫(kù)創(chuàng)建圖表。同時(shí)Power BI也是可靠的、企業(yè)級(jí)的,可進(jìn)行豐富的建模和實(shí)時(shí)分析,及自定義開(kāi)發(fā)。因此它既是你的個(gè)人報(bào)表和可視化工具,還可用項(xiàng)目、部門或整個(gè)企業(yè)背后的分析和決策引擎。Power BI的分析功能很強(qiáng)大,它的PowerPivot 和DAX語(yǔ)言,讓我們能夠編寫類似Excel中的公式,來(lái)進(jìn)行復(fù)雜的高級(jí)分析。 同時(shí),無(wú)論你的數(shù)據(jù)是簡(jiǎn)單的 Excel電子表格,還是基于云和本地混合數(shù)據(jù)倉(cāng)庫(kù)的集合, Power BI都可以讓你輕松地連接到數(shù)據(jù)源,直觀看到或發(fā)現(xiàn)數(shù)據(jù)的價(jià)值,與任何所希望的人進(jìn)行共享。 最后我們簡(jiǎn)單說(shuō)說(shuō)Power BI的組成部分,大家可以自行下去查看學(xué)習(xí)。 Power BI 包含 Windows 桌面應(yīng)用程序(稱為 Power BI Desktop )、聯(lián)機(jī) SaaS (軟件即服務(wù))服務(wù)(稱為 Power BI 服 務(wù)),及移動(dòng) Power BI 應(yīng) 用(可在 Windows 手機(jī)和平板電腦及 iOS 和 Android 設(shè)備上使用)。 PowerBI 有三個(gè)用于不同場(chǎng)景的組件: PowerQuery (數(shù)據(jù)處理組件), PowerPivot (輕量級(jí)建模組件), PowerBI Desktop (獨(dú)立數(shù)據(jù)可視化程序)。
帆軟是業(yè)內(nèi)做報(bào)表比較久的一家公司,使用類excel風(fēng)格的界面,可添加圖表和數(shù)據(jù)源,也可實(shí)現(xiàn)大屏效果。 其實(shí)它的類Excel風(fēng)格界面,應(yīng)該是它區(qū)別于Tableau工具的一個(gè)很重要的點(diǎn)。FineReport 通過(guò)直接連接到各種數(shù)據(jù)庫(kù),就能方便快捷地自定義各種樣式,從而制作周報(bào)、月報(bào)和季報(bào)、年報(bào)。 用過(guò)FineReport 的朋友,還會(huì)有另外一種體會(huì),它的圖形效果比Tableau要酷炫的多,操作起來(lái)同樣也是那樣的方便。 另外,F(xiàn)ineReport 的個(gè)人版本是完全免費(fèi)的,并且所有功能都是開(kāi)放的,大家趕緊下去試試吧。
其實(shí)不管是Excel,還是介紹的三款BI工具,它們都是為了執(zhí)行特定功能,而設(shè)計(jì)出來(lái)的。如果說(shuō)某一天,既定功能不能很好,或者說(shuō)不能滿足你的需求,那么應(yīng)該怎么辦呢? 這就需要我們了解,并學(xué)習(xí)一點(diǎn)編程語(yǔ)言了,最大的優(yōu)勢(shì)就在于:它非常強(qiáng)大和靈活。不管是R或者 Python,都有很多包供我們調(diào)用,同時(shí)也可以自定義函數(shù),實(shí)現(xiàn)我們的某些需求。
② python的工程化應(yīng)用強(qiáng)于R,可移植性更強(qiáng)。
③ python的應(yīng)用場(chǎng)景大于R,仿佛R可以做的,Python基本可以,它不擅長(zhǎng)的,Python也可以。
④ 如果是統(tǒng)計(jì)理論研究、前沿科學(xué)研究,R比python更勝一籌。R的使用人群主要是一些高校、醫(yī)藥的統(tǒng)計(jì)學(xué)家,這就是為什么大學(xué)老師都用R的原因。
Crossin的新書(shū)《碼上行動(dòng):用ChatGPT學(xué)會(huì)Python編程》已經(jīng)上市了。 本書(shū)以ChatGPT為輔助,系統(tǒng)全面地講解了如何掌握Python編程,適合Python零基礎(chǔ)入門的讀者學(xué)習(xí)。 【點(diǎn)此查看詳細(xì)介紹】 購(gòu)買后可加入讀者交流群,Crossin為你開(kāi)啟陪讀模式,解答你在閱讀本書(shū)時(shí)的一切疑問(wèn)。 Crossin的其他書(shū)籍:
添加微信 crossin123 ,加入編程教室共同學(xué)習(xí) ~
1. Excel工具
說(shuō)起用什么做數(shù)據(jù)分析,很多人的腦海中都會(huì)不約而同地想到Python、R、SQL、Hive等看似很難掌握的數(shù)據(jù)分析工具,它們就像數(shù)據(jù)分析路上的攔路虎一樣,讓人踟躕不前。 其實(shí),在眾多的數(shù)據(jù)分析工具中,Excel屬于最常用、最基礎(chǔ)、最易上手的一款數(shù)據(jù)分析工具。Excel的功能十分強(qiáng)大,它不僅提供了眾多的數(shù)據(jù)處理功能,像Excel函數(shù)能夠幫助我們做數(shù)據(jù)整理,數(shù)據(jù)透視表幫助我們快速、高效的做各種維度分析,形形色色的圖表能幫我們形象地展示出數(shù)據(jù)背后隱藏的規(guī)律,同時(shí)Excel還有很專業(yè)的數(shù)據(jù)分析工具庫(kù),包括描述性統(tǒng)計(jì)分析、相關(guān)系數(shù)分析等。 Excel對(duì)于轉(zhuǎn)行數(shù)據(jù)分析的小白來(lái)說(shuō),應(yīng)該是最友好的。大家都知道“轉(zhuǎn)行”其實(shí)是一件很困難的事兒,但是你學(xué)會(huì)了Excel,是完全可以找到一份“數(shù)據(jù)”相關(guān)的工作的,只有踏進(jìn)數(shù)據(jù)領(lǐng)域,你才有可能從事其它更多的數(shù)據(jù)崗位。
2. BI工具
BI工具是專門按照數(shù)據(jù)分析的流程進(jìn)行設(shè)計(jì)的,也是專門用于數(shù)據(jù)分析的工具。仔細(xì)觀察這些工具后,它們的基本流程是:【數(shù)據(jù)處理】-【數(shù)據(jù)清洗】-【數(shù)據(jù)建?!?【數(shù)據(jù)可視化】。 關(guān)于BI工具,其實(shí)有很多你估計(jì)已經(jīng)用到過(guò),比如說(shuō)Tableau、Power BI,還有帆軟等。今天我們就分別帶著大家來(lái)盤點(diǎn)一下,這三款工具。2.1Tableau
Tableau是三位斯坦福人 Dr. Pat Hanrahan, Dr. Chris Stotle, Christian Chabot 于2003年成立的,這是一款交互式數(shù)據(jù)可視化軟件,它的本質(zhì)其實(shí)也是Excel的數(shù)據(jù)透視表和數(shù)據(jù)透視圖。 Tableau也是很好的延續(xù)了Excel,只需要簡(jiǎn)單地拖拽,就能很快地實(shí)現(xiàn)數(shù)據(jù)的分類匯總,然后拖拽實(shí)現(xiàn)各種圖形的繪制,并且可以實(shí)現(xiàn)不同圖表之間的聯(lián)合。 Tableau同時(shí)支持?jǐn)?shù)百種數(shù)據(jù)連接器,包括在線分析處理(OLAP)和大數(shù)據(jù)(例如NoSQL,Hadoop)以及云數(shù)據(jù),至少現(xiàn)在你能學(xué)到的數(shù)據(jù)庫(kù)軟件,Tableau基本都能夠?qū)崿F(xiàn)與其數(shù)據(jù)之間的互動(dòng)。
2.2 Power BI
Power-BI是一款(BI)商業(yè)智能軟件,于2014年發(fā)布,旨在為用戶提供交互式的可視化和商業(yè)智能,簡(jiǎn)單的數(shù)據(jù)共享,數(shù)據(jù)評(píng)估和可擴(kuò)展的儀表板等功能。。 大家可能都知道,Power BI以前是一款Excel插件,依附于Excel,比如Power Query,PowerPrivot, Power View和Power Map等,這些插件讓Excel如同裝上了翅膀,瞬間高大上,慢慢地就發(fā)展成為現(xiàn)在的Power BI數(shù)據(jù)可視化工具。 Power BI 簡(jiǎn)單且快速,能夠從 Excel電子表格或本地?cái)?shù)據(jù)庫(kù)創(chuàng)建圖表。同時(shí)Power BI也是可靠的、企業(yè)級(jí)的,可進(jìn)行豐富的建模和實(shí)時(shí)分析,及自定義開(kāi)發(fā)。因此它既是你的個(gè)人報(bào)表和可視化工具,還可用項(xiàng)目、部門或整個(gè)企業(yè)背后的分析和決策引擎。Power BI的分析功能很強(qiáng)大,它的PowerPivot 和DAX語(yǔ)言,讓我們能夠編寫類似Excel中的公式,來(lái)進(jìn)行復(fù)雜的高級(jí)分析。 同時(shí),無(wú)論你的數(shù)據(jù)是簡(jiǎn)單的 Excel電子表格,還是基于云和本地混合數(shù)據(jù)倉(cāng)庫(kù)的集合, Power BI都可以讓你輕松地連接到數(shù)據(jù)源,直觀看到或發(fā)現(xiàn)數(shù)據(jù)的價(jià)值,與任何所希望的人進(jìn)行共享。 最后我們簡(jiǎn)單說(shuō)說(shuō)Power BI的組成部分,大家可以自行下去查看學(xué)習(xí)。 Power BI 包含 Windows 桌面應(yīng)用程序(稱為 Power BI Desktop )、聯(lián)機(jī) SaaS (軟件即服務(wù))服務(wù)(稱為 Power BI 服 務(wù)),及移動(dòng) Power BI 應(yīng) 用(可在 Windows 手機(jī)和平板電腦及 iOS 和 Android 設(shè)備上使用)。 PowerBI 有三個(gè)用于不同場(chǎng)景的組件: PowerQuery (數(shù)據(jù)處理組件), PowerPivot (輕量級(jí)建模組件), PowerBI Desktop (獨(dú)立數(shù)據(jù)可視化程序)。
2.3 finereport
帆軟是業(yè)內(nèi)做報(bào)表比較久的一家公司,使用類excel風(fēng)格的界面,可添加圖表和數(shù)據(jù)源,也可實(shí)現(xiàn)大屏效果。 其實(shí)它的類Excel風(fēng)格界面,應(yīng)該是它區(qū)別于Tableau工具的一個(gè)很重要的點(diǎn)。FineReport 通過(guò)直接連接到各種數(shù)據(jù)庫(kù),就能方便快捷地自定義各種樣式,從而制作周報(bào)、月報(bào)和季報(bào)、年報(bào)。 用過(guò)FineReport 的朋友,還會(huì)有另外一種體會(huì),它的圖形效果比Tableau要酷炫的多,操作起來(lái)同樣也是那樣的方便。 另外,F(xiàn)ineReport 的個(gè)人版本是完全免費(fèi)的,并且所有功能都是開(kāi)放的,大家趕緊下去試試吧。
3. Python & R
其實(shí)不管是Excel,還是介紹的三款BI工具,它們都是為了執(zhí)行特定功能,而設(shè)計(jì)出來(lái)的。如果說(shuō)某一天,既定功能不能很好,或者說(shuō)不能滿足你的需求,那么應(yīng)該怎么辦呢? 這就需要我們了解,并學(xué)習(xí)一點(diǎn)編程語(yǔ)言了,最大的優(yōu)勢(shì)就在于:它非常強(qiáng)大和靈活。不管是R或者 Python,都有很多包供我們調(diào)用,同時(shí)也可以自定義函數(shù),實(shí)現(xiàn)我們的某些需求。
3.1 簡(jiǎn)介
3.2 其他對(duì)比
① python與R相比速度要快。② python的工程化應(yīng)用強(qiáng)于R,可移植性更強(qiáng)。
③ python的應(yīng)用場(chǎng)景大于R,仿佛R可以做的,Python基本可以,它不擅長(zhǎng)的,Python也可以。
④ 如果是統(tǒng)計(jì)理論研究、前沿科學(xué)研究,R比python更勝一籌。R的使用人群主要是一些高校、醫(yī)藥的統(tǒng)計(jì)學(xué)家,這就是為什么大學(xué)老師都用R的原因。
作者:黃偉呢
來(lái)源:數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)之美Crossin的新書(shū)《碼上行動(dòng):用ChatGPT學(xué)會(huì)Python編程》已經(jīng)上市了。 本書(shū)以ChatGPT為輔助,系統(tǒng)全面地講解了如何掌握Python編程,適合Python零基礎(chǔ)入門的讀者學(xué)習(xí)。 【點(diǎn)此查看詳細(xì)介紹】 購(gòu)買后可加入讀者交流群,Crossin為你開(kāi)啟陪讀模式,解答你在閱讀本書(shū)時(shí)的一切疑問(wèn)。 Crossin的其他書(shū)籍:
添加微信 crossin123 ,加入編程教室共同學(xué)習(xí) ~

感謝 轉(zhuǎn)發(fā) 和 點(diǎn)贊 的各位~
評(píng)論
圖片
表情
