我常用的15個數據源網站
前面介紹過實用的效率小工具,真的幫了我很多忙,這次給小伙伴們再種草一些數據源網站。
現在有很多免費的數據可以供使用分析,不過很少有人能找的到,或者沒能力找,這就是所謂的信息差吧。其實數據獲取分為兩方面,一是“拿來的”數據,也就是現成的;二是“爬來的”數據,這種一般通過爬蟲等手段去采集數據。
“拿來的”數據可以在各大官方平臺或者社區(qū)去找,一般各行各業(yè)都會有自己的數據庫。我常用的數據網站有以下這些:
搜索指數類
百度指數:百度搜索匯總的數據,能看到各種關鍵詞的搜索熱度趨勢,優(yōu)點數據量大,能反映真實的話題熱度變化,適合做需求洞察、用戶畫像、輿情監(jiān)測、市場分析。
百度指數規(guī)則,是以網民在百度的搜索量為數據基礎,以關鍵詞為統(tǒng)計對象,科學分析并計算出各個關鍵詞在百度網頁搜索中搜索頻次的加權和。

微信指數:微信生態(tài)的大數據,反映關鍵詞熱度,和百度指數類似。但微信指數數據來源微信各種內容渠道,包括搜一搜、視頻號、公眾號等,適合做微信生態(tài)人群畫像、內容推廣、輿情監(jiān)控的研究。
在計算關鍵詞指數的過程中,微信指數主要關注:
關鍵詞相關內容的受歡迎程度。
關鍵詞在相關內容中的重要程度。

Google Trends:和百度指數類似的產品,基于google生態(tài)匯總的大數據。比百度數據來源更豐富也更廣泛,包含了google、youtube等,畢竟是全球應用。缺點是對國內搜索分析的指導意義不大,還是百度指數更具指導意義。

微博指數:微博內容提及量、閱讀量、互動量加權得出的綜合指數,優(yōu)點比較有時效性,而且數據基數大,可以實時反映熱度變化情況,適合實時捕捉當前社會熱點事件、熱點話題等,快速響應輿論走向等。

媒體數據
這種數據包含了網站、APP、自媒體賬號等監(jiān)測數據,大多是商業(yè)付費類
Alexa:用于查詢全球網站排名和流量的平臺,可以看到PV、UV、排名、區(qū)域分布等信息。

新榜:新媒體專屬的數據平臺,用于查看抖音、快手、公眾號、小紅書等平臺KOL賬號的數據。數據包括了粉絲、瀏覽、互動、聲量等,一般用于廣告投放監(jiān)測、自媒體數據運營等。

貓眼數據:影視相關數據。匯總了電影票房、網播熱度、電視收視等數據,適合做票房預測、節(jié)目熱度監(jiān)測。

艾瑞指數:APP、Web、手機等排行榜數據,包括各大移動設備裝機指數、APP熱度指數、PC Web熱度指數、網絡廣告指數等等,適合做廣告營銷投放等。

金融數據
新浪財經數據中心:新浪財經大數據,匯總了股票、基金、期貨、黃金、貨幣等各種財經數據,種類很齊全,應該有數據接口。

Wind:國內比較早的金融數據服務商,數據種類最齊全,而且有各種金融分析工具,也支持Python、R等量化分析。但Wind很貴,個人很難承擔的起。

Tushare:免費的金融數據庫,支持Python接口,數據也非常齊全,包含了股票、基金、期權、債券、外匯、公司報表等各種財經數據。只要你會用Python,就可以調用里面的各種數據,非常便捷。

社會數據
這種一般包含政府開放數據、統(tǒng)計數據,以及各種民生數據。
國家統(tǒng)計局:最權威的國內宏觀數據網站,包括人口、經濟、農業(yè)等等。

上海公共數據開放平臺:上海市各行各業(yè)的免費數據,對公眾開放下載,非常適合做城市規(guī)劃分析。

其他城市官方數據:


數據科學研究數據
這一類數據適合做機器學習、統(tǒng)計分析、算法研究等,是學術界、工業(yè)界用于數據驅動業(yè)務典型數據。
kaggle:全球最大的數據科學比賽平臺,也是google旗下的產品。kaggle擁有豐富的數據集和各種解決方案,適合對數據感興趣的小伙伴去研究學習。

天池:阿里云里面的數據比賽平臺,也擁有很多比賽數據,質量相對較高。


對比Excel系列圖書累積銷量達15w冊,讓你輕松掌握數據分析技能,可以在全網搜索書名進行了解選購:

