“?一夜之間,俄羅斯烏克蘭就開戰(zhàn)了;一個(gè)午覺之間,烏克蘭全軍覆沒了……”
戰(zhàn)情發(fā)展過于迅速,這次的熱點(diǎn)咱們得蹭一蹭。我一個(gè)搞數(shù)據(jù)的,咋蹭熱點(diǎn)呢?
哈哈,咱們今天基于新聞?shì)浨椋匆豢此阉鳠岫戎笖?shù)相關(guān)的內(nèi)容,看如何用數(shù)據(jù)衡量新聞熱度的現(xiàn)狀與趨勢(shì)。主要看Google trends(谷歌趨勢(shì))、百度指數(shù)、微信指數(shù)這三大產(chǎn)品的數(shù)據(jù)表現(xiàn)及產(chǎn)品化設(shè)計(jì)。首先看一下谷歌在搜索熱度上的產(chǎn)品化設(shè)計(jì)。Google Trends 是谷歌旗下的一款數(shù)據(jù)工具,主要用于探查某個(gè)或者某組搜索詞的數(shù)據(jù)表現(xiàn)、地理位置等。網(wǎng)址:trends.google.com。不過國內(nèi)朋友們應(yīng)該需要翻墻才能上。所以我就多截圖,方便朋友們了。首先,Trends 可以洞察某個(gè)關(guān)鍵詞的搜索熱度走勢(shì)。我們這里選取UKraine(即烏克蘭)和Russia(即俄羅斯),來看看該關(guān)鍵詞的搜索熱度情況(這里的分析截圖時(shí)間是2月24日晚9點(diǎn))。可以明顯看出,這倆關(guān)鍵詞在1月20多號(hào)有一波熱度上漲,然后就是最近幾天開始暴漲。24日10點(diǎn)多達(dá)到高峰。這個(gè)和咱們的大體感受比較吻合。谷歌這里對(duì)數(shù)據(jù)是進(jìn)行了指數(shù)化的,指數(shù)化后的取值范圍為0-100,熱度100代表了最高。而且這里的100只能在當(dāng)前圖表里進(jìn)行對(duì)比分析,跨圖表的熱度數(shù)值分析是無意義的,因?yàn)榱烤V不一樣。所以這里的指數(shù)化本質(zhì)上是0-100標(biāo)準(zhǔn)化進(jìn)行的數(shù)據(jù)處理。
因此,這里只能分析趨勢(shì)。需要對(duì)比只能在當(dāng)前圖中添加對(duì)比關(guān)鍵詞,才能有對(duì)比意義。這個(gè)邏輯我覺得對(duì)于數(shù)據(jù)呈現(xiàn)非常好,避免了極大值極小值的出現(xiàn)。但是對(duì)于不太懂?dāng)?shù)據(jù)邏輯的用戶,我估計(jì)可能會(huì)出現(xiàn)錯(cuò)誤使用。大家可以參考借鑒。
下面是搜索該關(guān)鍵詞的地域分布,這里的關(guān)鍵詞是Ukraine。
搜索熱度最高的幾個(gè)國家竟然是德國、盧森堡、奧地利??磥磉@幾個(gè)鄰國的民眾對(duì)于烏克蘭戰(zhàn)爭(zhēng)比較擔(dān)心??!
烏克蘭為啥不是最高呢?可能烏克蘭的民眾已經(jīng)顧不上搜索新聞了……而且關(guān)鍵是,烏克蘭會(huì)用俄語搜索吧,哈哈~(是的,谷歌這里的不同語言是不一樣的,因?yàn)槲也徽J(rèn)識(shí)俄語,就只能輸入英文了)。
注意一點(diǎn),這里的熱度是相對(duì)熱度,有點(diǎn)類似TGI的意思。由于不同國家使用Google的情況不一樣,肯定不能用絕對(duì)熱度。因此這里采用了相對(duì)熱度是非常合理和科學(xué)的。再來看一下和該關(guān)鍵詞(Ukraine)相關(guān)的搜索關(guān)鍵詞表現(xiàn)。這里分了相關(guān)主題查詢和相關(guān)關(guān)鍵詞查詢。基于搜索量上升還是搜索熱度,可以進(jìn)行兩種排序方法。上圖是搜索量上升,即基于的是相對(duì)值?;谒阉鳠岫鹊谋憩F(xiàn)如下,基本都是大詞。可以看出,對(duì)于基數(shù)過少的搜索詞,進(jìn)行了異常值剔除。非常細(xì)節(jié)的產(chǎn)品設(shè)計(jì)體驗(yàn),贊!剛才都是基于某個(gè)具體關(guān)鍵詞的數(shù)據(jù)分析,下面我們看看烏克蘭國內(nèi)大家現(xiàn)在都在關(guān)注啥?嗯……我真的看不懂,大家不行自己圖片識(shí)別一下,哈哈~不過閉眼也能猜出來,都是和戰(zhàn)爭(zhēng)相關(guān)的吧~如果不相關(guān),就比較有意思了。看一個(gè)能看懂的吧,香港最近關(guān)注啥:
嗯,看來香港人民還是比較關(guān)注疫情多一些。國際局勢(shì)離我遠(yuǎn)點(diǎn)。哈哈~
看完國外的民眾關(guān)注,咱們得看看國內(nèi)人民對(duì)于烏克蘭戰(zhàn)爭(zhēng)關(guān)注度咋樣。畢竟咱們國人不用谷歌,用百度占了絕大部分。因此,有百度指數(shù)這個(gè)產(chǎn)品供咱們分析。網(wǎng)址:index.baidu.com。大家可以自己多多探索。
首先同樣有趨勢(shì)相關(guān)的分析。這里選取了關(guān)鍵詞:烏克蘭、俄羅斯。
哈哈,沒想到啊,咱們大家都喜歡搜烏克蘭,倒也合理?;咀邉?shì)和谷歌的也差不多,能對(duì)上。
大家可以看到,這里的縱軸是絕對(duì)數(shù)值,沒有進(jìn)行0-100標(biāo)準(zhǔn)化。關(guān)鍵是走勢(shì)圖竟然做了平滑……嗯,平滑的有點(diǎn)過度了,不利于數(shù)據(jù)分析。下面是資訊相關(guān)的熱度表現(xiàn):
能看到2月17日烏克蘭的一個(gè)小峰值吧~當(dāng)天應(yīng)該有媒體不少報(bào)道,但是大家搜索熱度一般。
同樣,百度指數(shù)也有相關(guān)搜索。
不過上面的“需求圖譜”有點(diǎn)意思,可以選擇時(shí)間軸,看不同時(shí)間的相關(guān)關(guān)鍵詞。能看出來,目前和烏克蘭最相關(guān)的關(guān)鍵詞就是俄羅斯了,還有就是問沖突原因是啥的、局勢(shì)進(jìn)展的。
我們看看幾個(gè)月前,大家關(guān)注烏克蘭的啥。
嗯,看來俄羅斯烏克蘭一直關(guān)聯(lián)度比較大。但我個(gè)人覺得可能是有些數(shù)據(jù)處理的有問題,比如去年8月有可能很多人關(guān)注烏克蘭和俄羅斯的軍事沖突嗎?我是懷疑的。
最后看一下相關(guān)人群畫像?;疽彩腔诘乩砦恢谩⒛挲g和性別的。這里基本都是絕對(duì)值,沒做TGI。所以搜索的區(qū)域基本都是沿海城市,因?yàn)檠睾3鞘腥硕唷?br>總之,和Google Trends 相比,我覺得百度指數(shù)有一些亮點(diǎn),但是在數(shù)據(jù)細(xì)節(jié)的處理上,還是有許多要做的工作。估計(jì)很多朋友應(yīng)該不知道這個(gè)??梢栽谖⑿胖兴阉鳌肝⑿胖笖?shù)」,專門有個(gè)微信的小程序。應(yīng)該是剛起步,功能不是很多。同樣,首先是指數(shù)的趨勢(shì)。這里我選取關(guān)鍵詞「烏克蘭」。
左側(cè)指數(shù)不贅述了,重點(diǎn)是指數(shù)圖下側(cè)的「數(shù)據(jù)異動(dòng)記錄」。這個(gè)簡(jiǎn)直了,沒想到微信這樣一款小工具,竟然給出了很多專業(yè)數(shù)據(jù)分析平臺(tái)都沒有的異動(dòng)分析,具體見右圖。
當(dāng)然,具體的異動(dòng)邏輯沒給,但是這個(gè)方向我就覺得很贊了!后面有機(jī)會(huì),我們會(huì)專門分享一篇文章,講講如何進(jìn)行異常的識(shí)別的。最后簡(jiǎn)單看一下微信指數(shù)特有的來源分析,看一下相關(guān)搜索都是來源于哪里。
關(guān)于行業(yè)中的熱度指數(shù),咱們今天就分享這些。主要的想法是給大家提供一個(gè)新的數(shù)據(jù)分析的陣地和工具,關(guān)于輿情新聞事件,可以借助這些工具平臺(tái),進(jìn)行更多的數(shù)據(jù)分析,輔助分析目標(biāo),豐富分析結(jié)論。·················END·················