數據分析方法論:如何進行用戶的路徑分析?
今天和大家聊聊流量分析中常用的用戶的路徑分析,以及如何在BI系統(tǒng)中產品化。
01
—
什么是路徑分析
首先,什么是用戶路徑分析呢?
似乎這個從表述上來講,就很容易理解了。其實就是用戶在站內或者App內的不同頁面、不同模塊、不同操作事件之間,流轉來及流轉去的分析。
通過路徑分析,我們可以很好地發(fā)現用戶的流轉特點,發(fā)現用戶是從哪些環(huán)節(jié)、哪些頁面流失、或者發(fā)生了阻礙,從而有針對性地優(yōu)化產品,提升業(yè)績。
比如,我們發(fā)現很多用戶在加購后沒有進行支付,我們就可以通過路徑分析,看看用戶加購后,都去哪里了、發(fā)生了什么操作。如此,有可能找到支付率低的原因所在。
02
—
路徑分析的可視化呈現
關于用戶的路徑分析,比較常見的可視化呈現,就是?;鶊D。
桑基圖,這里可以簡單說兩句。其實是因1898年Matthew Henry Phineas Riall Sankey繪制的“蒸汽機的能源效率圖”而聞名,此后便以其名字命名為“?;鶊D”。
?;鶊D主要是用來顯示流向和數量。最大的特點,就是開始與結束是保持總量守恒的。
比如下面的這個例子,就是?;鶊D:

從這個圖里,我們能清晰看出全體用戶是從哪個地方來,經過一步一步的環(huán)節(jié)后,到了哪里去。
另外一種和?;鶊D比較相似的圖,是和弦圖。如下示例:
和弦圖主要是呈現從一個內容轉移到另外所有內容的情況,呈現不了桑基圖多層環(huán)節(jié)的內容,僅僅是一個環(huán)節(jié)。
03
—
路徑分析的產品設計
上面講到了路徑分析主要的可視化呈現是?;鶊D。其實對于做分析報告而言,有一張恰當的桑基圖就可以呈現很多信息了。
但產品化和做分析報告不一樣。產品化要滿足的是更豐富的應用場景,實現靈活的交互式分析。這是BI系統(tǒng)中路徑分析的基本要求。
那么關于BI分析系統(tǒng)中的路徑分析模塊,該如何進行產品設計呢?我們看看行業(yè)的產品設計。
(1)谷歌分析的路徑分析
下圖是GA的路徑分析模塊:

首先,GA支持節(jié)點類型的選擇。用戶可以選擇事件、也可以選擇頁面,并且針對詳細程度、聚合程度進行自定義調整。
其次,點擊某個節(jié)點,可以進行更深入的分析。
突出顯示途經此處的流量:突出顯示該部分流量在整個流程中產生的所有連接
僅查看此細分(僅限維度節(jié)點):僅顯示來自該維度/細分的流量
查看通過此處的流量:顯示來到該節(jié)點或出自該節(jié)點的所有連接。在此模式中,可以在路徑中的該節(jié)點之前或之后添加其他步驟。
群組詳細信息:顯示該節(jié)點中組合到一起的元素,如各個網頁或事件。此選項用于查看以下詳細信息:
(2)神策數據的路徑分析
下圖是神策數據的路徑分析模塊:

其實大的邏輯,和GA的?;鶊D沒有本質的區(qū)別,細節(jié)上,比GA還是會有一些減少。但從體驗上,不得不說還是挺不錯的。起碼比較容易上手。GA可能還是翻譯或者文化不同吧,總需要一個適應的過程。
神策的路徑分析中,支持了多種方式的篩選操作。

這里包括以下:
事件范圍的篩選
起始事件的確定
用戶細分的篩選
session的時長設置
這些篩選其實能滿足正常分析人員絕大部分的分析訴求了。尤其是session的間隔設置,這個我覺得還是挺驚艷的?;仡^仔細調研一下技術的實現。畢竟session間隔的隨意設置,個人覺得對計算的要求還是很高的。
04
—
路徑分析的數據邏輯
上面講了很多產品設計側面的內容。很便捷的交互式操作背后,是大量的數據處理邏輯,這里可以簡述一二。
(1)需要有良好的序列數據及會話切割
想象一下,要實現路徑分析,數據該如何處理?
首先,要對所有的行為日志進行會話(session)的劃分。劃分的目的是為了實現區(qū)分一次次獨立的行為。通常的劃分方式是,30分鐘或者多久沒有操作,本次會話就結束了。
其次,基于劃分成一段段的會話,進行數據處理和匯總分析。
以作者之前的經驗,在每個session中的事件記錄,會按照時間順序標記序列號。如此可以實現序列的分析。但對于神策分析中的自由設置session間隔是如何實現的,我確實也沒想到。因為正常情況下,session的劃分邏輯是固定的。
難道是預先按照不同的間隔進行了計算?
我反正覺得如果是實時計算不同間隔劃分session,然后按照劃分后的session統(tǒng)計流入流出,是很困難的。有了解的朋友歡迎私信指教~
(2)數據計算量的要求比較高
通過剛才的示例我們也看到了,在分析過程中,有可能進行各種條件的篩選、各種人群的細分、各種邏輯的設置,這對于計算的要求無疑是很高的。
具體背后的技術架構層的設計,是很重要的內容。
關于路徑分析,今天先分享到這里吧。

