有關(guān)留存分析
大家好,我是寶器!
Tableau的本質(zhì)還是輔助分析、輔助工作,分析思維不可少。所以在分享Tableau技能之外,也會(huì)分享些有關(guān)分析技能的內(nèi)容,統(tǒng)一更新入“Janie碎談”模塊中。
這篇文章是我花了好幾個(gè)晚上認(rèn)認(rèn)真真寫(xiě)的,自己編造的數(shù)據(jù),自己畫(huà)的圖,自己寫(xiě)的代碼。一方面寫(xiě)的過(guò)程中會(huì)促使我進(jìn)入更深層次的思考,邊改進(jìn)邊學(xué)習(xí)邊進(jìn)步;另一方面獨(dú)樂(lè)樂(lè)不如眾樂(lè)樂(lè),分享出來(lái)大家一起進(jìn)步,順便也幫我指出不足。
網(wǎng)上有關(guān)留存的文章很多,這篇不敢說(shuō)是最全的,但最起碼是較全的。由于上班加帶娃,又要堅(jiān)持原創(chuàng),又要精細(xì)的準(zhǔn)備每一篇干貨,所以大概一周一更。如有做的不足的地方,請(qǐng)于后臺(tái)留言,督促我改進(jìn),以分享更有價(jià)值的干貨。
在這個(gè)用戶(hù)為大的互聯(lián)網(wǎng)世界中,我們一起發(fā)現(xiàn)更多有意思的點(diǎn)......
目錄
互聯(lián)網(wǎng)企業(yè)面臨的留存問(wèn)題
什么是留存分析
留存分析常用口徑
留存分析的適用場(chǎng)景
留存分析參考代碼
留存下降的可能性原因
留存分析方法
案例實(shí)攻
流量紅利見(jiàn)頂、拉新成本高
在極易同質(zhì)化的今天,流量競(jìng)爭(zhēng)著實(shí)激烈,提高用戶(hù)留存的重要性不言而喻,且存量用戶(hù)的獲客成本遠(yuǎn)遠(yuǎn)低于拉新成本。
新用戶(hù)較易流失
企業(yè)大規(guī)模投廣告、做活動(dòng),高額支出鎖不住新用戶(hù),長(zhǎng)期可持續(xù)發(fā)展有些無(wú)力,只顧眼前利益治標(biāo)不治本。
留存率:某日用戶(hù)數(shù)在第N日仍啟動(dòng)該App的用戶(hù)比例,留存分析即分析用戶(hù)隨時(shí)間變化的活躍情況。獲取用戶(hù)只是第一步,留住用戶(hù)才是所有產(chǎn)品最終目標(biāo)。
可以理解為:由初期的搖擺用戶(hù)轉(zhuǎn)化為忠誠(chéng)&穩(wěn)定用戶(hù)的過(guò)程。留存率越高,說(shuō)明用戶(hù)對(duì)產(chǎn)品越有強(qiáng)烈的依賴(lài)感。
可分為三個(gè)階段:
初期:新用戶(hù)剛注冊(cè),用戶(hù)留存下降較快,需快速讓用戶(hù)感受到產(chǎn)品核心價(jià)值。
中期:新用戶(hù)沉淀下來(lái),形成活躍用戶(hù)。此時(shí)需分析活躍留存,加強(qiáng)核心功能,培養(yǎng)用戶(hù)對(duì)產(chǎn)品的使用習(xí)慣。
后期:思考產(chǎn)品核心價(jià)值,做好產(chǎn)品迭代與優(yōu)化。
從時(shí)間維度劃分:
常見(jiàn)的的有:次日留存、3日留存、7日留存、30日留存、周留存、月留存
從用戶(hù)維度劃分:
常見(jiàn)的的有:新用戶(hù)留存、活躍留存
圖解如下:

以新用戶(hù)留存為例
次日留存率=(某日新增的用戶(hù)中,在注冊(cè)的第2天還進(jìn)行登錄的用戶(hù)數(shù))/ 該日新增用戶(hù)數(shù)
3日留存率=(某日新增用戶(hù)中,在注冊(cè)的第3天還進(jìn)行登錄的用戶(hù)數(shù))/ 該日新增用戶(hù)數(shù)
7日留存率=(某日新增的用戶(hù)中,在注冊(cè)的第7天還進(jìn)行登錄的用戶(hù)數(shù))/ 該日新增用戶(hù)數(shù)
30日留存率=(某日新增的用戶(hù)中,在注冊(cè)的第30天還進(jìn)行登錄的用戶(hù)數(shù))/ 該日新增用戶(hù)數(shù)
1周后留存率=(某周新增的用戶(hù)中,在注冊(cè)的第2周還進(jìn)行登錄的用戶(hù)數(shù))/ 該周新增用戶(hù)數(shù)
2周后留存率=(某周新增的用戶(hù)中,在注冊(cè)的第3周還進(jìn)行登錄的用戶(hù)數(shù))/ 該周新增用戶(hù)數(shù)
1月后留存率=(某月新增的用戶(hù)中,在注冊(cè)的第2月還進(jìn)行登錄的用戶(hù)數(shù))/ 該月新增用戶(hù)數(shù)
2月后留存率=(某月新增的用戶(hù)中,在注冊(cè)的第3月還進(jìn)行登錄的用戶(hù)數(shù))/ 該月新增用戶(hù)數(shù)
以活躍留存為例
次日留存率=(某日登錄的用戶(hù)中,在第2天還進(jìn)行登錄的用戶(hù)數(shù))/ 該日登錄用戶(hù)數(shù)
3日留存率=(某日登錄用戶(hù)中,在第3天還進(jìn)行登錄的用戶(hù)數(shù))/ 該日登錄用戶(hù)數(shù)
7日留存率=(某日登錄的用戶(hù)中,在第7天還進(jìn)行登錄的用戶(hù)數(shù))/ 該日登錄用戶(hù)數(shù)
30日留存率=(某日登錄的用戶(hù)中,在第30天還進(jìn)行登錄的用戶(hù)數(shù))/ 該日登錄用戶(hù)數(shù)
1周后留存率=(某周登錄的用戶(hù)中,在第2周還進(jìn)行登錄的用戶(hù)數(shù))/ 該周登錄用戶(hù)數(shù)
2周后留存率=(某周登錄的用戶(hù)中,在第3周還進(jìn)行登錄的用戶(hù)數(shù))/ 該周登錄用戶(hù)數(shù)
1月后留存率=(某月登錄的用戶(hù)中,在第2月還進(jìn)行登錄的用戶(hù)數(shù))/ 該月登錄用戶(hù)數(shù)
2月后留存率=(某月登錄的用戶(hù)中,在第3月還進(jìn)行登錄的用戶(hù)數(shù))/ 該月登錄用戶(hù)數(shù)
日留存率
快速判斷產(chǎn)品是否迎合市場(chǎng)需求,比如新手對(duì)產(chǎn)品的UI設(shè)計(jì)、功能設(shè)置、新手引導(dǎo)等的體驗(yàn)是否滿(mǎn)意,是否需做調(diào)整。
快速判斷用戶(hù)粘性,比如用戶(hù)是否更易受促銷(xiāo)活動(dòng)的影響等等。
周留存率
判斷用戶(hù)忠誠(chéng)度,用戶(hù)此時(shí)對(duì)產(chǎn)品基本已有完整的體驗(yàn)。一整套流程體驗(yàn)下來(lái),繼續(xù)訪(fǎng)問(wèn)的用戶(hù)可判斷為潛在忠誠(chéng)用戶(hù)。
分析用戶(hù)再次訪(fǎng)問(wèn)的原因,找出產(chǎn)品最能鞏固用戶(hù)的點(diǎn),且參考此點(diǎn)以一貫之,拓展應(yīng)用到更多的用戶(hù)身上,促使更多的用戶(hù)留下來(lái)。
月留存率
評(píng)估迭代與優(yōu)化的效果。砍掉留存率低的產(chǎn)品功能,進(jìn)行迭代優(yōu)化。
有些互聯(lián)網(wǎng)公司面試會(huì)出留存SQL題型,該代碼僅供參考。

代碼運(yùn)行結(jié)果

語(yǔ)法環(huán)境:SparkSql或Impala,其他環(huán)境也可以,只是個(gè)別函數(shù)會(huì)略有差別,替換個(gè)別函數(shù)即可,無(wú)需更改代碼結(jié)構(gòu)。
參考代碼如下:
--以a表日期作為主體selectt.date_a,t.date_b,t.diff_ab,count(distinct t.user) as user_numfrom(--a、b兩段代碼一模一樣,join之后取二者日期差值selecta.login_date as date_a,b.login_date as date_b,a.user,datediff(b.login_date,a.login_date) as diff_abfrom(--a段代碼SELECTlogin_date,userfrom dwd.user_loginwhere login_date>='2021-08-01'and login_date<=date_sub(to_date(now()),1))ainner join(--b段代碼SELECTlogin_date,userfrom dwd.user_loginwhere login_date>='2021-08-01'and login_date<=date_sub(to_date(now()),1))b on a.user=b.user)tgroup by 1,2,3having t.diff_ab>=0
新用戶(hù)留存下降
新用戶(hù)并未快速的感受到產(chǎn)品的核心價(jià)值。
新手引導(dǎo)模塊體驗(yàn)交差
新用戶(hù)羊毛黨居多
界面UI設(shè)計(jì)影響使用感
產(chǎn)品功能體驗(yàn)較差
......
老用戶(hù)留存下降
產(chǎn)品迭代功能致使用戶(hù)體驗(yàn)變差
產(chǎn)品迭代周期較長(zhǎng),用戶(hù)喪失新鮮感
受競(jìng)品影響
未促使用戶(hù)對(duì)產(chǎn)品形成習(xí)慣
連續(xù)打卡簽到送紅包模塊優(yōu)惠力度較小,無(wú)堅(jiān)持意義
廣告推送較多
客服服務(wù)響應(yīng)較慢、服務(wù)較差
無(wú)關(guān)推送
產(chǎn)品bug較多
受促銷(xiāo)活動(dòng)影響較大
......

其中產(chǎn)品功能分析:
目的:找出對(duì)留存最有價(jià)值的功能&最沒(méi)價(jià)值的功能,便于后期迭代優(yōu)化。
卓越功能:建議側(cè)重優(yōu)化用戶(hù)體驗(yàn)。
大眾功能:重中之重,建議反思該功能的長(zhǎng)期價(jià)值與實(shí)用性
小眾功能:建議保留該功能,但無(wú)需過(guò)多投入精力
弱勢(shì)功能:建議考慮是否砍掉

案例一
該圖是我在ppt上加工出來(lái)的,選取了兩日來(lái)對(duì)比。

解析:
2021年5月1日注冊(cè)的新用戶(hù)在注冊(cè)的第7日留存率趨向于平穩(wěn),此時(shí)留存率60%;2021年5月2日注冊(cè)的新用戶(hù)在注冊(cè)的第7日留存率趨向于平穩(wěn),此時(shí)留存率20%;2日注冊(cè)的用戶(hù)穩(wěn)定留存率較1日差。
改進(jìn)思路:
應(yīng)使得趨向于平穩(wěn)時(shí)的留存率盡可能提高,即平穩(wěn)的這段線(xiàn)盡量往上提。
案例二
數(shù)據(jù)純屬個(gè)人虛構(gòu),實(shí)際分析時(shí)建議多擴(kuò)展日期,該圖重在解析分析方法。
該表留存率:(某新增的用戶(hù)中,在第N天還進(jìn)行登錄的用戶(hù)數(shù))/ 該日新增用戶(hù)數(shù)

以8月1日的新增用戶(hù)留存為例

新手探索期:?jiǎn)渭兛看箢~優(yōu)惠吸引的用戶(hù)會(huì)之間流失,產(chǎn)品價(jià)值未達(dá)到用戶(hù)預(yù)期。
習(xí)慣養(yǎng)成期:產(chǎn)品功能&實(shí)用性未促使用戶(hù)養(yǎng)成使用習(xí)慣。
活躍用戶(hù)期:真正留下來(lái)的忠實(shí)用戶(hù)。
解析:
新用戶(hù)次留驟減60%:沒(méi)有使得用戶(hù)迅速發(fā)現(xiàn)產(chǎn)品價(jià)值
整體留存率于第10日趨向于平穩(wěn),留存率穩(wěn)定于11%左右:說(shuō)明8月1日的新增用戶(hù)中只有11%左右發(fā)展成了忠實(shí)用戶(hù)。
3留&7留出現(xiàn)留存率增長(zhǎng)現(xiàn)象(注意:留存率并不會(huì)呈現(xiàn)持續(xù)下降情況),進(jìn)一步定位原因,在8月3日與8月7日是否進(jìn)行了促銷(xiāo)活動(dòng)?
案例三

解析:
表格中以8月6日注冊(cè)用戶(hù)的次留(71%)為起始點(diǎn),8月1日注冊(cè)用戶(hù)的7留(34%)為結(jié)束點(diǎn),二者形成對(duì)角線(xiàn),縱向?qū)Ρ葦?shù)據(jù),顏色顏色部分留存率都比較高。首先需要確認(rèn)8月7日這天運(yùn)營(yíng)是否做了動(dòng)作?比如:該日做了促銷(xiāo)活動(dòng)、或者其他特殊活動(dòng)?因?yàn)?月7日正好對(duì)應(yīng)的是8月6日的次留,8月5日的3留......8月1日的7留。
表格中8月9日的次留是20%,遠(yuǎn)低于其他日次留,且后續(xù)留存也較其他日偏低,警惕羊毛黨。

推薦閱讀
歡迎長(zhǎng)按掃碼關(guān)注「數(shù)據(jù)管道」
