如何做用戶畫像分析?

我們經常在淘寶網購物,作為淘寶方,他們想知道用戶是什么樣的,年齡、性別、城市、收入、購物品牌偏好、購物類型、平時的活躍程度等,這樣的一個用戶描述就是用戶畫像分析。
在實際工作中,用戶畫像分析是一個重要的數據分析手段,幫助產品策劃人員對產品功能進行迭代,幫助產品運營人員做用戶增長。
作為產品策劃人員,需要策劃一個好的功能,獲得用戶最大的可見價值與隱形價值、必須價值與增值價值,那么了解用戶并做用戶畫像分析,是數據分析師幫助產品策劃做更好的產品設計重要的一個環(huán)節(jié)。
作為產品運營人員,比如針對用戶的拉新、挽留、付費、裂變等的運營,用戶畫像分析可以幫助產品運營人員去找到他們的潛在用戶,從而用各種運營手段去觸達。因為,當我們知道群體特征時,也基本可以判定潛在用戶也是類似的一群人,這樣才可以精準地尋找新用戶,提高ROI。
總的來說,用戶畫像分析就是基于大量的數據,建立用戶的屬性標簽體系,同時利用這種屬性標簽體系去描述用戶。

用戶畫像分析的作用
用戶畫像分析的作用主要有以下幾個方面(見圖1)。

圖1
(1)廣告投放
在做用戶增長時,我們需要在一些外部渠道投放廣告,吸引可能的潛在用戶,比如,B站在抖音上投放廣告。
我們在選擇平臺進行投放時,有了用戶畫像分析,就可以精準地進行廣告投放,比如,抖音中主要的用戶年齡為是18~24歲,那么廣告投放時就可以針對這部分用戶群體,提高投放的ROI(見圖2)。假如我們沒有進行用戶畫像分析,那么可能會出現投了很多次廣告,結果沒有人點擊的情況。

圖2
(2)精準營銷
假如某個電商平臺需要做一個活動,給不同層次的用戶發(fā)放不同的券,就需要利用用戶畫像分析對用戶進行劃分,比如,劃分成不同付費次數的用戶,然后根據不同付費次數發(fā)放不同的優(yōu)惠券。給付費次數在1~10次的用戶發(fā)放10元優(yōu)惠券,依此類推(見圖3)。

圖3
(3)個性化推薦
個性化推薦即精確的內容分發(fā),比如,我們在音樂類APP中會看到每日推薦,這是因為運營人員在做點擊率預估模型(預測給你推薦的歌曲會不會被點擊)時,會考慮用戶畫像屬性,這樣才有可能推薦用戶喜歡的類型。比如,根據你是“90后”,喜歡傷感的音樂,喜歡周杰倫這些屬性,推薦類似的歌曲給你,這就是基于用戶畫像推薦。
(4)風控檢測
風控檢測主要是金融或者銀行業(yè)涉及得比較多,常見的問題是銀行怎么決定是否放貸給申請人。普遍的解決方法是搭建一個風控預測模型,預測申請人是否有可能不還貸款。模型的背后就有用戶畫像分析的功勞。用戶的收入水平、教育水平、職業(yè)、是否有家庭、是否有房子,以及過去的誠信記錄,這些畫像數據都關系到模型預測是否準確(見圖4)。


圖4
(5)產品設計
互聯網的產品價值離不開用戶、需求、場景這三大元素,所以在做產品設計時,要知道用戶到底是怎樣的一群人,他們的具體情況是什么,他們有什么特別需求,這樣才可以設計出對應解決他們需求和痛點的產品功能。
在產品功能迭代時,我們需要分析用戶畫像行為數據,發(fā)現用戶的流失情況。典型的場景是用漏斗模型分析轉化情況,就是基于用戶的行為數據發(fā)現流失嚴重的頁面,從而優(yōu)化對應的頁面。
比如,我們發(fā)現從下載到點擊付款的轉化率特別低,這可能是付款按鈕做得有問題,可以有針對性地優(yōu)化按鈕的位置等。
同時,還可以分析這部分轉化率主要是在哪部分用戶群體中低,假如發(fā)現高齡用戶的轉化率要比中青年的轉化率低很多,則有可能是因為字體的設置及按鈕位置不顯眼等,或者操作不方便。
(6)數據分析
在進行描述性數據分析時,經常需要用戶畫像的數據,比如,描述抖音中某美食類博主的用戶群體特征,可以關注他們觀看其他抖音視頻的情況,關注其他博主的情況等(見圖5)。

圖5
簡單來說,用戶畫像分析可以幫助數據分析師更加清晰地刻畫用戶。

如何搭建用戶畫像
用戶畫像架構如圖6所示。

圖6
(1)數據層
進行用戶畫像分析的基礎是獲取完整的數據,互聯網數據主要是利用打點,也就是通常所說的數據埋點上報的。整個過程是數據分析師根據業(yè)務需要提交數據上報的需求,然后由開發(fā)人員埋點,獲得數據(見圖7)。

圖7
除了上報的數據,還有從數據庫中同步的數據,一般會存到Hive表中,按照數據倉庫的規(guī)范,根據主題來放置。其他數據,比如調研的數據,以Excel格式存在,就需要把Excel 數據導入Hive 表中。
(2)挖掘層
有了基礎數據以后,就進入挖掘層,挖掘層主要做兩件事情,一個是數據倉庫的構建,另一個是標簽的預測,前者是后者的基礎。
一般來說,我們會根據數據層的數據表,對這些數據表的數據進行清洗、匯總,然后按照數據倉庫的分層思想,比如按照數據原始層、數據清洗層、數據匯總層、數據應用層等進行表的設計(見圖8)。

圖8
數據原始層中的數據就是上報的數據,沒有經過數據清洗處理,是最外層的用戶明細數據。
數據清洗層主要是數據原始層的數據經過簡單清洗之后的數據,已去除“臟”數據等明顯異常的數據。
數據匯總層的數據主要是根據數據分析的需求,針對想要的業(yè)務指標(比如,用戶一天的聽歌時長、歌曲數、歌手數等),按照用戶的維度,把用戶行為進行聚合,得到用戶的輕量指標的聚合表。
數據匯總層的作用主要是可以快速匯總數據,比如,一天的聽歌總數、聽歌總時長、聽歌時長高于1小時的用戶數、收藏歌曲數多于100的用戶數等的計算。
數據應用層主要面向業(yè)務方的需求進行加工,可能是在數據匯總的基礎上加工成對應報表的指標需求,比如,每天聽歌的人數、次數、時長;搜索的人數、次數、歌曲數等。
按照規(guī)范的數據倉庫把表格設計完成后,就可以得到一部分用戶的年齡、性別、地域的基礎屬性數據,以及用戶瀏覽、付費、活躍等行為數據。
有些用戶的數據無法獲取,以QQ音樂為例,我們一般無法獲取用戶的聽歌偏好屬性的數據,需要通過機器學習模型對用戶的偏好進行預測(見圖9)。機器學習的模型預測都是基于數據倉庫的數據,完整的數據倉庫數據是模型特征構建的基礎。

圖9
(3)服務層
有了數據層和挖掘層以后,用戶畫像體系基本形成,那么就到了用戶畫像賦能的階段。最基礎的應用就是利用用戶畫像寬表的數據,對用戶行為進行洞察歸因,挖掘行為和屬性特征的規(guī)律。
另外,比較大型的應用就是搭建用戶畫像平臺,其本質是用戶畫像表的集成。
用戶提?。?/span>我們可以利用用戶畫像平臺,快速提取用戶數據,比如,提取18~24歲的女性群體,且聽過周杰倫歌曲的用戶。
分群對比:可以利用用戶畫像平臺進行分群對比。比如,比較音樂類APP中VIP用戶和非VIP用戶在行為活躍和年齡、性別、地域、注冊時間、聽歌偏好上的差異。
功能畫像分析:可以利用用戶畫像平臺快速進行某個功能的用戶畫像描述分析,比如,音樂類APP中的每日推薦功能,我們想要知道使用每日推薦的用戶是哪些用戶群體,以及使用每日推薦不同時長的用戶特征分別是怎樣的。
本文節(jié)選自《數據分析方法論和業(yè)務實戰(zhàn)(全彩)》,歡迎閱讀此書了解更多相關內容。

數據分析的精髓在于能夠利用合理的數據分析方法來解決實際的業(yè)務問題,本書介紹了數據分析常見的思維和方法,并且呈現了這些分析方法在實際案例中的應用。
同時也利用本書解答了大家對于想要從事數據分析行業(yè)的一些擔憂和困惑。
閱讀本書,你會對數據分析的工作內容有更清晰、完整的了解,同時對常見的業(yè)務問題處理的方法和經驗有質的提升。
陳友洋,畢業(yè)于香港中文大學和中山大學,騰訊前數據科學家,數據分析類公眾號“漁好學”主理人,分享多篇數據相關的干貨文章。在知乎(知乎賬號:漁好學)上分享的數據分析相關文章的全網閱讀量超2 000 000次,廣受好評。在數據分析、數據體系搭建、數據科學方面具有多年經驗,積累了豐富的數據分析項目經驗。
本書涵蓋了數據分析的系統知識和業(yè)務實踐,不僅涵蓋了數據分析的基本工具、思維和方法論,還包括具體的業(yè)務問題應用,是市面上難得的理論與實際相結合的作品。本書內容囊括了作者多年工作沉淀的豐富經驗,體現了作者在數據分析方面的深厚造詣,無論是對于入門者,還是互聯網從業(yè)者,都是一本難得的“武功”秘籍。
——趙猛,騰訊算法工程師
作者從實操角度切入,將數據分析經典方法論與業(yè)務工作融會貫通,真實案例為引,以創(chuàng)新模式拓寬數據分析應用的陽光大道,引人入勝、百看不厭。
——劉王翔,中國移動資深項目經理
數據分析是一門藝術,既需要業(yè)務知識,也需要數據分析方法。本書從數據分析在行業(yè)內的應用出發(fā),全面地介紹了漏斗分析、相關分析、RFM用戶分群、5W2H等多種常用的數據分析方法,從方法到實踐,由表及里,由淺入深,是一本不可多得的好書。
——李渝方,“數據萬花筒”公眾號主編 《數據分析之道——用數據思維指導業(yè)務實戰(zhàn)》作者,阿里巴巴前數據分析師

掃碼了解本書詳情!
如果喜歡本文 歡迎 在看丨留言丨分享至朋友圈 三連 精選留言獲贊最多的兩位 將獲得本號免費贈書 熱文推薦
