數(shù)據(jù)中臺:基于標簽體系的360°用戶畫像

導讀:通過標簽體系,建立數(shù)據(jù)中臺,打通用戶數(shù)據(jù)。

實物標簽是用于標明物品的品名、重量、體積、用途等信息的簡要標牌,例如:商品標簽、圖書標簽、車檢標簽、文件標簽、服裝吊牌、車票、登機牌都是實物標簽。 網(wǎng)絡(luò)標簽(Tag)是一種互聯(lián)網(wǎng)內(nèi)容組織方式,是相關(guān)性很強的關(guān)鍵字,它幫助人們輕松的描述和分類內(nèi)容,以便于檢索和分享,Tag是web 2.0的重要元素。 電子標簽又稱RFID射頻標簽,是一種識別效率高和準確性好的識別工具,通過射頻信號自動識別目標對象并獲取相關(guān)數(shù)據(jù),識別工作無須人工干預,可工作于各種惡劣環(huán)境。


基礎(chǔ)標簽主要是指對用戶基礎(chǔ)特征的描述,比如:姓名、性別、年齡、身高、體重等。 業(yè)務(wù)標簽是在基礎(chǔ)標簽之上依據(jù)相關(guān)業(yè)務(wù)的業(yè)務(wù)經(jīng)驗并結(jié)合統(tǒng)計方法生成的標簽,比如:用戶忠誠度、用戶購買力等標簽就是根據(jù)用戶的登錄次數(shù)、在線時間、單位時間活躍次數(shù)、購買次數(shù)、單次購買金額、總購買金額等指標計算出來的。業(yè)務(wù)標簽可以將經(jīng)營固化為知識,為更多的人使用。 智能標簽是利用人工智能技術(shù)基于機器學習算法,通過大量的數(shù)據(jù)計算而實現(xiàn)的自動化、推薦式的進行打標簽,比如今日頭條的推薦引擎就是通過智能標簽體系給用戶推送其感興趣的內(nèi)容的。





有線下采集的信息,比如通過訪談、調(diào)研等方式采集的數(shù)據(jù); 有線上采集的信息,比如:消費記錄、瀏覽日志、收藏記錄等; 有從第三方接口接入的信息,比如微信接口可以獲取用戶微信的昵稱、性別、地域,QQ接口可以獲取用戶QQ的昵稱、性別、年齡、生日、星座、地域等信息; 還有通過爬蟲獲取的數(shù)據(jù),比如微博、評論、論壇等社交媒體的內(nèi)容; 通過機器學習來訓練得到信息,比如通過預置機器學習算法; 利用網(wǎng)絡(luò)爬蟲不斷抓取數(shù)據(jù)進行大量計算得出來的數(shù)據(jù),比如情感偏好、購物偏好等。

行為類型權(quán)重:用戶瀏覽、搜索、收藏、下單、購買等不同行為對用戶而言有著不同的重要性(偏序關(guān)系),該權(quán)重值一般由運營人員或業(yè)務(wù)來決定; 時間衰減:用戶某些行為受時間影響不斷減弱,行為時間距現(xiàn)在越遠,該行為對用戶當前來說的意義越小,采用牛頓冷卻定律; 行為次數(shù):用戶標簽權(quán)重按天統(tǒng)計,用戶某天與該標簽產(chǎn)生的行為次數(shù)越多,該標簽對用戶的影響越大。
基于規(guī)則定義的標簽生產(chǎn)方式,即根據(jù)固定的規(guī)則,通過數(shù)據(jù)查詢的結(jié)果生產(chǎn)標簽,重點在于如何制定規(guī)則。 基于主題模型的標簽生產(chǎn)方式,主題模型最開始運用于內(nèi)容領(lǐng)域,目的是找到用戶的偏好,在用戶標簽中我們可以參照分類算法將用戶進行分類、聚類,使用關(guān)鍵詞的算法挖掘用戶的偏好,從而生產(chǎn)標簽。


評論
圖片
表情
