推薦系統(tǒng)之標(biāo)簽體系
為什么要先介紹標(biāo)簽體系?



老板問:蘋果,是實(shí)體標(biāo)簽嗎? 給你三秒鐘思考 你回答:是! 老板說:錯(cuò)! 你懵逼:靠!為啥不是?

難道我就不能用“蘋果”了嗎?當(dāng)然可以用,只不過要給它另外起個(gè)名字:概念標(biāo)簽。

這里以之家的標(biāo)簽體系舉例,要給買車用戶推薦評(píng)測(cè)導(dǎo)購(gòu)(一級(jí))的文章,用戶畫像中車的品牌(二級(jí))偏好太粗,而實(shí)體標(biāo)簽如奔馳GLC又太細(xì),填補(bǔ)這中間的粒度空白,滿足用戶購(gòu)車意圖的畫像,就加入“代步優(yōu)選”的主題詞,這樣不僅保持了推薦的多樣性,又不至于過分精準(zhǔn)而導(dǎo)致的極度收斂。

原則一、放棄?而全的框架,以業(yè)務(wù)場(chǎng)景倒推標(biāo)簽需求

定義業(yè)務(wù)方需要的標(biāo)簽 創(chuàng)建標(biāo)簽實(shí)例 執(zhí)行業(yè)務(wù)標(biāo)簽實(shí)例,提供相應(yīng)數(shù)據(jù)
智能營(yíng)銷 Feed流推薦 個(gè)性化消息push
1. 業(yè)務(wù)梳理
有哪些產(chǎn)品線?產(chǎn)品線有哪些來源渠道?一一列出 每個(gè)產(chǎn)品線有哪些業(yè)務(wù)對(duì)象?比如用戶,商品 最后再根據(jù)對(duì)象聚合業(yè)務(wù),每個(gè)對(duì)象涉及哪些業(yè)務(wù)?每個(gè)業(yè)務(wù)下哪些業(yè)務(wù)數(shù)據(jù)和用戶行為?

方便管理標(biāo)簽,便于維護(hù)和擴(kuò)展 結(jié)構(gòu)清晰,展示標(biāo)簽之間的關(guān)聯(lián)關(guān)系 為標(biāo)簽建模提供子集。方便獨(dú)立計(jì)算某個(gè)標(biāo)簽下的屬性偏好或者權(quán)重

靜態(tài)屬性標(biāo)簽。長(zhǎng)期甚至永遠(yuǎn)都不會(huì)發(fā)生改變。比如性別,出生日期,這些數(shù)據(jù)都是既定的事實(shí),幾乎不會(huì)改變 動(dòng)態(tài)屬性標(biāo)簽。存在有效期,需要定期地更新,保證標(biāo)簽的有效性。比如用戶的購(gòu)買力,用戶的活躍情況
事實(shí)標(biāo)簽。既定事實(shí),從原始數(shù)據(jù)中提取。比如通過用戶設(shè)置獲取性別,通過實(shí)名認(rèn)證獲取生日,星座等信息 模型標(biāo)簽。沒有對(duì)應(yīng)數(shù)據(jù),需要定義規(guī)則,建立模型來計(jì)算得出標(biāo)簽實(shí)例。比如支付偏好度 預(yù)測(cè)標(biāo)簽。參考已有事實(shí)數(shù)據(jù),來預(yù)測(cè)用戶的行為或偏好。比如用戶a的歷史購(gòu)物行為與群體A相似,使用協(xié)同過濾算法,預(yù)測(cè)用戶a也會(huì)喜歡某件物品

理解標(biāo)簽體系的設(shè)計(jì) 表達(dá)自己的需求
設(shè)計(jì)合理數(shù)據(jù)處理單元,相互獨(dú)立,協(xié)同處理 標(biāo)簽的及時(shí)更新及數(shù)據(jù)響應(yīng)的效率
屬性信息缺失怎么辦?比如,現(xiàn)實(shí)中總有用戶未設(shè)置用戶性別,那怎么才能知道用戶的性別呢? 行為屬性,消費(fèi)屬性的標(biāo)簽?zāi)懿荒莒`活設(shè)置?比如,活躍運(yùn)營(yíng)中需要做A/B test,不能將品牌偏好規(guī)則寫死,怎么辦? 既有的屬性創(chuàng)建不了我想要的標(biāo)簽?比如,用戶消費(fèi)能力需要綜合結(jié)合多項(xiàng)業(yè)務(wù)的數(shù)據(jù)才合理,如何解決?
時(shí)間的開放。支持時(shí)間任意選擇:昨天,前天,近x天,自定義某段時(shí)間等等 支付筆數(shù)的開放。大于,等于,小于某個(gè)值,或者在某兩個(gè)值區(qū)間
標(biāo)簽的最小顆粒度要觸達(dá)到具體業(yè)務(wù)事實(shí)數(shù)據(jù),同時(shí)支持對(duì)應(yīng)標(biāo)簽實(shí)例的規(guī)則自定義 不同的標(biāo)簽可以相互自由組合為新的標(biāo)簽,同時(shí)支持標(biāo)簽間的關(guān)系,權(quán)重自定義
評(píng)論
圖片
表情

