1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        用戶畫像小百科全書

        共 7254字,需瀏覽 15分鐘

         ·

        2020-08-31 17:42

        點擊上方數(shù)據(jù)管道”,選擇“置頂星標”公眾號

        干貨福利,第一時間送達

        來源:http://suo.im/6aVjHQ

        一、 什么是用戶畫像

        用戶畫像是指根據(jù)用戶的屬性、用戶偏好、生活習(xí)慣、用戶行為等信息而抽象出來的標簽化用戶模型。通俗說就是給用戶打標簽,而標簽是通過對用戶信息分析而來的高度精煉的特征標識。通過打標簽可以利用一些高度概括、容易理解的特征來描述用戶,可以讓人更容易理解用戶,并且可以方便計算機處理。


        用戶畫像是對現(xiàn)實世界中用戶的建模,用戶畫像應(yīng)該包含目標,方式,組織,標準,驗證這5個方面。

        目標:指的是描述人,認識人,了解人,理解人。

        方式:又分為非形式化手段,如使用文字、語言、圖像、視頻等方式描述人;形式化手段,即使用數(shù)據(jù)的方式來刻畫人物的畫像。

        組織:指的是結(jié)構(gòu)化、非結(jié)構(gòu)化的組織形式。

        標準:指的是使用常識、共識、知識體系的漸進過程來刻畫人物,認識了解用戶。

        驗證:依據(jù)側(cè)重說明了用戶畫像應(yīng)該來源事實、經(jīng)得起推理和檢驗。
        在產(chǎn)品早期和發(fā)展期,會較多地借助用戶畫像,幫助產(chǎn)品人員理解用戶的需求,想象用戶使用的場景,產(chǎn)品設(shè)計從為所有人做產(chǎn)品變成為三四個人做產(chǎn)品,間接的降低復(fù)雜度。

        二、 用戶畫像的作用

        在互聯(lián)網(wǎng)、電商領(lǐng)域用戶畫像常用來作為精準營銷、推薦系統(tǒng)的基礎(chǔ)性工作,其作用總體包括:
        (1)精準營銷:根據(jù)歷史用戶特征,分析產(chǎn)品的潛在用戶和用戶的潛在需求,針對特定群體,利用短信、郵件等方式進行營銷。
        (2)用戶統(tǒng)計:根據(jù)用戶的屬性、行為特征對用戶進行分類后,統(tǒng)計不同特征下的用戶數(shù)量、分布;分析不同用戶畫像群體的分布特征。
        (3)數(shù)據(jù)挖掘:以用戶畫像為基礎(chǔ)構(gòu)建推薦系統(tǒng)、搜索引擎、廣告投放系統(tǒng),提升服務(wù)精準度。
        (4)服務(wù)產(chǎn)品:對產(chǎn)品進行用戶畫像,對產(chǎn)品進行受眾分析,更透徹地理解用戶使用產(chǎn)品的心理動機和行為習(xí)慣,完善產(chǎn)品運營,提升服務(wù)質(zhì)量。
        (5)行業(yè)報告&用戶研究:通過用戶畫像分析可以了解行業(yè)動態(tài),比如人群消費習(xí)慣、消費偏好分析、不同地域品類消費差異分析

        根據(jù)用戶畫像的作用可以看出,用戶畫像的使用場景較多,用戶畫像可以用來挖掘用戶興趣、偏好、人口統(tǒng)計學(xué)特征,主要目的是提升營銷精準度、推薦匹配度,終極目的是提升產(chǎn)品服務(wù),起到提升企業(yè)利潤。用戶畫像適合于各個產(chǎn)品周期:從新用戶的引流到潛在用戶的挖掘、從老用戶的培養(yǎng)到流失用戶的回流等。
        總結(jié)來說,用戶畫像必須從實際業(yè)務(wù)場景出發(fā),解決實際的業(yè)務(wù)問題,之所以進行用戶畫像,要么是獲取新用戶,要么是提升用戶體驗、或者挽回流失用戶等具有明確的業(yè)務(wù)目標。
        另外關(guān)于用戶畫像數(shù)據(jù)維度的問題,并不是說數(shù)據(jù)維度越豐富越好,總之,畫像維度的設(shè)計同樣需要緊跟業(yè)務(wù)實際情況進行開展。

        三、?用戶畫像的分類

        從畫像方法來說,可以分為定性畫像、定性+定量畫像、定量畫像
        從應(yīng)用角度來看,可以分為行為畫像、健康畫像、企業(yè)信用畫像、個人信用畫像、靜態(tài)產(chǎn)品畫像、旋轉(zhuǎn)設(shè)備畫像、社會畫像和經(jīng)濟畫像等。

        四、 用戶畫像需要用到哪些數(shù)據(jù)

        一般來說,根據(jù)具體的業(yè)務(wù)內(nèi)容,會有不同的數(shù)據(jù),不同的業(yè)務(wù)目標,也會使用不同的數(shù)據(jù)。在互聯(lián)網(wǎng)領(lǐng)域,用戶畫像數(shù)據(jù)可以包括以下內(nèi)容:

        (1)人口屬性:包括性別、年齡等人的基本信息

        (2)興趣特征:瀏覽內(nèi)容、收藏內(nèi)容、閱讀咨詢、購買物品偏好等

        (3)消費特征:與消費相關(guān)的特征

        (4)位置特征:用戶所處城市、所處居住區(qū)域、用戶移動軌跡等

        (5)設(shè)備屬性:使用的終端特征等

        (6)行為數(shù)據(jù):訪問時間、瀏覽路徑等用戶在網(wǎng)站的行為日志數(shù)據(jù)

        (7)社交數(shù)據(jù):用戶社交相關(guān)數(shù)據(jù)
        用戶畫像數(shù)據(jù)來源廣泛,這些數(shù)據(jù)是全方位了解用戶的基礎(chǔ),這里以Qunar的畫像為例,其畫像數(shù)據(jù)主要維度如下所示,包括用戶RFM信息、航線信息等。
        Qunar的畫像數(shù)據(jù)倉庫構(gòu)建都是基于Qunar基礎(chǔ)數(shù)據(jù)倉庫構(gòu)建,然后按照維度進行劃分。

        五、?用戶畫像主要應(yīng)用場景

        a)用戶屬性
        b)用戶標簽畫像
        c)用戶偏好畫像
        d)用戶流失
        e)用戶行為
        f)產(chǎn)品設(shè)計
        g)?個性化推薦、廣告系統(tǒng)、活動營銷、內(nèi)容推薦、興趣偏好

        六、?用戶畫像使用的技術(shù)方法
        靜態(tài)和動態(tài)的劃分,其實是根據(jù)某個維度來定的,或者是在某個時間窗口內(nèi)的。靜態(tài)畫像一般是實時性弱更新慢;動態(tài)畫像變化相對更快一些,可以在時效性、空間上有差異。
        不同的行業(yè),不同的業(yè)務(wù),也會有不一樣的構(gòu)建目標和方式。在這個過程中,通過業(yè)務(wù)應(yīng)用的要素分析,去驅(qū)動標簽維度的擴展,然后通過標簽維度的擴展。然后我又可以去驅(qū)動業(yè)務(wù)。
        七、 用戶畫像標簽體系的建立

        1、什么是標簽體系

        用戶畫像是對現(xiàn)實用戶做的一個數(shù)學(xué)模型,在整個數(shù)學(xué)模型中,核心是怎么描述業(yè)務(wù)知識體系,而這個業(yè)務(wù)知識體系就是本體論,本體論很復(fù)雜,我們找到一個特別樸素的實現(xiàn),就是標簽。

        標簽是某一種用戶特征的符號表示。是一種內(nèi)容組織方式,是一種關(guān)聯(lián)性很強的關(guān)鍵字,能方便的幫助我們找到合適的內(nèi)容及內(nèi)容分類。(注:簡單說,就是你把用戶分到多少個類別里面去,這些類是什么,彼此之間有什么關(guān)系,就構(gòu)成了標簽體系)

        標簽解決的是描述(或命名)問題,但在實際應(yīng)用中,還需要解決數(shù)據(jù)之間的關(guān)聯(lián),所以通常將標簽作為一個體系來設(shè)計,以解決數(shù)據(jù)之間的關(guān)聯(lián)問題。

        一般來說,將能關(guān)聯(lián)到具體用戶數(shù)據(jù)的標簽,稱為葉子標簽。對葉子標簽進行分類匯總的標簽,稱為父標簽。父標簽和葉子標簽共同構(gòu)成標簽體系,但兩者是相對概念。例如:下表中,地市、型號在標簽體系中相對于省份、品牌,是葉子標簽。
        用戶畫像標簽體系創(chuàng)建后一般要包含以下幾個方面的內(nèi)容

        (1)標簽分類

        用戶畫像標簽可以分為基礎(chǔ)屬性標簽和行為屬性標簽。

        由于基于一個目標的畫像,其標簽是在動態(tài)擴展的,所以其標簽體系也沒有統(tǒng)一的模板,在大分類上,與自身的業(yè)務(wù)特征有很大的關(guān)聯(lián),在整體思路上可以從橫縱兩個維度展開思考:橫向是產(chǎn)品內(nèi)數(shù)據(jù)和產(chǎn)品外數(shù)據(jù),縱向是線上數(shù)據(jù)和線下數(shù)據(jù)。而正中間則是永恒不變的“人物基礎(chǔ)屬性”。

        如果說其他的分類因企業(yè)特征而定,那么只有人物特征屬性(至于名字叫什么不重要,關(guān)鍵是內(nèi)涵)是各家企業(yè)不能缺失的板塊。

        所謂人物基礎(chǔ)屬性指的是:用戶客觀的屬性而非用戶自我表達的屬性,也就是描述用戶真實人口屬性的標簽。所謂非“自我表達”,舉例來說,某產(chǎn)品內(nèi)個人信息有性別一項,用戶填寫為“女”,而通過用戶上傳的身份證號,以及用戶照片,用戶購買的產(chǎn)品,甚至用戶打來的客服電話,都發(fā)現(xiàn)該用戶性別是“男性”。那么在人物基礎(chǔ)屬性中的性別,應(yīng)該標識的是“男性”,但是用戶信息標簽部分,自我描述的性別則可能標注為女性。

        (2)標簽級別(標簽的體系結(jié)構(gòu))

        分級有兩個層面的含義,其一是:指標到最低層級的涵蓋的層級;其二是指:指標的運算層級。其一非常好理解,這里重點說運算層級。

        標簽從運算層級角度可以分為三層:事實標簽、模型標簽、預(yù)測標簽。

        事實標簽:是通過對于原始數(shù)據(jù)庫的數(shù)據(jù)進行統(tǒng)計分析而來的,比如用戶投訴次數(shù),是基于用戶一段時間內(nèi)實際投訴的行為做的統(tǒng)計。

        模型標簽:模型標簽是以事實標簽為基礎(chǔ),通過構(gòu)建事實標簽與業(yè)務(wù)問題之間的模型,進行模型分析得到。比如,結(jié)合用戶實際投訴次數(shù)、用戶購買品類、用戶支付的金額等,進行用戶投訴傾向類型的識別,方便客服進行分類處理。

        預(yù)測標簽:則是在模型的基礎(chǔ)上做預(yù)測,比如針對投訴傾向類型結(jié)構(gòu)的變化,預(yù)測平臺輿情風(fēng)險指數(shù)。


        (3)標簽命名&賦值

        我們用一張圖來說明一下命名和賦值的差別,只要在構(gòu)建用戶標簽的過程種,有意識的區(qū)別標簽命名和賦值足矣,不再贅述。


        (4)標簽屬性

        標簽屬性可以理解為針對標簽進行的再標注,這一環(huán)節(jié)的工作主要目的是幫助內(nèi)部理解標簽賦值的來源,進而理解指標的含義。如圖所示,可以總結(jié)為5種來源:

        1、固有屬性:是指這些指標的賦值體現(xiàn)的是用戶生而有之或者事實存在的,不以外界條件或者自身認知的改變而改變的屬性。比如:性別、年齡、是否生育等。

        2、推導(dǎo)屬性:由其他屬性推導(dǎo)而來的屬性,比如星座,我們可以通過用戶的生日推導(dǎo),比如用戶的品類偏好,則可以通過日常購買來推導(dǎo)。

        3、行為屬性:產(chǎn)品內(nèi)外實際發(fā)生的行為被記錄后形成的賦值,比如用戶的登陸時間,頁面停留時長等。

        4、態(tài)度屬性:用戶自我表達的態(tài)度和意愿。比如說我們通過一份問卷向用戶詢問一些問題,并形成標簽,如詢問用戶:是否愿意結(jié)婚,是否喜歡某個品牌等。當然在大數(shù)據(jù)的需求背景下,利用問卷收集用戶標簽的方法效率顯得過低,更多的是利用產(chǎn)品中相關(guān)的模塊做了用戶態(tài)度信息收集。

        5、測試屬性:測試屬性是指來自用戶的態(tài)度表達,但并不是用戶直接表達的內(nèi)容,而是通過分析用戶的表達,結(jié)構(gòu)化處理后,得出的測試結(jié)論。比如,用戶填答了一系列的態(tài)度問卷,推導(dǎo)出用戶的價值觀類型等。


        值得注意的是,一種標簽的屬性可以是多重的,比如:個人星座這個標簽,既是固有屬性,也是推導(dǎo)屬性,它首先不以個人的意志為轉(zhuǎn)移,同時可以通過身份證號推導(dǎo)而來。

        即便你成功了建立用戶畫像的標簽體系,也不意味著你就開啟了用戶畫像的成功之路,因為有很大的可能是這些標簽根本無法獲得,或者說無法賦值。

        標簽無法賦值的原因有:數(shù)據(jù)無法采集(沒有有效的渠道和方法采集到準確的數(shù)據(jù),比如用戶身份證號)、數(shù)據(jù)庫不能打通、建模失?。A(yù)測指標無法獲得賦值)等等。

        ?2、標簽體系結(jié)構(gòu)

        ? ? ? ? 標簽體系可以歸納出如下的層級結(jié)構(gòu)。

        (1)原始輸入層

        主要指用戶的歷史數(shù)據(jù)信息,如會員信息、消費信息、網(wǎng)絡(luò)行為信息。經(jīng)過數(shù)據(jù)的清洗,從而達到用戶標簽體系的事實層。

        (2)事實層

        事實層是用戶信息的準確描述層,其最重要的特點是,可以從用戶身上得到確定與肯定的驗證。如用戶的人口屬性、性別、年齡、籍貫、會員信息等。

        (3)模型預(yù)測層

        通過利用統(tǒng)計建模,數(shù)據(jù)挖掘、機器學(xué)習(xí)的思想,對事實層的數(shù)據(jù)進行分析利用,從而得到描述用戶更為深刻的信息。如通過建模分析,可以對用戶的性別偏好進行預(yù)測,從而能對沒有收集到性別數(shù)據(jù)的新用戶進行預(yù)測。還可以通過建模與數(shù)據(jù)挖掘,使用聚類、關(guān)聯(lián)思想,發(fā)現(xiàn)人群的聚集特征。

        (4)營銷模型預(yù)測

        利用模型預(yù)測層結(jié)果,對不同用戶群體,相同需求的客戶,通過打標簽,建立營銷模型,從而分析用戶的活躍度、忠誠度、流失度、影響力等可以用來進行營銷的數(shù)據(jù)。

        (5)業(yè)務(wù)層

        業(yè)務(wù)層可以是展現(xiàn)層。它是業(yè)務(wù)邏輯的直接體現(xiàn),如圖中所表示的,有車一族、有房一族等。

        3、標簽體系結(jié)構(gòu)分類

        一般來說,設(shè)計一個標簽體系有3種思路,分別是:(1)結(jié)構(gòu)化標簽體系;(2)半結(jié)構(gòu)化標簽體系;(3)非結(jié)構(gòu)化標簽體系。

        (1)結(jié)構(gòu)化標簽體系

        簡單地說,就是標簽組織成比較規(guī)整的樹或森林,有明確的層級劃分和父子關(guān)系。結(jié)構(gòu)化標簽體系看起來整潔,又比較好解釋,在面向品牌廣告井噴時比較好用。性別、年齡這類人口屬性標簽,是最典型的結(jié)構(gòu)化體系。下圖就是Yahoo!受眾定向廣告平臺采用的結(jié)構(gòu)化標簽體系。


        (2)半結(jié)構(gòu)化標簽體系

        在用于效果廣告時,標簽設(shè)計的靈活性大大提高了。標簽體系是不是規(guī)整,就不那么重要了,只要有效果就行。在這種思路下,用戶標簽往往是在行業(yè)上呈現(xiàn)出一定的并列體系,而各行業(yè)內(nèi)的標簽設(shè)計則以“逮住老鼠就是好貓”為最高指導(dǎo)原則,切不可拘泥于形式。下圖是Bluekai聚合多家數(shù)據(jù)形成的半結(jié)構(gòu)化標簽體系。

        (3)非結(jié)構(gòu)化標簽體系

        非結(jié)構(gòu)化,就是各個標簽就事論事,各自反應(yīng)各自的用戶興趣,彼此之間并無層級關(guān)系,也很難組織成規(guī)整的樹狀結(jié)構(gòu)。非結(jié)構(gòu)化標簽的典型例子,是搜索廣告里用的關(guān)鍵詞。還有Facebook用的用戶興趣詞。

        ?4、用戶畫像標簽層級的建模方法

        用戶畫像的核心是標簽的建立,用戶畫像標簽建立的各個階段使用的模型和算法如下圖所示。

        原始數(shù)據(jù)層。對原始數(shù)據(jù),我們主要使用文本挖掘的算法進行分析如常見的TF-IDF、TopicModel主題模型、LDA 等算法,主要是對原始數(shù)據(jù)的預(yù)處理和清洗,對用戶數(shù)據(jù)的匹配和標識。

        事實標簽層。通過文本挖掘的方法,我們從數(shù)據(jù)中盡可能多的提取事實數(shù)據(jù)信息,如人口屬性信息,用戶行為信息,消費信息等。其主要使用的算法是分類和聚類。分類主要用于預(yù)測新用戶,信息不全的用戶的信息,對用戶進行預(yù)測分類。聚類主要用于分析挖掘出具有相同特征的群體信息,進行受眾細分,市場細分。對于文本的特征數(shù)據(jù),其主要使用相似度計算,如余弦夾角,歐式距離等。

        模型標簽層。使用機器學(xué)習(xí)的方法,結(jié)合推薦算法。模型標簽層完成對用戶的標簽建模與用戶標識。其主要可以采用的算法有回歸,決策樹,支持向量機等。通過建模分析,我們可以進一步挖掘出用戶的群體特征和個性權(quán)重特征,從而完善用戶的價值衡量,服務(wù)滿意度衡量等。

        預(yù)測層。也是標簽體系中的營銷模型預(yù)測層。這一層級利用預(yù)測算法,如機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí),計量經(jīng)濟學(xué)中的回歸預(yù)測,數(shù)學(xué)中的線性規(guī)劃等方法。實習(xí)對用戶的流失預(yù)測,忠實度預(yù)測,興趣程度預(yù)測等等,從而實現(xiàn)精準營銷,個性化和定制化服務(wù)。

        不同的標簽層級會考慮使用對其適用的建模方法,對一些具體的問題,有專門的文章對其進行研究。

        八、 用戶畫像基本步驟

        根據(jù)具體業(yè)務(wù)規(guī)則確定用戶畫像方向后,開展用戶畫像分析,總體來說,一個用戶畫像流程包括以下三步。(1)用戶畫像的基本方向;(2)用戶數(shù)據(jù)收集;(3)用戶標簽建模。

        另外,需要注意的是用戶畫像的時效性,構(gòu)建畫像的數(shù)據(jù)多為歷史數(shù)據(jù),但用戶的行為、偏好等特征多會隨著時間的推移而發(fā)生變化。


        九、 用戶畫像驗證


        十、 用戶畫像的實際例子
        注:此處涉及到工作中的項目內(nèi)容,由于保密,就不能分享了

        十一、? ? 用戶畫像平臺&架構(gòu)
        用戶畫像平臺需要實現(xiàn)的功能。
        用戶畫像系統(tǒng)技術(shù)架構(gòu)

        (1)? ? 數(shù)據(jù)處理
        a、數(shù)據(jù)指標的梳理來源于各個系統(tǒng)日常積累的日志記錄系統(tǒng),通過sqoop導(dǎo)入hdfs,也可以用代碼來實現(xiàn),比如spark的jdbc連接傳統(tǒng)數(shù)據(jù)庫進行數(shù)據(jù)的cache。還有一種方式,可以通過將數(shù)據(jù)寫入本地文件,然后通過sparksql的load或者hive的export等方式導(dǎo)入HDFS。

        b、通過hive編寫UDF 或者hiveql根據(jù)業(yè)務(wù)邏輯拼接ETL,使用戶對應(yīng)上不同的用戶標簽數(shù)據(jù)(這里的指標可以理解為每個用戶打上了相應(yīng)的標簽),生成相應(yīng)的源表數(shù)據(jù),以便于后續(xù)用戶畫像系統(tǒng),通過不同的規(guī)則進行標簽寬表的生成。
        (2)? ? 數(shù)據(jù)平臺

        a、數(shù)據(jù)平臺應(yīng)用的分布式文件系統(tǒng)為Hadoop的HDFS,因為Hadoop2.0以后,任何的大數(shù)據(jù)應(yīng)用都可以通過ResoureManager申請資源,注冊服務(wù)。比如(sparksubmit、hive)等等。而基于內(nèi)存的計算框架的出現(xiàn),就并不選用Hadoop的MapReduce了。當然很多離線處理的業(yè)務(wù),很多人還是傾向于使用Hadoop,但是Hadoop封裝的函數(shù)只有map和Reduce太過單一,而不像spark一類的計算框架有更多封裝的函數(shù)(可參考博客spark專欄)??梢源蟠筇嵘_發(fā)效率。

        b、計算的框架選用Spark以及RHadoop,這里Spark的主要用途有兩種,一種是對于數(shù)據(jù)處理與上層應(yīng)用所指定的規(guī)則的數(shù)據(jù)篩選過濾,(通過Scala編寫spark代碼提交至sparksubmit)。一種是服務(wù)于上層應(yīng)用的SparkSQL(通過啟動spark thriftserver與前臺應(yīng)用進行連接)。RHadoop的應(yīng)用主要在于對于標簽數(shù)據(jù)的打分,比如利用協(xié)同過濾算法等各種推薦算法對數(shù)據(jù)進行各方面評分。

        c、MongoDB內(nèi)存數(shù)據(jù)的應(yīng)用主要在于對于單個用戶的實時的查詢,也是通過對spark數(shù)據(jù)梳理后的標簽寬表進行數(shù)據(jù)格式轉(zhuǎn)換(json格式)導(dǎo)入mongodb,前臺應(yīng)用可通過連接mongodb進行數(shù)據(jù)轉(zhuǎn)換,從而進行單個標簽的展現(xiàn)。(當然也可將數(shù)據(jù)轉(zhuǎn)換為Redis中的key value形式,導(dǎo)入Redis集群)

        d、mysql的作用在于針對上層應(yīng)用標簽規(guī)則的存儲,以及頁面信息的展現(xiàn)。后臺的數(shù)據(jù)寬表是與spark相關(guān)聯(lián),通過連接mysql隨后cache元數(shù)據(jù)進行filter、select、map、reduce等對元數(shù)據(jù)信息的整理,再與真實存在于Hdfs的數(shù)據(jù)進行處理。

        (3)? ? 面向應(yīng)用

        從剛才的數(shù)據(jù)整理、數(shù)據(jù)平臺的計算,都已經(jīng)將服務(wù)于上層應(yīng)用的標簽大寬表生成。(用戶所對應(yīng)的各類標簽信息)。那么前臺根據(jù)業(yè)務(wù)邏輯,勾選不同的標簽進行求和、剔除等操作,比如本月流量大于200M用戶(標簽)+本月消費超過100元用戶(標簽)進行和的操作,通過前臺代碼實現(xiàn)sql的拼接,進行客戶數(shù)目的探索。這里就是通過jdbc的方式連接spark的thriftserver,通過集群進行HDFS上的大寬表的運算求count。(這里要注意一點,很多sql聚合函數(shù)以及多表關(guān)聯(lián)join 相當于hadoop的mapreduce的shuffle,很容易造成內(nèi)存溢出,相關(guān)參數(shù)調(diào)整可參考本博客spark欄目中的配置信息)這樣便可以定位相應(yīng)的客戶數(shù)量,從而進行客戶群、標簽的分析,產(chǎn)品的策略匹配從而精準營銷。

        十二、用戶畫像困難點、用戶畫像瓶頸

        用戶畫像困難點主要表現(xiàn)為以下4個方面

        資料搜集和數(shù)據(jù)挖掘

        在畫像之前需要知道產(chǎn)品的用戶特征和用戶使用產(chǎn)品的行為等因素,從而從總體上掌握對用戶需求

        創(chuàng)建用戶畫像不是抽離出典型進行單獨標簽化的過程,而是要融合邊緣環(huán)境的相關(guān)信息來進行討論

        定量調(diào)研分析

        我們的用戶標簽包含基本特征、社會身份、顧客用戶生命周期、類目偏好等等。比如說你怎么判斷一個人是不是對女裝感興趣,假設(shè)我們有一個類目就是女裝,那很好辦,如果你購買都是女裝,那會認為你這個人對女裝比較感興趣。

        我們期間遇到了兩方面的挑戰(zhàn):
        億級畫像系統(tǒng)實踐和應(yīng)用
        記錄和存儲億級用戶的畫像,支持和擴展不斷增加的維度和偏好,毫秒級的更新,支撐公司個性化推薦、廣告投放和精細化營銷等產(chǎn)品。

        瀏覽 56
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            人人干人人在线 | 偷拍自拍网 | 午夜精品一二三区 | 久久久久久久久久久爱 | 精品无码免费一区二区三区 | 国产又粗又长又黄又爽视频 | 操逼电影视频 | 特黄AAAAAAAA片视频 | 美女视频黄a是视频大全国产 | 99re6热精品免费视频网站 |