1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        干貨 | 如何突破數(shù)據(jù)分析(萬(wàn)字總結(jié))

        共 13952字,需瀏覽 28分鐘

         ·

        2022-08-26 10:15

        轉(zhuǎn)自:大數(shù)據(jù)分析和人工智能

        文整理自知乎專欄:突破數(shù)據(jù)分析[1],作者是網(wǎng)易數(shù)據(jù)分析高級(jí)總監(jiān)賀志,


        看到一篇數(shù)據(jù)分析好文,分享給大家,主要講數(shù)據(jù)分析方法論、經(jīng)驗(yàn)總結(jié)以及個(gè)人成長(zhǎng)。


        正 文




        我是一個(gè)數(shù)據(jù)從業(yè)者,很早以前就想把自己在工作和學(xué)習(xí)中的心得做個(gè)總結(jié)。一方面是對(duì)自己過(guò)往經(jīng)歷的一個(gè)總結(jié)和回顧;一方面最近幾年大數(shù)據(jù)是越來(lái)越火了,也希望自己的經(jīng)驗(yàn)?zāi)軒偷侥切?duì)數(shù)據(jù)有熱情、希望從事數(shù)據(jù)行業(yè)的新人們;還有一方面,也非常重要,是希望借助知乎這個(gè)平臺(tái)跟廣大同行們做一個(gè)交流,互相幫助,共同成長(zhǎng)。
        在開寫之前,先做下自我介紹。我在企業(yè)里從事數(shù)據(jù)相關(guān)的工作已經(jīng)有11年了,在這些年里,我做過(guò)咨詢顧問(wèn)、數(shù)據(jù)分析師、售前工程師、開發(fā)工程師、數(shù)據(jù)分析經(jīng)理直至總監(jiān)。在管理崗上,我?guī)н^(guò)數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)產(chǎn)品、數(shù)據(jù)倉(cāng)庫(kù)等各種團(tuán)隊(duì),其中帶數(shù)據(jù)分析團(tuán)隊(duì)時(shí)間是最長(zhǎng)的。先后就職于國(guó)企、傳統(tǒng)制造業(yè)和互聯(lián)網(wǎng)企業(yè)。總的來(lái)說(shuō),比較雜。現(xiàn)在想來(lái)其實(shí)有得有失。缺失的是,在任何一個(gè)細(xì)分領(lǐng)域上都沒(méi)有做得特別深入,不算是一個(gè)合格的專家;得到更多的是,我對(duì)整個(gè)數(shù)據(jù)的產(chǎn)生、處理、分析直至為企業(yè)提供價(jià)值的過(guò)程都有過(guò)體會(huì)和思考,從而也使我能夠站在一個(gè)更高的角度上看問(wèn)題。到底是成為一個(gè)專才好還是通才好,我覺(jué)得這沒(méi)有一個(gè)確定的答案。個(gè)人覺(jué)得T型人才是比較受歡迎的,也就是自己的技能和業(yè)務(wù)面同時(shí)要有寬度和深度。當(dāng)然,到底多寬或多深才合適,取決于個(gè)人的職業(yè)發(fā)展意向?;谖业慕?jīng)驗(yàn),我分享的更多是對(duì)這個(gè)行業(yè)的理解、做事情的思想和方法論,而不會(huì)側(cè)重于具體的實(shí)現(xiàn)技術(shù)。想學(xué)技術(shù)的同學(xué)請(qǐng)繞行。
        后面我預(yù)計(jì)要分享的內(nèi)容包括數(shù)據(jù)分析、產(chǎn)品、倉(cāng)庫(kù)、數(shù)據(jù)團(tuán)隊(duì)建設(shè)等等。個(gè)人經(jīng)驗(yàn)最多的是數(shù)據(jù)分析,就從這里開始吧??赡馨ㄒ韵略掝}:
        • 什么是數(shù)據(jù)分析?
        • 數(shù)據(jù)分析有哪些分類?
        • 如何設(shè)定分析目標(biāo)?
        • 怎樣才算是一個(gè)合格的數(shù)據(jù)分析師?
        • 什么樣的企業(yè)需要數(shù)據(jù)分析師?
        • 怎樣建立一個(gè)數(shù)據(jù)分析師團(tuán)隊(duì)?
        • 數(shù)據(jù)分析師團(tuán)隊(duì)的價(jià)值是什么?如何實(shí)現(xiàn)?
        • 數(shù)據(jù)分析師團(tuán)隊(duì)的崗位設(shè)置及分工合作
        • 一篇好的分析報(bào)告有什么樣的標(biāo)準(zhǔn)?
        • 數(shù)據(jù)分析三元論(勢(shì)、道、術(shù))

        什么是數(shù)據(jù)分析

        一句話定義,數(shù)據(jù)分析是一個(gè)從數(shù)據(jù)中通過(guò)分析手段發(fā)現(xiàn)業(yè)務(wù)價(jià)值的過(guò)程。這個(gè)過(guò)程的起點(diǎn)是獲取一份數(shù)據(jù),這個(gè)過(guò)程的終點(diǎn)是發(fā)現(xiàn)業(yè)務(wù)價(jià)值。過(guò)程可以大致為分?jǐn)?shù)據(jù)獲取——數(shù)據(jù)清洗——數(shù)據(jù)處理——數(shù)據(jù)建?!治鼋Y(jié)果呈現(xiàn)——業(yè)務(wù)價(jià)值發(fā)現(xiàn)——業(yè)務(wù)價(jià)值實(shí)現(xiàn)這幾個(gè)階段。
        在具體說(shuō)明每個(gè)階段之前,首先要談下我對(duì)數(shù)據(jù)和業(yè)務(wù)價(jià)值這兩個(gè)概念的理解。
        • 數(shù)據(jù):我認(rèn)為數(shù)據(jù)不是簡(jiǎn)單的數(shù)字,換句話說(shuō),如果你只告訴我一串?dāng)?shù)字 170、172、180而沒(méi)有其他信息,那么這幾個(gè)數(shù)字就僅僅是數(shù)字而已,而不是數(shù)據(jù)。數(shù)據(jù)除了數(shù)字本身之外,還必須包含數(shù)字的來(lái)源、度量方式、單位、代表的業(yè)務(wù)場(chǎng)景(即數(shù)據(jù)產(chǎn)生的上下文環(huán)境)等等。其中,我認(rèn)為場(chǎng)景是最重要的。仍舊拿上面的例子來(lái)說(shuō),如果你告訴這是三個(gè)地區(qū)的平均身高,那可以說(shuō)這是一組有意義的數(shù)據(jù)了,至于單位,我會(huì)猜到是厘米;而來(lái)源和度量方式?jīng)Q定了這個(gè)數(shù)據(jù)的可信程度。
        • 業(yè)務(wù)價(jià)值:不能服務(wù)于業(yè)務(wù)的數(shù)據(jù)分析是沒(méi)有生命力的,不能產(chǎn)生業(yè)務(wù)價(jià)值的數(shù)據(jù)分析是徒勞無(wú)功的。因此,能否實(shí)現(xiàn)業(yè)務(wù)價(jià)值決定了這是否是一次成功的數(shù)據(jù)分析。而分析工作只是實(shí)現(xiàn)了這個(gè)過(guò)程的第一步,它通過(guò)分析師的視角將價(jià)值呈現(xiàn)于業(yè)務(wù)人員面前,分析的結(jié)果只有被業(yè)務(wù)人員理解,并最終通過(guò)業(yè)務(wù)人員的努力轉(zhuǎn)化為業(yè)務(wù)實(shí)施(在大多數(shù)公司數(shù)據(jù)分析和業(yè)務(wù)運(yùn)營(yíng)這兩種不同的角色會(huì)分屬不同的部門,增長(zhǎng)黑客則是一種新的形式),才可能最終實(shí)現(xiàn)價(jià)值。
        過(guò)程的詳細(xì)說(shuō)明:
        • 數(shù)據(jù)獲?。哼@個(gè)階段的輸入需要一個(gè)分析目標(biāo),哪怕不是那么的明確和清晰。為什么需要一個(gè)目標(biāo)?在一個(gè)大型企業(yè)中,可以獲取的數(shù)據(jù)往往是海量,如果沒(méi)有一個(gè)目標(biāo)限制,那數(shù)據(jù)分析往往是無(wú)從著手的。這個(gè)階段的輸出是一個(gè)數(shù)據(jù)子集,它可以是物理上的貨邏輯上的。所謂物理上的,就是把分析中用到的數(shù)據(jù)單獨(dú)拷貝到一個(gè)地方;而邏輯上就只是定義出可用的數(shù)據(jù)范圍,比如時(shí)間周期、維度、指標(biāo)等。這個(gè)階段的困難之處在于理解相關(guān)的數(shù)據(jù)源,因?yàn)閿?shù)據(jù)源文檔不完整或者變更的情況經(jīng)常在業(yè)務(wù)中發(fā)生。數(shù)據(jù)清洗:通常包括異常數(shù)據(jù)的處理、缺失數(shù)據(jù)的處理、數(shù)據(jù)的一致性變換、編碼的替換等
        • 數(shù)據(jù)處理:對(duì)數(shù)據(jù)進(jìn)行匯總,或者形式上的變換,以便可以適用于后期的建模
        • 數(shù)據(jù)建模:用統(tǒng)計(jì)分析或機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)建模,以便描述數(shù)據(jù)或?qū)ξ磥?lái)進(jìn)行預(yù)測(cè)。其實(shí)大多數(shù)分析師在這個(gè)階段只觀測(cè)數(shù)據(jù)的同比、環(huán)比的趨勢(shì)上的變化,亦或?qū)χ笜?biāo)在不同維度上進(jìn)行拆分,以觀察維度對(duì)指標(biāo)變化的影響。以上三個(gè)階段在很多書籍中都有具體的技術(shù)描述,不再贅述。
        • 分析結(jié)果呈現(xiàn):通常認(rèn)為,這個(gè)階段的主要任務(wù)是把建模的結(jié)果以圖、表或者更加復(fù)雜的可視化方式呈現(xiàn)出來(lái)。但我認(rèn)為不止于此。首先,呈現(xiàn)結(jié)果不是這個(gè)階段的目的,目的應(yīng)該是讓業(yè)務(wù)人員對(duì)分析結(jié)果有充分的理解。其次,呈現(xiàn)的手段除了可視化,最重要的應(yīng)該是溝通。而溝通是雙向的,可以保證結(jié)果最大程度上被他人理解。業(yè)務(wù)價(jià)值發(fā)現(xiàn):通常數(shù)據(jù)分析師會(huì)在分析結(jié)果中提出對(duì)業(yè)務(wù)的價(jià)值,但是這個(gè)價(jià)值只有被業(yè)務(wù)人員認(rèn)可才有可能實(shí)現(xiàn)。所以,此處的“發(fā)現(xiàn)”應(yīng)該是分析師和業(yè)務(wù)人員的“共同認(rèn)知”。
        • 業(yè)務(wù)價(jià)值實(shí)現(xiàn):業(yè)務(wù)價(jià)值發(fā)現(xiàn)和實(shí)現(xiàn)經(jīng)常不被包含在數(shù)據(jù)分析過(guò)程中。但是,就如同我對(duì)數(shù)據(jù)分析的定義,業(yè)務(wù)價(jià)值才是數(shù)據(jù)分析的終極目的。因此,我認(rèn)為價(jià)值的實(shí)現(xiàn)才是整個(gè)過(guò)程的最后一個(gè)階段,這個(gè)階段雖然是有業(yè)務(wù)人員控制的,但是仍然需要分析師的深度參與。因?yàn)殡p方對(duì)于分析結(jié)果的理解和價(jià)值的發(fā)現(xiàn)經(jīng)常出現(xiàn)偏差,需要在實(shí)踐中逐步達(dá)到統(tǒng)一。最后,關(guān)于數(shù)據(jù)分析過(guò)程,我認(rèn)為有幾點(diǎn)需要給予非常的重視:
        在開始做分析之前,首先要有分析目標(biāo)!分析目標(biāo)!分析目標(biāo)!重要的事情說(shuō)三遍。
        • 過(guò)程不是單向的,在后一個(gè)階段中發(fā)現(xiàn)問(wèn)題時(shí)可以跳回到前一階段
        • 過(guò)程不是一次性,而是不斷循環(huán)往復(fù)的。上一次分析過(guò)程的終點(diǎn),可能是下一次分析過(guò)程的起點(diǎn)。我們經(jīng)常會(huì)在業(yè)務(wù)價(jià)值發(fā)現(xiàn)和實(shí)現(xiàn)階段發(fā)現(xiàn)新的分析主題,并把它作為下一次分析的起點(diǎn)。
        • 對(duì)于任何一次分析來(lái)講,不是每個(gè)階段都是必需的
        • 整個(gè)過(guò)程中的大多數(shù)時(shí)間都需要分析師和業(yè)務(wù)人員的密切合作

        數(shù)據(jù)分析有哪些分類

        面對(duì)的問(wèn)題不同:戰(zhàn)略、運(yùn)營(yíng)

        戰(zhàn)略分析:是為了解決公司戰(zhàn)略方向問(wèn)題,回答要向哪里去的問(wèn)題。
        • 此類分析通常比較宏觀,需要分析者有大局觀、有戰(zhàn)略思維;
        • 所用的數(shù)據(jù)除了公司內(nèi)部的數(shù)據(jù),還需要競(jìng)品數(shù)據(jù)、行業(yè)數(shù)據(jù)。
        • 戰(zhàn)略分析的方法:需要從競(jìng)品及行業(yè)數(shù)據(jù)中發(fā)現(xiàn)行業(yè)發(fā)展趨勢(shì)及競(jìng)品的戰(zhàn)略定位,同時(shí)結(jié)合公司內(nèi)部數(shù)據(jù),可以發(fā)現(xiàn)相對(duì)于行業(yè)和競(jìng)品發(fā)展,內(nèi)部在哪些地方存在不足,以此制定進(jìn)攻和防守策略
        運(yùn)營(yíng)分析:不同于戰(zhàn)略分析,運(yùn)營(yíng)分析以解決實(shí)際運(yùn)營(yíng)問(wèn)題為目標(biāo),比較微觀。
        • 需要分析者對(duì)公司業(yè)務(wù)模式、運(yùn)營(yíng)細(xì)節(jié)有深入的了解;
        • 使用的數(shù)據(jù)以公司內(nèi)部數(shù)據(jù)為主。
        • 此類分析最重要的是,分析結(jié)果要能夠與運(yùn)營(yíng)結(jié)合,并能有效落地

        服務(wù)的部門不同:業(yè)務(wù)、數(shù)據(jù)

        • 業(yè)務(wù)分析:此類分析由業(yè)務(wù)部門發(fā)起,提交給分析師執(zhí)行,最終結(jié)果交付給業(yè)務(wù)部門。此類分析一般在最終的價(jià)值發(fā)現(xiàn)環(huán)節(jié)效率較高,問(wèn)題的針對(duì)性較強(qiáng)。
        • 數(shù)據(jù)分析:此類分析由數(shù)據(jù)部門發(fā)起,最終結(jié)果視具體情況可能提高給業(yè)務(wù)部門或者管理層。由于此類分析的視角不同于業(yè)務(wù)分析,在最終的價(jià)值發(fā)現(xiàn)和實(shí)現(xiàn)環(huán)節(jié)需要與業(yè)務(wù)部門的深入溝通。同時(shí),也正是由于視角不同,會(huì)經(jīng)常發(fā)現(xiàn)業(yè)務(wù)部門沒(méi)有發(fā)現(xiàn)或者忽視的問(wèn)題。

        分析的范圍不同:行業(yè)、公司、部門、業(yè)務(wù)環(huán)節(jié)

        • 行業(yè)分析:目的是總結(jié)和預(yù)測(cè)整個(gè)行業(yè)的過(guò)去和未來(lái)的發(fā)展趨勢(shì),時(shí)間窗口一般在1年以上。使用場(chǎng)景較多的是在投資公司中或者很多公司的市場(chǎng)宣傳稿中會(huì)出現(xiàn)。行業(yè)分析的對(duì)象是商業(yè)模式或者業(yè)務(wù)形態(tài),關(guān)注的是資金、市場(chǎng)格局、用戶需求的變化和各企業(yè)的應(yīng)對(duì)。最有價(jià)值和最難的是要提前預(yù)測(cè)行業(yè)的增長(zhǎng)爆發(fā)點(diǎn)和衰退的轉(zhuǎn)折點(diǎn)。
        • 公司分析:目的是結(jié)合行業(yè)分析對(duì)公司業(yè)務(wù)發(fā)展做出診斷,給公司發(fā)展提供決策建議。時(shí)間窗口一般在一年以內(nèi),在公司戰(zhàn)略決策會(huì)發(fā)揮較大的作用。SWOT等方法適合在公司分析中使用。分析者首先要認(rèn)清企業(yè)的商業(yè)模式,要與公司的管理者同步公司的短期和長(zhǎng)期目標(biāo),了解企業(yè)的盈利來(lái)源和運(yùn)作方式,通過(guò)公司內(nèi)外部數(shù)據(jù)的對(duì)比發(fā)現(xiàn)運(yùn)營(yíng)中的問(wèn)題和商機(jī)。在這個(gè)過(guò)程中,了解市場(chǎng)和競(jìng)品的動(dòng)態(tài)是非常重要的。
        • 部門分析:目的是對(duì)部門職能范圍內(nèi)的業(yè)務(wù)發(fā)展做出正確的診斷并給出適當(dāng)?shù)慕ㄗh。前提是能充分理解部門在整個(gè)公司中的角色和地位、該部門與其他部門的協(xié)作關(guān)系、在工作流程中的上下游關(guān)系?;谝陨侠斫猓耘浜瞎緲I(yè)務(wù)發(fā)展為目的,以提升部門KPI或某個(gè)關(guān)鍵任務(wù)為分析目標(biāo),利用公司和部門運(yùn)營(yíng)數(shù)據(jù)去做分析。此類分析中,理解公司業(yè)務(wù)、有產(chǎn)品和業(yè)務(wù)思維很重要,指標(biāo)的分解、對(duì)比,數(shù)據(jù)變化的歸因往往是常用的分析方法。
        • 業(yè)務(wù)環(huán)節(jié)分析:這是數(shù)據(jù)分析在業(yè)務(wù)最細(xì)粒度的應(yīng)用。分析者只需要關(guān)注非常具體的某個(gè)業(yè)務(wù)環(huán)節(jié),讓大家感興趣的是這個(gè)業(yè)務(wù)環(huán)節(jié)數(shù)據(jù)的變化原因和改善方式。此時(shí)分析的指標(biāo)經(jīng)常是確定的,目標(biāo)也很直接。但所謂牽一發(fā)動(dòng)全身,這個(gè)環(huán)節(jié)的變化通常是由其他環(huán)節(jié)的變化引起的。所以萬(wàn)萬(wàn)不能走入一葉障目不見(jiàn)泰山的誤區(qū)。

        項(xiàng)目的階段不同:咨詢、實(shí)施

        • 咨詢分析:以前有過(guò)跟咨詢公司合作的經(jīng)歷。在項(xiàng)目開始階段,乙方通常需要花很多時(shí)間討論項(xiàng)目立項(xiàng)的必要性、收益等,以此來(lái)說(shuō)服甲方老板,你懂的。但是,我要說(shuō)的是,即使是公司自行研發(fā)的項(xiàng)目,在立項(xiàng)階段,數(shù)據(jù)分析需要做的是樹立目標(biāo)。通過(guò)數(shù)據(jù)分析,可以對(duì)業(yè)務(wù)有一個(gè)全面的診斷,發(fā)現(xiàn)問(wèn)題,提出項(xiàng)目需要改善的主要指標(biāo),并預(yù)測(cè)出項(xiàng)目上線后的收益。立項(xiàng)是需要管理層批準(zhǔn)的,因此這個(gè)階段的分析需要簡(jiǎn)明扼要、一針見(jiàn)血,分析結(jié)果的呈現(xiàn)起著至關(guān)重要的作用。
        • 實(shí)施分析:項(xiàng)目開始后,數(shù)據(jù)分析需要做的是過(guò)程控制。除了項(xiàng)目目標(biāo)涉及的主要指標(biāo)需要持續(xù)關(guān)注之外,還需要關(guān)注過(guò)程類指標(biāo)。所謂過(guò)程類指標(biāo),是指能夠反映出項(xiàng)目執(zhí)行內(nèi)容的數(shù)據(jù)。因?yàn)橹饕笜?biāo)的表現(xiàn)通常是滯后的,而且是若干因素影響的結(jié)果,過(guò)程指標(biāo)是為了明確各影響因素的作用效果。比如項(xiàng)目目標(biāo)是提升使用時(shí)長(zhǎng),項(xiàng)目?jī)?nèi)容可能包括提升新用戶和老用戶的使用時(shí)長(zhǎng),那么則應(yīng)該把新老用戶的時(shí)長(zhǎng)作為指標(biāo)單獨(dú)監(jiān)控和分析。
        綜上,根據(jù)數(shù)據(jù)分析的使用場(chǎng)景、業(yè)務(wù)階段、服務(wù)人群、范圍及層次不同,可以分為很多種。以上只是列舉出一部分。在每種場(chǎng)景下,數(shù)據(jù)分析的目標(biāo)、關(guān)注的重點(diǎn)和難點(diǎn)都有所不同,分析師要在分析過(guò)程中時(shí)刻關(guān)注自己有沒(méi)有偏離目標(biāo),并對(duì)重點(diǎn)和難點(diǎn)有充分的準(zhǔn)備。

        如何設(shè)定分析目標(biāo)

        從我的經(jīng)歷看,數(shù)據(jù)分析的目標(biāo)主要來(lái)自兩方:一方是業(yè)務(wù),一方是數(shù)據(jù)部門自身。
        對(duì)于一個(gè)具體的數(shù)據(jù)分析項(xiàng)目來(lái)說(shuō),可能以上兩方的因素都會(huì)存在,只是占比多少而已。以下詳細(xì)說(shuō)明這兩種方式的場(chǎng)景、前提及“坑”。
        • 分析目標(biāo)主要來(lái)自業(yè)務(wù)方:這種場(chǎng)景通常存在于業(yè)務(wù)方對(duì)業(yè)務(wù)發(fā)展有疑問(wèn),希望通過(guò)數(shù)據(jù)分析提升業(yè)務(wù)。業(yè)務(wù)設(shè)定的目標(biāo)要么是對(duì)過(guò)去的業(yè)務(wù)發(fā)展做總結(jié)和診斷,希望從中發(fā)現(xiàn)問(wèn)題;要么是基于業(yè)務(wù)的歷史預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì)。這里經(jīng)常存在的問(wèn)題是,業(yè)務(wù)方提出目標(biāo)往往是模糊不清的,并且通常用業(yè)務(wù)術(shù)語(yǔ)而非數(shù)據(jù)口徑來(lái)定義。因此,這種情況下,分析師要花較多的精力做需求分析。而要做好需求分析,分析師需要具備一定的產(chǎn)品和業(yè)務(wù)思維,要從業(yè)務(wù)視角出發(fā),充分理解業(yè)務(wù)的處境,才能從最根本上理解業(yè)務(wù)的需求。同時(shí),需要對(duì)數(shù)據(jù)產(chǎn)生的流程和指標(biāo)計(jì)算的口徑對(duì)業(yè)務(wù)人員進(jìn)行充分的說(shuō)明。如此不斷地迭代溝通,往往分析到最后,卻發(fā)現(xiàn)已經(jīng)不是原來(lái)的需求了。還有一種情況,業(yè)務(wù)對(duì)數(shù)據(jù)了解較多,會(huì)在需求中說(shuō)明需要的數(shù)據(jù)口徑,這種需求會(huì)被單純地看做一個(gè)數(shù)據(jù)提取需求。即使是這樣,如果希望讓這部分?jǐn)?shù)據(jù)更有價(jià)值,分析師也需要就其業(yè)務(wù)背景有深入的討論,然后可以修正該需求。
        • 分析目標(biāo)主要來(lái)自數(shù)據(jù)部門自身:這種場(chǎng)景下,數(shù)據(jù)部門在組織上是獨(dú)立于業(yè)務(wù)部門的。但是獨(dú)立不意味著可以不考慮數(shù)據(jù)分析對(duì)業(yè)務(wù)的價(jià)值(參見(jiàn)第一章)。如果說(shuō)實(shí)現(xiàn)業(yè)務(wù)價(jià)值是分析的根本原因,那么重要數(shù)據(jù)指標(biāo)的變化則是數(shù)據(jù)分析的直接原因。也就是說(shuō),如果數(shù)據(jù)部門要能夠獨(dú)立提出分析目標(biāo),首先要有相對(duì)完善的指標(biāo)監(jiān)控體系。而指標(biāo)體系可以分層,并且建立起各指標(biāo)之間的關(guān)聯(lián)關(guān)系。因此,數(shù)據(jù)部門提出分析目標(biāo)可以更全面、更客觀,而不局限于一隅。但是,這個(gè)分析目標(biāo)的設(shè)定對(duì)數(shù)據(jù)部門要求更高:不僅要具備完善的指標(biāo)監(jiān)控體系,更要了解業(yè)務(wù)。經(jīng)常出現(xiàn)的情況是,數(shù)據(jù)部門自己費(fèi)了挺大的勁做出的分析報(bào)告,業(yè)務(wù)部門卻無(wú)動(dòng)于衷,其中沒(méi)有涉及到業(yè)務(wù)痛點(diǎn)可能是一個(gè)重要原因。
        總結(jié)一下,分析目標(biāo)的設(shè)定是數(shù)據(jù)分析最初也是最重要的一步。一個(gè)合理的分析目標(biāo)應(yīng)該具備以下特征:
        • 要有業(yè)務(wù)視角,能折射出業(yè)務(wù)痛點(diǎn)
        • 要有數(shù)據(jù)支持
        • 要量化:“為什么產(chǎn)量下降了”和“為什么產(chǎn)量從1萬(wàn)下降到5千”,顯然后者的目標(biāo)更清晰
        • 要能體現(xiàn)在某個(gè)或某幾個(gè)指標(biāo)上:還是上面的例子,產(chǎn)量只是一個(gè)概念而非指標(biāo),一個(gè)可能的產(chǎn)量指標(biāo)是:全廠2018年第一季度中產(chǎn)品型號(hào)X的生產(chǎn)數(shù)量??傊?,要做到明確而沒(méi)有歧義。

        怎樣才算是一個(gè)合格的數(shù)據(jù)分析師

        可以從分析師的工作目標(biāo)、工作內(nèi)容和能力要求三個(gè)方面回答這個(gè)問(wèn)題。其中工作目標(biāo)和工作內(nèi)容是息息相關(guān)的。要說(shuō)清楚這個(gè)問(wèn)題,我認(rèn)為除了一些公認(rèn)的標(biāo)準(zhǔn)之外,還有一些標(biāo)準(zhǔn)是因公司和行業(yè)而異的。也就是說(shuō),必須把它放在一個(gè)具體的公司業(yè)務(wù)框架之中考慮。

        工作目標(biāo)主要由公司的業(yè)務(wù)發(fā)展階段決定

        一般來(lái)說(shuō),無(wú)論是哪個(gè)公司,都希望分析師能有效地利用數(shù)據(jù)引導(dǎo)和驅(qū)動(dòng)業(yè)務(wù)發(fā)展,實(shí)現(xiàn)數(shù)據(jù)的價(jià)值。但是,公司發(fā)展的情況不同,對(duì)數(shù)據(jù)分析師的價(jià)值定義也會(huì)不同。
        • 公司整體處于初創(chuàng)階段,此時(shí)分析師的價(jià)值在于能通過(guò)對(duì)行業(yè)和競(jìng)爭(zhēng)對(duì)手的分析,為公司的發(fā)展方向提出適當(dāng)?shù)慕ㄗh;
        • 公司如果處于快速發(fā)展期,此時(shí)分析師的價(jià)值在于一方面監(jiān)控業(yè)務(wù)取得的成績(jī),關(guān)注增長(zhǎng)速度,一方面要健全指標(biāo)體系,發(fā)現(xiàn)被業(yè)績(jī)?cè)鲩L(zhǎng)所可能掩蓋的問(wèn)題;
        • 如果公司處于穩(wěn)定期,分析師則需要從效率和成本角度,從業(yè)務(wù)細(xì)節(jié)入手,為精細(xì)化運(yùn)營(yíng)提供支持;
        • 如果公司發(fā)展遇到瓶頸,分析師需要分析市場(chǎng)中供給和需求的變化,關(guān)注競(jìng)爭(zhēng)對(duì)手的應(yīng)對(duì)策略,為公司業(yè)務(wù)發(fā)展發(fā)現(xiàn)新的增長(zhǎng)點(diǎn)。

        工作內(nèi)容主要由公司的數(shù)據(jù)建設(shè)程度決定

        參照第一章,分析師的主要工作內(nèi)容數(shù)據(jù)獲取、數(shù)據(jù)處理、數(shù)據(jù)清洗、數(shù)據(jù)建模、分析結(jié)果呈現(xiàn)、數(shù)據(jù)價(jià)值發(fā)現(xiàn)及實(shí)現(xiàn)。無(wú)論分析的目標(biāo)是什么,大體總要經(jīng)過(guò)這幾個(gè)階段。由于數(shù)據(jù)建設(shè)的階段不同,分析師在這幾項(xiàng)工作內(nèi)容上所花費(fèi)的時(shí)間也不同。在公司數(shù)據(jù)建設(shè)早期,分析師可能在數(shù)據(jù)獲取、數(shù)據(jù)處理和清洗、指標(biāo)建設(shè)上花費(fèi)更多的時(shí)間;數(shù)據(jù)建設(shè)到達(dá)一定階段之后,分析師的工作更多會(huì)在數(shù)據(jù)建模、呈現(xiàn)和數(shù)據(jù)價(jià)值實(shí)現(xiàn)上。

        分析師的能力要求

        對(duì)分析師的能力要求可分為通用能力和技術(shù)兩部分,同時(shí)也可以分為業(yè)務(wù)和數(shù)據(jù)兩部分。
        1. 業(yè)務(wù)能力:業(yè)務(wù)要求又可以分為微觀和宏觀兩方面:
        • 業(yè)務(wù)的微觀要求:了解業(yè)務(wù)運(yùn)營(yíng);了解公司發(fā)展方向和發(fā)展過(guò)程中面臨的問(wèn)題
        • 業(yè)務(wù)的宏觀要求:把握行業(yè)的發(fā)展方向,預(yù)測(cè)未來(lái)行業(yè)模式的變化;能明確指出公司在行業(yè)中的定位和戰(zhàn)略方向
        1. 數(shù)據(jù)通用能力:
        • 熟悉公司的所有基礎(chǔ)數(shù)據(jù)、來(lái)源、數(shù)據(jù)之間的關(guān)系;
        • 熟悉公司運(yùn)營(yíng)所涉及數(shù)據(jù)、能建立運(yùn)營(yíng)指標(biāo)和數(shù)據(jù)之間的相關(guān)或因果關(guān)系;
        • 能根據(jù)數(shù)據(jù)分析結(jié)果給出業(yè)務(wù)改進(jìn)建議
        • 數(shù)據(jù)價(jià)值實(shí)現(xiàn)能力。價(jià)值實(shí)現(xiàn)的過(guò)程是指數(shù)據(jù)分析結(jié)果->業(yè)務(wù)->業(yè)務(wù)執(zhí)行->反饋結(jié)果->數(shù)據(jù)分析這樣一個(gè)不斷迭代的過(guò)程。在此過(guò)程中,演講(Presentation)能力、溝通能力、影響力、團(tuán)隊(duì)協(xié)作能力、學(xué)習(xí)能力、邏輯思維能力、歸納和總結(jié)能力、抽象思維能力等都非常重要
        1. 數(shù)據(jù)技術(shù):
        • 數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)技術(shù)(SQL、Hive等)
        • 數(shù)據(jù)分析算法(統(tǒng)計(jì)分析和機(jī)器學(xué)習(xí))和工具(Excel、Python、R等)
        • 數(shù)據(jù)可視化工具的使用(Excel、R、PPT等)
        好的分析師在實(shí)際的業(yè)務(wù)操作中至少會(huì)做好三點(diǎn):
        • 大局觀:大處著眼,小處著手,全局和細(xì)節(jié)并重。因?yàn)閺臄?shù)據(jù)角度看,小數(shù)據(jù)往往可以反映出大問(wèn)題。而沒(méi)有大局觀,就不知道該看哪些小數(shù)據(jù)
        • 思維:數(shù)據(jù)思維與業(yè)務(wù)思維并重。業(yè)務(wù)思維容易理解,什么是數(shù)據(jù)思維?比如:對(duì)指標(biāo)由粗到細(xì)的拆解、考慮時(shí)間維度上的趨勢(shì)、注意尋求指標(biāo)之間的相關(guān)關(guān)系、直接影響關(guān)系、因果關(guān)系等。很多人都注重分析師要懂業(yè)務(wù),有業(yè)務(wù)思維,這當(dāng)然沒(méi)錯(cuò),但不能走向極端。因?yàn)樵趯?shí)際中,業(yè)務(wù)是需要不一樣的思維的,可以發(fā)現(xiàn)他們發(fā)現(xiàn)不了的問(wèn)題,從而為他們?cè)诶Ь持刑峁┙鉀Q方案。分析師需要了解業(yè)務(wù)的思維方式,但不能模仿他們。
        • 溝通:要想讓分析師的觀點(diǎn)被業(yè)務(wù)方所接受,溝通的作用是舉足輕重的。首先,分析師要為溝通找到合適的對(duì)象和時(shí)機(jī)。事先要根據(jù)溝通對(duì)象的不同設(shè)計(jì)適合的表達(dá)方式、內(nèi)容和過(guò)程。溝通的時(shí)機(jī)要選在業(yè)務(wù)最需要的時(shí)候。很多時(shí)候,事后諸葛亮固然不好,但太超前了也不會(huì)有好結(jié)果。其次,要有同理心。需要真正站在對(duì)方的角度上想問(wèn)題。再次,需要在溝通中建立互信、發(fā)揮影響力。一個(gè)好的分析師,能在溝通中恰到好處地展現(xiàn)自己的專業(yè)能力和經(jīng)驗(yàn),適時(shí)的讓業(yè)務(wù)方對(duì)人產(chǎn)生信任,從而對(duì)分析結(jié)果信服。

        什么企業(yè)需要數(shù)據(jù)分析師

        企業(yè)需要數(shù)據(jù)并不等于需要數(shù)據(jù)分析師。
        如果僅是想看數(shù)據(jù),其實(shí)有很多企業(yè)可以提供這樣的服務(wù)和工具。比如流量統(tǒng)計(jì)工具GA,比如報(bào)表工具Tableau。這些工具都可以在不需要分析師的情況下,對(duì)業(yè)務(wù)人員做簡(jiǎn)單的培訓(xùn)就可以用起來(lái)。
        分析師承擔(dān)的是相對(duì)復(fù)雜的、個(gè)性化的、以分析為目的(而不是查詢)的任務(wù)。
        如果企業(yè)有如下情況之一,那么可能是需要建立一支分析師隊(duì)伍了。
        • 決策需要數(shù)據(jù)支持:決策層通常不是只看到數(shù)據(jù)就可以做出決策的,他們需要知道的是數(shù)據(jù)變化的原因、預(yù)測(cè)某個(gè)決策可能造成哪些指標(biāo)及如何變化的結(jié)果,這是一個(gè)相對(duì)復(fù)雜的分析任務(wù),不是工具或者非專業(yè)人士可以回答。
        • 業(yè)務(wù)規(guī)模大、復(fù)雜度高:在此情況下,即使只是構(gòu)造單個(gè)指標(biāo),也需要經(jīng)過(guò)嚴(yán)密的口徑定義、復(fù)雜的計(jì)算才能得到,且需要經(jīng)過(guò)校驗(yàn)才能保證數(shù)據(jù)是準(zhǔn)確無(wú)誤的,這樣的工作通常由分析師完成。
        • 業(yè)務(wù)發(fā)展變化快:在業(yè)務(wù)穩(wěn)定的情況下,數(shù)據(jù)的計(jì)算及業(yè)務(wù)含義不需要經(jīng)常變化。反之,數(shù)據(jù)的定義、計(jì)算和業(yè)務(wù)理解則需要不斷地適應(yīng)業(yè)務(wù)的發(fā)展,需要分析師不斷地維護(hù)這些數(shù)據(jù)。
        • 精細(xì)化運(yùn)營(yíng):業(yè)務(wù)在經(jīng)歷開始階段的快速增長(zhǎng),達(dá)到穩(wěn)定階段之后。運(yùn)營(yíng)風(fēng)格會(huì)由粗放型轉(zhuǎn)換為精細(xì)化。此時(shí),需要對(duì)業(yè)務(wù)指標(biāo)進(jìn)行拆分,并分析相關(guān)性及數(shù)據(jù)之間的因果關(guān)系。
        • 數(shù)據(jù)統(tǒng)計(jì)口徑混亂、可信度低:有的企業(yè)存在數(shù)據(jù)孤島的情況,每個(gè)部門掌控著一部分?jǐn)?shù)據(jù),會(huì)造成同一個(gè)指標(biāo),由不同部門出結(jié)果不同。此時(shí)需要重新梳理指標(biāo)口徑定義、數(shù)據(jù)采集、計(jì)算,找出數(shù)據(jù)之間的差異。當(dāng)然,最后要徹底解決問(wèn)題,則需要解決數(shù)據(jù)孤島的問(wèn)題
        • 數(shù)據(jù)建設(shè)的初始階段:這時(shí)候需要分析師梳理業(yè)務(wù)流程、確認(rèn)需求、建立指標(biāo)體系、定義計(jì)算口徑、整合數(shù)據(jù)源等
        • 業(yè)務(wù)需求不清晰:業(yè)務(wù)有需求,但很模糊:比如,我想知道最近某某業(yè)務(wù)的運(yùn)營(yíng)效果如何?但是該看哪些指標(biāo)則不清楚。此時(shí)需要分析師深入了解業(yè)務(wù)需求的背景和目的,將業(yè)務(wù)需求指標(biāo)化。

        怎樣建立一支分析師團(tuán)隊(duì)

        從企業(yè)層面看,如果要建立分析師團(tuán)隊(duì),要弄清楚幾個(gè)問(wèn)題:
        1. 建立分析師的目的是什么?
        2. 分析師屬支持角色,那么他們支持的對(duì)象是誰(shuí)?
        3. 分析師的主要工作內(nèi)容什么?
        4. 分析師的規(guī)模多大較為合適?
        5. 如何評(píng)估分析師的績(jī)效?
        弄清楚這五個(gè)問(wèn)題之后,就會(huì)知道應(yīng)該招聘具備什么經(jīng)驗(yàn)的人,招聘多少人,以及對(duì)水平的要求有多高,如何考核他們等等。
        那么如何思考這五個(gè)問(wèn)題?
        1. 建立分析師團(tuán)隊(duì)的目的:雖然成立分析師團(tuán)隊(duì)的決定通常是由高層做出的,但是主要目的不一定只是為了做決策支持,也許是自底向上產(chǎn)生的需求推動(dòng)。有很多情況下,管理層覺(jué)得他們需要看數(shù)據(jù),因此招聘了有決策支持經(jīng)驗(yàn)、具備宏觀思維的分析師,但實(shí)際上又安排了分析師去支持具體業(yè)務(wù);或者反過(guò)來(lái),管理層希望分析師能支持具體的業(yè)務(wù),但是他們又安排分析師評(píng)價(jià)整個(gè)公司的運(yùn)營(yíng)情況,甚至提出戰(zhàn)略方向。這兩種情況都會(huì)造成人才的浪費(fèi)。要知道業(yè)務(wù)分析和決策支持對(duì)分析師的要求是不同的。至少,前者需要分析師能關(guān)注到細(xì)節(jié),而后者要求分析師不拘小節(jié),視野要足夠高。
        2. 分析師支持的對(duì)象:如果目的明確了,通常支持的對(duì)象就清晰了。
        3. 分析師的主要工作內(nèi)容:這同樣主要取決于團(tuán)隊(duì)定位,具體的工作內(nèi)容可參照《數(shù)據(jù)分析有哪些分類》
        4. 分析師團(tuán)隊(duì)的規(guī)模:規(guī)模取決于多種因素,比如工作內(nèi)容的復(fù)雜程度、業(yè)務(wù)需求的多少和緩急、能招聘到的人員的技能水平等。
        5. 分析師的績(jī)效評(píng)估:最直接的評(píng)估方法是看分析師產(chǎn)出的數(shù)量和質(zhì)量。如果只看產(chǎn)出的數(shù)量是比較容易的,比如可以看完成需求的多少、分析報(bào)告的數(shù)量等。但由于分析負(fù)責(zé)的業(yè)務(wù)線不同,這會(huì)忽略工作的難度。需要注意的是,分析師很多工作的投入和產(chǎn)出是不成比例的。比如溝通、業(yè)務(wù)梳理等基礎(chǔ)性的工作占據(jù)他們大部分的時(shí)間,而這些工作可能只有很少的可見(jiàn)交付物的輸出。除了產(chǎn)出量,還需要看產(chǎn)出的質(zhì)量。最理想的質(zhì)量評(píng)估就是看對(duì)業(yè)務(wù)的貢獻(xiàn),即提升了多少業(yè)務(wù)價(jià)值。但這同樣是比較困難的,因?yàn)橛袝r(shí)候業(yè)務(wù)價(jià)值也很難量化。除了對(duì)外的產(chǎn)出,還有一個(gè)維度是看對(duì)數(shù)據(jù)團(tuán)隊(duì)內(nèi)部的支持,因?yàn)榉治鰩熗ǔJ亲鳛槁?lián)系數(shù)據(jù)團(tuán)隊(duì)和業(yè)務(wù)團(tuán)隊(duì)的橋梁存在。比如,對(duì)數(shù)據(jù)指標(biāo)體系的建設(shè)和數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)產(chǎn)品的建設(shè)中做出的貢獻(xiàn)。但是同樣,這些貢獻(xiàn)也很難量化。

        如何實(shí)現(xiàn)數(shù)據(jù)分析的價(jià)值

        在之前的章節(jié)中已經(jīng)提到分析的價(jià)值在于業(yè)務(wù)價(jià)值,而業(yè)務(wù)價(jià)值實(shí)現(xiàn)的最后一步是把分析結(jié)論應(yīng)用于業(yè)務(wù)中,并反復(fù)迭代。
        我想從一個(gè)例子來(lái)說(shuō)明分析師在整個(gè)價(jià)值實(shí)現(xiàn)鏈條中的位置和作用。假設(shè)我們?cè)诳紤]如何實(shí)現(xiàn)一件工具的價(jià)值,這件工具可以是一把鉗子,或者更復(fù)雜點(diǎn),比如一部電腦。在這個(gè)例子中:
        • 數(shù)據(jù)分析是工具
        • 分析師是工具的制造者
        • 業(yè)務(wù)方是工具的使用者
        • 工具價(jià)值的實(shí)現(xiàn)不僅與工具的制造質(zhì)量及精巧程度有關(guān),還與使用者有關(guān):有人使用電腦設(shè)計(jì)航天器,有人只是用它玩游戲。
        也就是說(shuō),數(shù)據(jù)分析的價(jià)值除了分析師這個(gè)因素之外,還受到其他因素的影響。比如:
        • 數(shù)據(jù)分析結(jié)果的交付質(zhì)量、可視化及可理解性(類比:工具本身的質(zhì)量、設(shè)計(jì)及易用性)
        • 數(shù)據(jù)分析結(jié)果使用者的素質(zhì)(類比:工具使用者的素質(zhì),對(duì)工具的了解程度,工具使用的相關(guān)知識(shí)背景)
        • 數(shù)據(jù)分析結(jié)果使用的場(chǎng)景(類比:工具使用的場(chǎng)景是否符合工具設(shè)計(jì)者的初衷) 環(huán)境因素,比如不可抗力、趨勢(shì)(類比:臺(tái)式機(jī)的價(jià)值在移動(dòng)化辦公的趨勢(shì)下會(huì)變?。?/span>
        呃。。。是不是漏了點(diǎn)什么?分析師哪里去了?其實(shí)分析師的作用正在于對(duì)上述因素形成過(guò)程中的影響:
        • 提高數(shù)據(jù)的質(zhì)量、展示水平,讓數(shù)據(jù)結(jié)果變得更容易理解
        • 教育和培訓(xùn)數(shù)據(jù)使用者,往往會(huì)達(dá)到事倍功半的效果
        • 從根本上理解數(shù)據(jù)需求,打破砂鍋問(wèn)到底
        • 最后,對(duì)于不可抗拒的因素,分析師能做的就是。。。調(diào)整心態(tài)。反抗不了的話,就學(xué)會(huì)接受吧。

        數(shù)據(jù)分析師團(tuán)隊(duì)的分工與合作

        個(gè)人感覺(jué)分析師團(tuán)隊(duì)很不好帶,數(shù)據(jù)分析師團(tuán)隊(duì)最大的三個(gè)痛點(diǎn)是:
        1. 散:在公司級(jí)別的團(tuán)隊(duì)中表現(xiàn)尤其顯著。由于支持的業(yè)務(wù)多,而各業(yè)務(wù)的發(fā)展目標(biāo)不同,導(dǎo)致無(wú)法設(shè)立一個(gè)統(tǒng)一的業(yè)務(wù)目標(biāo),只能按人去設(shè)定目標(biāo),管理效率很低。
        2. 亂:正是由于業(yè)務(wù)目標(biāo)散亂,造成分析師之間的工作無(wú)法統(tǒng)一和協(xié)同。很多時(shí)候都是各自為戰(zhàn),沒(méi)有配合,甚至出現(xiàn)目標(biāo)沖突的情況。
        3. 弱:不能影響業(yè)務(wù),不能建立話語(yǔ)權(quán)。這個(gè)在上文中已經(jīng)說(shuō)過(guò),此處不再贅述。
        這里面的關(guān)鍵是解決“散”的問(wèn)題。很顯然,如果把眼光放在部門級(jí)的業(yè)務(wù)上,是無(wú)法解決這個(gè)問(wèn)題的。因此,需要把視野擴(kuò)展到全公司?;诠窘y(tǒng)一的發(fā)展目標(biāo),建立一個(gè)統(tǒng)一的分析框架。正如數(shù)據(jù)分析是服務(wù)業(yè)務(wù)的,分析框架也要基于業(yè)務(wù)模型來(lái)建立。業(yè)務(wù)模型的標(biāo)準(zhǔn)是:
        • 業(yè)務(wù)模型要高度抽象化,它是從業(yè)務(wù)模式中抽取出來(lái)的,而不是反應(yīng)部門職能。
        • 業(yè)務(wù)模型要能反應(yīng)實(shí)際業(yè)務(wù)的運(yùn)營(yíng)規(guī)律、要素和目標(biāo)。甚至,這個(gè)業(yè)務(wù)模型可以放之行業(yè)而皆準(zhǔn)。
        有了業(yè)務(wù)模型,現(xiàn)在需要建立分析模型。我的經(jīng)驗(yàn)是對(duì)著業(yè)務(wù)模型提問(wèn)題。首先是公司級(jí)的:公司的發(fā)展目標(biāo)是什么?需要哪些要素來(lái)完成這個(gè)目標(biāo)?各要素之間如何互相促進(jìn)?然后將上述問(wèn)題分解到部門級(jí)。最后可以將問(wèn)題歸類,可以分為:目標(biāo)分析、運(yùn)營(yíng)分析、要素分析等。這些分類好的問(wèn)題就是分析師分工的基礎(chǔ)。
        傳統(tǒng)的分工方式是分析師按支持業(yè)務(wù)部門分工,或者按支持的業(yè)務(wù)模塊分工。
        這種分工方式的結(jié)果是:
        第一、分析師對(duì)業(yè)務(wù)的了解如同盲人摸象,每個(gè)人都只能了解到部分業(yè)務(wù),不能也不會(huì)從整體考慮業(yè)務(wù)問(wèn)題,對(duì)問(wèn)題的定位缺乏深度;
        第二、分析師的工作是割裂的,自己的分析結(jié)果不容易被其他分析師采用。
        以電商平臺(tái)模式舉例,運(yùn)用上面的方法:
        1. 建立業(yè)務(wù)分析模型:用戶、商品兩個(gè)主要要素。鏈接這兩個(gè)要素的是用戶購(gòu)物體驗(yàn)。用戶自身會(huì)有用戶生命周期,商品自身會(huì)有商品生命周期。還可以進(jìn)一步細(xì)化:用戶購(gòu)物體驗(yàn)包括查找商品信息、下單、配送、付費(fèi)、售后等體驗(yàn)。商品生命周期可以包括采購(gòu)、倉(cāng)儲(chǔ)、上下架等。商品要素包括定價(jià)、分類、功能、用戶評(píng)價(jià)等。
        2. 提問(wèn):公司的發(fā)展目標(biāo)?假設(shè)公司的發(fā)展目標(biāo)就是追求銷售利潤(rùn)最大化(實(shí)際上很多電商平臺(tái)不是通過(guò)這個(gè)模式來(lái)盈利的)。要素?利潤(rùn)的大部分通常是由高凈值人群和高毛利商品貢獻(xiàn)的。要不斷發(fā)展壯大高凈值人群和提升高毛利商品的銷量。各要素之間如何促進(jìn)?高凈值人群不會(huì)只買高毛利商品,平臺(tái)也不可能只賣高毛利商品。鏈接這兩者的是用戶體驗(yàn)。分析師可以根據(jù)分析主題分成兩個(gè)大組:一組的分析任務(wù)包括識(shí)別高凈值人群、分析高凈值人群的購(gòu)物體驗(yàn)、分析高凈值人群的生命周期;二組的分析任務(wù)包括識(shí)別高毛利商品、分析用戶對(duì)高毛利商品的購(gòu)物體驗(yàn)、分析高毛利商品的生命周期。當(dāng)然,還可以把購(gòu)物體驗(yàn)單獨(dú)作為一組或者在上述基礎(chǔ)上進(jìn)一步細(xì)分。比如高凈值人群分為A、B、C等幾個(gè)不同特征的人群,如果其特征差異很顯著,可以基于人群分組做進(jìn)一步劃分。
        這樣分工的好處是:
        第一、分析師是基于分析模型的分組,組內(nèi)目標(biāo)一致,組內(nèi)分析結(jié)果是可以共享和互相借鑒的;
        第二、組內(nèi)大目標(biāo)的設(shè)定可以較為宏觀,促使分析師從整體考慮問(wèn)題
        第三、組內(nèi)對(duì)大目標(biāo)的分解最終會(huì)落實(shí)到具體業(yè)務(wù)上,不會(huì)太虛
        第四、不同分組間的分析師雖然目標(biāo)不同,但是使用的數(shù)據(jù)維度基本一樣,很多的基礎(chǔ)性工作是可以共建的,且分析結(jié)果也可以互相借鑒。

        一篇好的分析報(bào)告有什么樣的標(biāo)準(zhǔn)

        寫分析報(bào)告應(yīng)該是每個(gè)分析師的必做功課之一,不管是簡(jiǎn)單的或者復(fù)雜的,正式的或者非正式的。
        什么是分析報(bào)告?我定義為有特定的主題、分析過(guò)程和結(jié)論的都可以算作分析報(bào)告,而不拘泥于表現(xiàn)形式。
        那么怎么才算是一篇好的分析報(bào)告?相信每一個(gè)分析師都會(huì)有自己的標(biāo)準(zhǔn)。比如:對(duì)業(yè)務(wù)有意義、數(shù)據(jù)準(zhǔn)確、邏輯嚴(yán)密等。這些都沒(méi)有錯(cuò),但是報(bào)告是給人看的,而每個(gè)人的背景和需求不同,那么從報(bào)告讀者的角度出發(fā)去衡量報(bào)告的好壞會(huì)更加客觀。
        既然要從讀者出發(fā),那么首先就要對(duì)讀者分類。從我的經(jīng)驗(yàn)出發(fā),我們可以把報(bào)告的讀者按職級(jí)不同簡(jiǎn)單分為決策層、執(zhí)行層;按對(duì)業(yè)務(wù)的了解程度不同分為了解和不了解兩類。那么讀者可以細(xì)分為四類:
        我將從選題、數(shù)據(jù)選擇、分析過(guò)程、結(jié)論、報(bào)告結(jié)構(gòu)、可視化這幾個(gè)方面去說(shuō)明對(duì)不同類別的讀者,一篇好的分析報(bào)告的標(biāo)準(zhǔn)是什么。
        • 對(duì)于A類讀者:由于他們對(duì)業(yè)務(wù)了解,視野又有一定的高度,所以選題應(yīng)該以相對(duì)宏觀且能反應(yīng)業(yè)務(wù)痛點(diǎn)的主題。比如對(duì)公司或一級(jí)部門KPI目標(biāo)完成度的剖析、相對(duì)于競(jìng)品主要業(yè)務(wù)指標(biāo)的表現(xiàn)分析。數(shù)據(jù)應(yīng)該選擇較大的、粒度較粗的指標(biāo)數(shù)據(jù),不能用那種多個(gè)維度交叉且口徑定義很復(fù)雜的指標(biāo)。分析過(guò)程應(yīng)簡(jiǎn)單明了,邏輯推理盡可能把數(shù)據(jù)變化和業(yè)務(wù)解讀結(jié)合起來(lái),同時(shí)一定需要關(guān)注時(shí)間維度上的變化。結(jié)論應(yīng)清晰明了,包括對(duì)業(yè)務(wù)方向性的診斷和預(yù)判。在發(fā)布報(bào)告時(shí),結(jié)論前置較為合適,對(duì)業(yè)務(wù)背景的描述不需要太多。可視化方面,以趨勢(shì)性的圖表為主。
        • 對(duì)于B類讀者:一般是經(jīng)理及以下的運(yùn)營(yíng)人員。選題方面應(yīng)側(cè)重具體的運(yùn)營(yíng)問(wèn)題,范圍限定在二級(jí)或三級(jí)部門的職責(zé)范圍內(nèi)。選擇某個(gè)業(yè)務(wù)線環(huán)節(jié)及上下游的微觀數(shù)據(jù),分析過(guò)程中要將統(tǒng)計(jì)方法或機(jī)器學(xué)習(xí)方法與業(yè)務(wù)規(guī)則結(jié)合,發(fā)現(xiàn)各指標(biāo)之間的因果關(guān)系。報(bào)告結(jié)構(gòu)的重心在于分析過(guò)程和結(jié)論,可視化方面要注重細(xì)節(jié)數(shù)據(jù)的呈現(xiàn)。
        • 對(duì)于C類讀者:選題偏重業(yè)務(wù)診斷和監(jiān)控,選擇宏觀的、KPI或目標(biāo)相關(guān)的重點(diǎn)指標(biāo),可以包含行業(yè)的、競(jìng)爭(zhēng)對(duì)手的相關(guān)數(shù)據(jù)。分析方法以對(duì)比和預(yù)測(cè)為主。結(jié)論以對(duì)業(yè)務(wù)方向的定性總結(jié)為好。報(bào)告結(jié)構(gòu)應(yīng)在業(yè)務(wù)背景介紹、選題的依據(jù)、結(jié)論建議等多花些筆墨,過(guò)程可以簡(jiǎn)略。報(bào)告呈現(xiàn)以精簡(jiǎn)為好。
        • 對(duì)于D類讀者:通常是新人或者新業(yè)務(wù)。選題偏重業(yè)務(wù)發(fā)展細(xì)節(jié)中的痛點(diǎn)或瓶頸。數(shù)據(jù)選擇微觀的但較為簡(jiǎn)單的指標(biāo),分析過(guò)程中著重在于指標(biāo)的歷史趨勢(shì)、相關(guān)指標(biāo)之間的對(duì)比和變化,結(jié)論側(cè)重于發(fā)現(xiàn)和定義業(yè)務(wù)問(wèn)題。報(bào)告結(jié)構(gòu)側(cè)重于業(yè)務(wù)背景的描述、數(shù)據(jù)選擇和指標(biāo)定義??梢暬枰跇I(yè)務(wù)邏輯的展示上多花些功夫。
        總結(jié)下,我認(rèn)為報(bào)告選題、數(shù)據(jù)選擇、分析過(guò)程、結(jié)論、報(bào)告結(jié)構(gòu)、可視化是影響一篇報(bào)告質(zhì)量的主要因素。但是分析報(bào)告如同一件藝術(shù)品,沒(méi)有放之四海而皆準(zhǔn)的標(biāo)準(zhǔn),只有是否迎合和滿足的受眾的需求。因此,分析師必須清楚誰(shuí)會(huì)看你的報(bào)告、你的讀者希望從你的報(bào)告中得到什么、讀者的背景(包括業(yè)務(wù)和數(shù)據(jù)方面的知識(shí))是怎樣的、讀者對(duì)你和數(shù)據(jù)的信任度如何。如果分析師要寫出一篇好的分析報(bào)告,需要了解的不只是數(shù)據(jù)和業(yè)務(wù)。

        數(shù)據(jù)分析三元論:勢(shì)、道、術(shù)

        勢(shì)

        有個(gè)成語(yǔ)叫“大勢(shì)所趨”,順應(yīng)趨勢(shì)、迎合潮流的事情做起來(lái)總是事半功倍的。
        在做數(shù)據(jù)分析之前,我們要問(wèn)一問(wèn):在這個(gè)時(shí)代、行業(yè)、公司做數(shù)據(jù)分析是大勢(shì)所趨嗎?
        要回答這個(gè)問(wèn)題,首先要搞清楚哪些因素構(gòu)成了數(shù)據(jù)分析的“勢(shì)”。我列舉如下幾個(gè):
        • 行業(yè):我以為只有那些能夠產(chǎn)生大量數(shù)據(jù)、且市場(chǎng)需求和業(yè)務(wù)模式變化較快、競(jìng)爭(zhēng)較為充分的行業(yè)更適合做數(shù)據(jù)分析。大量數(shù)據(jù)是基礎(chǔ)和原材料;市場(chǎng)需求和競(jìng)爭(zhēng)壓力是內(nèi)在的驅(qū)動(dòng)力。比如To C的電商行業(yè),數(shù)據(jù)量已經(jīng)到了一定量級(jí),而人的需求往往是變化較快的,且這個(gè)行業(yè)沒(méi)有形成事實(shí)上的壟斷。雖然阿里、京東的電商平臺(tái)已經(jīng)占據(jù)了很大的市場(chǎng)份額,但是他們之間仍然存在競(jìng)爭(zhēng),而且像嚴(yán)選、考拉、網(wǎng)紅電商等垂直電商也還有生存空間。再比如電信和金融行業(yè),也能滿足以上幾個(gè)條件。但是有些行業(yè),看起來(lái)業(yè)務(wù)規(guī)模大,但實(shí)際上不適合去做數(shù)據(jù)分析。比如家裝、餐飲,這兩個(gè)行業(yè)雖然古老,但除了某些巨頭之外,信息化做的相對(duì)較差,數(shù)據(jù)采集都是問(wèn)題,更談不上做數(shù)據(jù)分析了。再比如能源行業(yè),也能夠產(chǎn)生大量的數(shù)據(jù),但是因?yàn)槭袌?chǎng)需求相對(duì)穩(wěn)定,且基本形成了國(guó)家壟斷,沒(méi)有做數(shù)據(jù)分析的內(nèi)在需求。
        • 公司的數(shù)據(jù)環(huán)境:數(shù)據(jù)環(huán)境包括信息化水平、數(shù)據(jù)文化、老板對(duì)數(shù)據(jù)的重視程度等。這幾個(gè)因素是很好理解的。信息化水平?jīng)Q定了數(shù)據(jù)的量和質(zhì)量,消除數(shù)據(jù)不一致、清洗臟數(shù)據(jù)要花多少時(shí)間和精力,做過(guò)的人都知道。。。數(shù)據(jù)文化包括數(shù)據(jù)相關(guān)的流程、規(guī)章、制度,公司內(nèi)部對(duì)數(shù)據(jù)認(rèn)知和利用的程度等。最后,我向來(lái)認(rèn)為數(shù)據(jù)是一把手工程,由于數(shù)據(jù)從采集到價(jià)值產(chǎn)出,都是涉及多個(gè)部門的利益,沒(méi)有老板的支持,做好數(shù)據(jù)是天方夜譚。

        所謂“道”,主要指分析體系和框架、目的和價(jià)值。
        而這些主要受公司的業(yè)務(wù)模式和業(yè)務(wù)需求的影響。說(shuō)白了,業(yè)務(wù)模式越簡(jiǎn)單、越清晰,數(shù)據(jù)分析越容易出成果。因?yàn)楹?jiǎn)單的業(yè)務(wù)模式能顯著減少數(shù)據(jù)分析師學(xué)習(xí)業(yè)務(wù)的成本。分析體系和框架也會(huì)簡(jiǎn)單明了,在分析時(shí)需要考慮的影響因素就越少。而價(jià)值鏈短業(yè)務(wù)模式更容易讓分析主題直接與業(yè)務(wù)收益掛鉤,更容易讓數(shù)據(jù)分析成果變現(xiàn)。而分析需求越穩(wěn)定,就可以給分析師更多的時(shí)間深入研究下去,不斷迭代,最終產(chǎn)出更大的價(jià)值。分析需求越清晰,花在需求討論中的時(shí)間就越少,最終分析成果被轉(zhuǎn)化的可能性就越大。

        術(shù)

        所謂“術(shù)”,是指數(shù)據(jù)分析的方法和過(guò)程,其中分析思維和分析技術(shù)對(duì)分析結(jié)果的影響。
        正如我在開篇所述,數(shù)據(jù)分析所涉及技術(shù)體系非常龐大,而且學(xué)習(xí)資料也很多,不在本專欄范圍之內(nèi)。我重點(diǎn)想說(shuō)說(shuō)我經(jīng)驗(yàn)中的一些分析技巧(包括思維和方法):
        • 分析主題的定性與定量:設(shè)計(jì)分析主題中的重要一步,是要確定分析的目的是定性或是定量。如果是定性,通常只要考慮有關(guān)或無(wú)關(guān),正面影響或負(fù)面影響。定量分析是很受業(yè)務(wù)方歡迎的,分析也更加復(fù)雜和困難,通常要通過(guò)機(jī)器學(xué)習(xí)模型解決。
        • 發(fā)現(xiàn)分析主題的兩個(gè)切入點(diǎn):指標(biāo)監(jiān)控與業(yè)務(wù)問(wèn)題。在《如何設(shè)定分析目標(biāo)》一節(jié)講過(guò),數(shù)據(jù)部門更適合從指標(biāo)監(jiān)控中發(fā)現(xiàn)問(wèn)題,業(yè)務(wù)部門更適合從業(yè)務(wù)中發(fā)現(xiàn)問(wèn)題。但對(duì)于一個(gè)成熟的數(shù)據(jù)部門,把指標(biāo)監(jiān)控和業(yè)務(wù)監(jiān)控深度結(jié)合,對(duì)于發(fā)現(xiàn)分析主題更有利。
        • 數(shù)學(xué)建模:我對(duì)數(shù)學(xué)建模技術(shù)了解并不深。但是如果能把業(yè)務(wù)問(wèn)題轉(zhuǎn)化為一個(gè)數(shù)學(xué)模型,對(duì)于確定分析思路會(huì)很有幫助。
        • 指標(biāo)創(chuàng)新:指標(biāo)其實(shí)是數(shù)據(jù)分析師分析業(yè)務(wù)問(wèn)題的武器。因?yàn)闊o(wú)論你用什么分析方法,總要用到一些數(shù)據(jù),而這些數(shù)據(jù)的計(jì)算方法、范圍會(huì)很大程度上影響分析結(jié)果。且不說(shuō)任何一個(gè)建模過(guò)程中的特征選擇都非常重要,即使只是對(duì)業(yè)務(wù)的簡(jiǎn)單監(jiān)控,一個(gè)好的指標(biāo)往往能準(zhǔn)確無(wú)誤地反映出問(wèn)題。對(duì)于互聯(lián)網(wǎng),PV、UV、時(shí)長(zhǎng)、留存、點(diǎn)擊率、退出率這些是大家很常用的。用來(lái)監(jiān)控整體業(yè)務(wù)是沒(méi)有問(wèn)題的,但是對(duì)于某個(gè)小的業(yè)務(wù)板塊就不太夠了。比如,作為內(nèi)容平臺(tái),我想衡量一次曝光的用戶體驗(yàn)如何,應(yīng)該用什么指標(biāo)?有人會(huì)建議用點(diǎn)擊率,但是點(diǎn)擊率會(huì)受到標(biāo)題黨的影響,此時(shí)高的點(diǎn)擊率并不代表好的用戶體驗(yàn)。比較好的選擇是把點(diǎn)擊率、閱讀時(shí)長(zhǎng)、閱讀進(jìn)度等合成一個(gè)指標(biāo)。
        • 整體與個(gè)體:大處著眼,小處著手。無(wú)論是數(shù)據(jù)還是業(yè)務(wù),都不是孤立存在的,系統(tǒng)性思維對(duì)于分析師非常重要。所以在看到一個(gè)小問(wèn)題的時(shí)候,要知道它絕對(duì)不會(huì)影響這一小塊業(yè)務(wù);而看到大的目標(biāo)出現(xiàn)問(wèn)題的時(shí)候,要能意識(shí)到可能是一些小的業(yè)務(wù)環(huán)節(jié)出了岔子。在動(dòng)手層面,對(duì)于數(shù)據(jù)分析來(lái)說(shuō),微觀分析更容易獲取實(shí)驗(yàn)數(shù)據(jù),也更容易找到因果關(guān)系。所以要不斷地對(duì)問(wèn)題分解和細(xì)化。
        • 分析維度的引入:在低維空間上解決不了,在高維空間上就不是個(gè)事(想到三體了嗎)。比如SVM,低維空間上無(wú)法做到線性可分的數(shù)據(jù)樣本,在高維空間上就可以。所以如果你在某個(gè)分析問(wèn)題中費(fèi)了牛勁也找不到答案,也許正是因?yàn)槟愫雎粤四硞€(gè)重要的因素。當(dāng)然也不是維度越多越好,因?yàn)榫S度越多,解釋起來(lái)就越困難,不要忘了,結(jié)果是給人看的。
        • 大膽假設(shè),小心求證:試想求解一個(gè)方程式,我把某個(gè)解代入方程驗(yàn)證是否正確,要比我從空間中求解容易得多。同理,由于在現(xiàn)實(shí)世界中可能影響業(yè)務(wù)的因素太多,選擇其中最有可能的因素去驗(yàn)證無(wú)疑是一條捷徑。這個(gè)假設(shè)怎么去做?首先要對(duì)業(yè)務(wù)有足夠的敏感度。是的,業(yè)務(wù)老鳥就是比新手能更快地“嗅”出問(wèn)題的根源;其次要對(duì)數(shù)據(jù)有足夠的敏感度,數(shù)據(jù)之間都是有關(guān)系的,某個(gè)相關(guān)的指標(biāo)變化也許就能告訴我們答案。究竟這個(gè)假設(shè)是不是問(wèn)題的答案,最終取決于數(shù)據(jù)驗(yàn)證?!靶⌒摹钡囊馑际?,一定要保證在驗(yàn)證過(guò)程中不受其他因素的干擾,AB測(cè)試無(wú)疑是個(gè)很好的方法。還有,在求證過(guò)程中要保持邏輯的嚴(yán)密。
        瀏覽 27
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            欧美三级电影免费 | 久久这里只有 | 国产高清无码视频 | 国产成人精品免费视频 | 乱爱性全过程免费视频 | 成插人综合 | 91国语对白精品露脸 | 久久A级片| 色网址在线 | 青草社区视频在线观看 |