終于有人把數(shù)據(jù)崗的職能、工作內(nèi)容、知識技能講清楚了

來源:談數(shù)據(jù)
“數(shù)據(jù)崗的職能是什么?核心價值是什么?工作內(nèi)容有什么?每部分的知識和技能如何獲?。?/strong>”
放假回家,一家人圍著餐桌閑聊。談及工作,我媽問我:“你每天都在公司做些什么呀?”
我竟一時語塞,不是因為不知做了什么事;而是因為我們好像做了各種各樣的事(維護指標體系、做專題分析、建數(shù)據(jù)表、建設(shè)數(shù)據(jù)產(chǎn)品、等等不一而足),但卻很難簡單明了的告訴我媽“我在做什么?有什么價值?”。
頓時感覺有點沮喪,因為“一件事情如果我沒辦法跟我媽講清楚,說明我自己沒有思考清楚。”。
“‘?dāng)?shù)據(jù)崗的職能是什么(做什么工作)?(對公司)貢獻了什么樣的價值?’是一件非常重要的母題”我說時來不及思索,但思索之后,還是這樣說。
因為一旦思考清楚這個母題,對個人而言,就可以回答個人成長與職業(yè)規(guī)劃的問題;對組織而言,就可以回答能力發(fā)展與組織建設(shè)的問題。
為什么這么說?

因為工作的最小單元是一個個的任務(wù)。相似的任務(wù)聚合在一起,形成了職能;相關(guān)的職能組合起來形成了崗位。相關(guān)的崗位組合在一起,形成了部門;所有的部門組合在一起,構(gòu)成了組織。

而對個人而言,待完成的任務(wù),決定了所需的知識技能;所以弄清楚數(shù)據(jù)崗的職能,以及自己想要履行的職能,就可以明白自己要掌握哪些知識與技能。即,解決了個人成長的問題。從承擔(dān)單一職能,到承擔(dān)多個職能(職責(zé)擴大化),到職能豐富化,進而到承擔(dān)主要的協(xié)作職能(管理職能),就是職業(yè)規(guī)劃與職業(yè)發(fā)展的一種路徑圖。
而對組織而言,明確哪些是需履行而目前未履行好的數(shù)據(jù)職能,就能明確能力發(fā)展的方向;對職能的重組和對崗位的重組,使得整體的工作更加順滑、高效,就是一定程度上的組織建設(shè)。
PS:
這里以職能為主要的顆粒度,是因為:不同的組織由于實際狀況的不同,對于相同名稱的崗位,會設(shè)計不同的崗位職能。
“數(shù)據(jù)分析崗”在目前階段就是一個非常典型的例子,在有些組織,這個崗位會歸屬與獨立的數(shù)據(jù)部門,而有些組織內(nèi)它會歸屬于業(yè)務(wù)部門(產(chǎn)品/營銷/研發(fā)/等等)。在有的組織內(nèi)部,對產(chǎn)品、運營等等崗位有不低的數(shù)據(jù)能力要求;而在有些組織內(nèi),則并非如此。這些現(xiàn)象的本質(zhì)是不同的崗位設(shè)計,不同的職能組合。
這也是為什么,有的同學(xué)說,在他們公司,數(shù)據(jù)分析師從不跑SQL;有的同學(xué)說,數(shù)據(jù)分析師要懂?dāng)?shù)據(jù)產(chǎn)品設(shè)計;有的同學(xué)說,數(shù)據(jù)分析師要熟悉各類算法;等等。這些同學(xué)說的都對,都是實際情況;但這不意味著數(shù)據(jù)分析師什么都要會,什么都要懂,什么都要做。
談到數(shù)據(jù)崗的工作有哪些,大家的腦海里肯定會浮現(xiàn)出特別多的詞:ETL、取數(shù)、做報表、專題分析、指標體系??冃Ч芾恚灰欢恪?但是究竟什么才是數(shù)據(jù)崗的核心職能?如何通過一句話總結(jié)性地告訴父母,我們在做什么工作呢?

筆者認為,數(shù)據(jù)崗的核心職能有兩個:① 產(chǎn)出數(shù)據(jù)資產(chǎn);② 提升信息的價值密度。
數(shù)據(jù)資產(chǎn):所謂數(shù)據(jù)資產(chǎn),是個人/企業(yè)所控制的,預(yù)期會帶來未來經(jīng)濟利益的數(shù)據(jù)資源。這種資源可以是以物理形式存儲,例如文檔資料;也可以是以電子的方式記錄,例如電子文件。
價值密度:所謂價值密度,是指一個數(shù)據(jù)集預(yù)期可帶來的經(jīng)濟收益,與其數(shù)據(jù)量的比值。這里的數(shù)據(jù)集,可以是51字節(jié)的一句商業(yè)判斷,也可以是3M的數(shù)據(jù)分析報告,也可能是PB/EP級別的數(shù)據(jù)庫。
我們不妨一起來檢驗一下這個定義:

“千舉萬變,其道一也?!薄盾髯印?/span>
“產(chǎn)出數(shù)據(jù)資產(chǎn)”是一個量化業(yè)務(wù)的過程,對應(yīng)著組織“業(yè)務(wù)數(shù)據(jù)化”的能力。
“提升信息的價值密度”是一個驅(qū)動業(yè)務(wù)的過程,對應(yīng)著組織“數(shù)據(jù)業(yè)務(wù)化”的能力。
簡而言之,數(shù)據(jù)職能在組織中貢獻的價值就是:量化業(yè)務(wù)與驅(qū)動業(yè)務(wù)。

這么說稍微有點抽象,這里以問答社區(qū)(知乎)為例,簡要說明一下“業(yè)務(wù)數(shù)據(jù)化”與“數(shù)據(jù)業(yè)務(wù)化”的含義。
大家可以稍微回憶一下:當(dāng)我們在訪問問答社區(qū)(刷知乎)時,都會產(chǎn)生哪些行為?
簡單列舉一下,例如:閱讀、播放、點擊、滑動、跳轉(zhuǎn)、點贊(雙擊屏幕即刻體驗)等等。這些用戶的行為,都可以歸屬為知乎運營業(yè)務(wù)中的一部分。
而知乎記錄這些“用戶行為”的過程就是一種“業(yè)務(wù)的數(shù)據(jù)化”。但如果僅僅是用一個又一個的分區(qū),記錄這些行為日志,只是產(chǎn)生了數(shù)據(jù),而沒有產(chǎn)生價值。
當(dāng)知乎加工、分析、利用這些數(shù)據(jù)進行產(chǎn)品設(shè)計,對用戶進行信息推送時,就完成了一個“數(shù)據(jù)業(yè)務(wù)化”的過程。

在上述的例子中,相較于數(shù)據(jù)業(yè)務(wù)化,業(yè)務(wù)數(shù)據(jù)化好像是一個相較而言比較簡單的能力,涉及的主要工作事項就是數(shù)據(jù)埋點和落庫。
但實際上“業(yè)務(wù)數(shù)據(jù)化”并不簡單。僅僅是一個頁面的PV的統(tǒng)計,就要考慮、是否彈窗、用戶是否切換Tab、是否最小化窗口,等等實際操作場景;最終,可能要經(jīng)過長時間的多次迭代,才能得到一個較好的埋點標準。
通過“業(yè)務(wù)數(shù)據(jù)化”和“數(shù)據(jù)業(yè)務(wù)化”,組織可以建立起一個正向的閉環(huán)數(shù)據(jù)流。在這個正循環(huán)的過程中,數(shù)據(jù)越用越多、越用越好。

在明確了數(shù)據(jù)職能在組織中的價值之后,我們最后來回答關(guān)于個人職業(yè)發(fā)展的問題:數(shù)據(jù)分析如何入門?數(shù)據(jù)崗需要儲備哪些知識與技能?如何成長?
我們常說,有些事是我們擅長的,有些事是我們熱愛的,有些事是這個世界所需要的。而我們職業(yè)發(fā)展的目標就是找到這三者的交集。

所以:
首先我們要弄清楚組織需要各個崗位做什么工作。在了解工作內(nèi)容之后,我們就可以對自己是否感興趣做一個初步的判斷。當(dāng)然很多時候,還需要通過嘗試的方式,去探索自己的興趣。
然后,我們根據(jù)工作的內(nèi)容來補充自己的知識與技能,逐步從入門到精通。
前文提到, 公司的目標是通過“業(yè)務(wù)數(shù)據(jù)化”與“數(shù)據(jù)業(yè)務(wù)化”建立起一個正向的、閉環(huán)的數(shù)據(jù)流。
而數(shù)據(jù)崗的工作內(nèi)容,抽象而言,就是支撐起整個數(shù)據(jù)流運轉(zhuǎn);具體而言可以分為:生產(chǎn)數(shù)據(jù)、處理數(shù)據(jù)和消費數(shù)據(jù)三大模塊。
下圖簡單示意了,不同崗位在數(shù)據(jù)流中所處的位置:

PS:以上僅為示意,不同企業(yè)可根據(jù)實際狀況進行調(diào)整。
因為很多同學(xué),對數(shù)據(jù)分析師的工作非常感興趣。這里以阿里集團為例,簡單介紹一下中臺數(shù)據(jù)分析師日常的工作內(nèi)容。
在阿里巴巴,中臺數(shù)據(jù)分析師的日常工作中,主要的交付物有6類:
開拓新的數(shù)據(jù)源
產(chǎn)出表資產(chǎn)
沉淀分析方法論
搭建與維護指標體系
建設(shè)與維護數(shù)據(jù)產(chǎn)品
輸出商業(yè)洞察

開拓新的數(shù)據(jù)源:例如,信息爬取、競對分析等。
產(chǎn)出表資產(chǎn):例如,在DWD(明細數(shù)據(jù)層)的基礎(chǔ)上,建立DWM(數(shù)據(jù)中間層)和DWS(數(shù)據(jù)服務(wù)層)的數(shù)據(jù)表。 沉淀分析方法論:例如,指標拆解、異常監(jiān)控、因果推斷等。 搭建與維護指標體系:例如,指標設(shè)計、指標體系建設(shè)等。 建設(shè)與維護數(shù)據(jù)產(chǎn)品:例如,指標管理系統(tǒng)、數(shù)據(jù)報表、數(shù)據(jù)看板、分析引擎等。
關(guān)于“臨時取數(shù)需求”,好好將其歸屬與“數(shù)據(jù)產(chǎn)品”這一個工作分類下。這是因為:找分析師跑SQL取數(shù)的根本原因,在于數(shù)據(jù)產(chǎn)品沒有建設(shè)好,或是沒有建立起良性的合作機制。進而導(dǎo)致了各方需要“繞道”數(shù)據(jù)分析師這個“產(chǎn)品”來取數(shù)。
輸出商業(yè)洞察:如分析報告等。
這里再簡單介紹下其他崗位的工作:
○ 數(shù)倉工程師的主要工作包括生產(chǎn)與加工數(shù)據(jù)。
生產(chǎn)數(shù)據(jù):比如埋點設(shè)計,將業(yè)務(wù)事實轉(zhuǎn)化為數(shù)據(jù)落表等。
加工數(shù)據(jù):比如數(shù)據(jù)治理,通過ETL的流程,保證數(shù)據(jù)的質(zhì)量?;蚴菙?shù)據(jù)架構(gòu)設(shè)計,使得數(shù)據(jù)的存儲、加工、調(diào)用等有保障的同時,控制成本與風(fēng)險等。
○ 算法工程師的主要工作包括加工和消費數(shù)據(jù)。
加工數(shù)據(jù):比如用戶打標,通過算法對用戶原始的數(shù)據(jù)信息進行加工,進而給用戶打上標簽,描述TA現(xiàn)在可能的狀態(tài),或是未來可能發(fā)生的行為。
消費數(shù)據(jù):比如算法推薦,基于用戶的歷史數(shù)據(jù),給出推薦?;蚴菚r序預(yù)測,對未來的業(yè)務(wù)狀況進行預(yù)測,進而作為決策的依據(jù)。
○ 用戶研究崗的工作內(nèi)容涉及到生產(chǎn)和消費數(shù)據(jù)。
生產(chǎn)數(shù)據(jù):比如調(diào)研問卷、焦點訪談等。
消費數(shù)據(jù):比如消費者洞察報告、UI設(shè)計建議等。
其他崗位,好好在此就不一一列舉說明了,因為不同的公司,對相同崗位也會有不同的職能安排。以上介紹也僅為拋磚引玉,還望有不同看法的同學(xué),不吝賜教。
但方法是可以復(fù)用的。當(dāng)你在開展工作時,可以分析一下,你所在的公司的數(shù)據(jù)流情況,以及不同的崗位,在整個數(shù)據(jù)流中承擔(dān)的職責(zé)與貢獻的價值。
希望以上的介紹,能讓大家對數(shù)據(jù)崗的日常工作有一個簡要的了解。
就工作內(nèi)容而言,這中臺數(shù)據(jù)分析師的工作既涉及到“業(yè)務(wù)數(shù)據(jù)化”(開拓數(shù)據(jù)源、表資產(chǎn)),也涉及“數(shù)據(jù)業(yè)務(wù)化”(指標體系、分析方法論、數(shù)據(jù)產(chǎn)品、商業(yè)洞察)。所以說,所需的知識與技能是比較廣域的。
根據(jù)這6類工作內(nèi)容,我們來逐一梳理一下數(shù)據(jù)分析崗所需的專業(yè)知識與技能:
通用的職業(yè)技能,如溝通方式與方法、時間管理、預(yù)期管理等,好好在此不多贅述。
知識方面:學(xué)習(xí)搜索技能、積累公開數(shù)據(jù)源的路徑、掌握競對分析的方法論。如有余力,可以學(xué)習(xí)一些用戶研究相關(guān)的知識,如調(diào)研問卷設(shè)計、訪談設(shè)計等。
技能方面:如有余力,掌握一些初步的爬蟲技能;至少知道什么信息可以通過網(wǎng)頁爬取的方式獲得。
知識方面:學(xué)習(xí)基礎(chǔ)的數(shù)據(jù)庫相關(guān)知識。有志于更深入了解數(shù)據(jù)資產(chǎn)管理的同學(xué),可以看看《一本書講透數(shù)據(jù)治理》、《華為數(shù)據(jù)之道》等為切入點。
技能方面:掌握SQL。在有基礎(chǔ)編程與數(shù)據(jù)庫知識打底的情況下,可以直接通過??偷腟QL題庫邊練邊學(xué)。搜索引擎是一位很好的老師,何況工作之后也大多數(shù)時候是面向Google編程。
如果暫時還沒有基礎(chǔ)的編程知識,可以考慮通過北京理工大學(xué),嵩天教授的《Python語言程序設(shè)計》入門。學(xué)習(xí)曲線非常適中。
知識方面:需要有一些數(shù)學(xué)/統(tǒng)計學(xué)的基礎(chǔ)知識,并且掌握一些通用的邏輯思維方法,如金字塔原理等。如有余力的,可以學(xué)習(xí)一些算法模型相關(guān)的知識,如回歸、分類、聚類等。
技能方面:掌握一些處理數(shù)據(jù)的工具,如Excel、Python等。
可參考之前的推文《如何搭建一套完整的指標體系?》。
當(dāng)然最重要的,依舊是理解業(yè)務(wù)。
那么怎么理解“理解業(yè)務(wù)”這件事呢?
好好也沒有想到一個非常好的形式上的定義。這里好好給一個舉例式的定義:如果你是一個保險從業(yè)者,最基本的要求是知道“一張保單是如何流轉(zhuǎn)的”。如果你是一個電商從業(yè)者,最基本的要求是知道“消費者從登陸到交易完成的整個鏈路是怎么樣的”。
知識方面:掌握一定的數(shù)據(jù)可視化相關(guān)的知識,在此推薦電子工業(yè)出版社出版的《數(shù)據(jù)可視化》。對于數(shù)據(jù)治理相關(guān)的知識,可以參照上文提到的《數(shù)據(jù)中臺》《大數(shù)據(jù)之路》《華為數(shù)據(jù)之道》等;如要更加深入的介入數(shù)倉建設(shè),可參閱Kimball的《數(shù)據(jù)倉庫工具箱》
技能方面:掌握至少一樣BI看板設(shè)計工具,如FineBI等。如有余力可以學(xué)習(xí)一些產(chǎn)品設(shè)計原理,如尼爾森十大可用性原則等。
技能方面:掌握一些基本的PPT制作方法,即保證一定的美觀性、又提升工作的效率,最重要的是保證信息傳遞的有效性與高效性。當(dāng)然,在實際工作中,直接套用模板是非常省事的。
數(shù)據(jù)崗的核心職能:數(shù)據(jù)崗的核心職能有兩個,第一,產(chǎn)出數(shù)據(jù)資產(chǎn);第二, 提升信息的價值密度。
數(shù)據(jù)職能的價值:通過數(shù)據(jù)量化與驅(qū)動業(yè)務(wù),幫助組織實現(xiàn)“業(yè)務(wù)數(shù)據(jù)化”與“數(shù)據(jù)業(yè)務(wù)化”。進而,建立起一個正向的閉環(huán)數(shù)據(jù)流,使得數(shù)據(jù)越用越多,越用越好。 數(shù)據(jù)分析崗的工作內(nèi)容:① 開拓新的數(shù)據(jù)源、② 產(chǎn)出表資產(chǎn)、③ 沉淀分析方法論、④ 搭建與維護指標體系、⑤ 建設(shè)與維護數(shù)據(jù)產(chǎn)品、⑥ 輸出商業(yè)洞察。 如何積累所需的知識與技能:任務(wù)驅(qū)動、目標導(dǎo)向。
免責(zé)聲明:
本公眾號所有分享的軟件和資料來自網(wǎng)絡(luò)收集和整理,所有文字和圖片版權(quán)歸屬于原作者所有,且僅代表作者個人觀點,與數(shù)據(jù)工匠俱樂部無關(guān),文章僅供讀者學(xué)習(xí)交流使用,并請自行核實相關(guān)內(nèi)容,如文章內(nèi)容涉及侵權(quán),請聯(lián)系后臺管理員刪除
免責(zé)聲明:
本公眾號所有分享的軟件和資料來自網(wǎng)絡(luò)收集和整理,所有文字和圖片版權(quán)歸屬于原作者所有,且僅代表作者個人觀點,與數(shù)據(jù)工匠俱樂部無關(guān),文章僅供讀者學(xué)習(xí)交流使用,并請自行核實相關(guān)內(nèi)容,如文章內(nèi)容涉及侵權(quán),請聯(lián)系后臺管理員刪除
(歡迎大家加入數(shù)據(jù)工匠知識星球獲取更多資訊。)

掃描二維碼關(guān)注我們

我們的使命:發(fā)展數(shù)據(jù)治理行業(yè)、普及數(shù)據(jù)治理知識、改變企業(yè)數(shù)據(jù)管理現(xiàn)狀、提高企業(yè)數(shù)據(jù)質(zhì)量、推動企業(yè)走進大數(shù)據(jù)時代。
我們的愿景:打造數(shù)據(jù)治理專家、數(shù)據(jù)治理平臺、數(shù)據(jù)治理生態(tài)圈。
我們的價值觀:凝聚行業(yè)力量、打造數(shù)據(jù)治理全鏈條平臺、改變數(shù)據(jù)治理生態(tài)圈。
了解更多精彩內(nèi)容
長按,識別二維碼,關(guān)注我們吧!
數(shù)據(jù)工匠俱樂部
微信號:zgsjgjjlb
專注數(shù)據(jù)治理,推動大數(shù)據(jù)發(fā)展

