進(jìn)百度了 | 菜鳥的數(shù)據(jù)分析求職之路
↑ 關(guān)注 + 星標(biāo) ,每天學(xué)Python新技能
后臺回復(fù)【大禮包】送你Python自學(xué)大禮包
文中的我,均是指原作者沉魚!
大家好,我是沉魚??
這是我第一次在公開平臺上輸出自己的求職歷程與心得體會。一是希望能幫助到大家,二是當(dāng)作對自己過往的總結(jié),更好地調(diào)整狀態(tài)應(yīng)對新的生活。
一、個人經(jīng)歷介紹
我的個人背景:20屆本科畢業(yè)生,計(jì)算機(jī)相關(guān)專業(yè),就讀于帝都某985工科院校。大三之前基本上對自己的職業(yè)生涯沒有什么概念,也處于一種混日子的狀態(tài)。直到大三上的一門統(tǒng)計(jì)分析模型的課程,點(diǎn)燃了我對數(shù)據(jù)分析的熱情,夢想成為一名數(shù)據(jù)科學(xué)家。。。。。了解到畢業(yè)后可以去互聯(lián)網(wǎng)做數(shù)據(jù)分析師,于是興沖沖地在專業(yè)課與出國考試的夾雜下,開始了數(shù)據(jù)分析零基礎(chǔ)的學(xué)習(xí)。
我的數(shù)據(jù)分析求職時間線:19年3-8月,知識技能學(xué)習(xí) - 19年9月第一份小廠數(shù)分實(shí)習(xí) - 19年10月第二份中廠數(shù)分實(shí)習(xí)-20年春節(jié)疫情爆發(fā),呆在家里準(zhǔn)備春招-20年4月收獲2家大廠,2家小廠數(shù)分offer。
由于大一大二缺少規(guī)劃,大三大四同時準(zhǔn)備出國與校招,導(dǎo)致我真的快累死,一度崩潰。。。但是最終還是在20年疫情下的春招拿到了滿意的offer。由此可見,眾多營銷號所販賣的“春招無offer”的焦慮口號并不屬實(shí),大家也不要太過焦慮,當(dāng)然提早規(guī)劃更好。
二、對互聯(lián)網(wǎng)數(shù)分崗的理解
數(shù)據(jù)分析其實(shí)是一個定位很雜的崗位,不同公司不同部門,數(shù)據(jù)分析師負(fù)責(zé)的內(nèi)容均不相同,總的來說可以分為兩個大類、四個小類:
(1)技術(shù)型數(shù)據(jù)分析:偏數(shù)據(jù)開發(fā)/偏數(shù)據(jù)建模
偏數(shù)據(jù)開發(fā)的數(shù)據(jù)分析師的技能棧其實(shí)就是數(shù)據(jù)開發(fā)那一套,只是title是數(shù)據(jù)分析而已。偏數(shù)據(jù)建模的那一套,就是利用一些模型、算法來建立預(yù)測模型等對業(yè)務(wù)具有指導(dǎo)作用的數(shù)據(jù)模型。上述兩種都需要比較好的計(jì)算機(jī)功底,會考許多數(shù)據(jù)結(jié)構(gòu)與算法的知識,之后的路線也完全是技術(shù)路線。
我自己有一定的計(jì)算機(jī)功底+算法功底,但是現(xiàn)在及以后,并不打算將技術(shù)崗作為自己的求職目標(biāo),原因有:一、我自己性格比較活分,愛和人溝通,有比較多的鬼點(diǎn)子,讓我老老實(shí)實(shí)每天寫代碼可能會瘋掉 二、自認(rèn)為在技術(shù)方面并沒有什么天分與熱愛,都是靠苦工與被逼學(xué)會的知識,在計(jì)算機(jī)這個更迭很快的領(lǐng)域,可能很快就會跟不上腳步 三、愛惜自己的頭發(fā)。。。。
因此,綜合考慮,我當(dāng)時決定找偏業(yè)務(wù)型的數(shù)據(jù)分析崗
(2)業(yè)務(wù)型數(shù)據(jù)分析:偏業(yè)務(wù)支持/商業(yè)分析
偏業(yè)務(wù)支持型的數(shù)據(jù)分析師主要是支持某個業(yè)務(wù)部門的業(yè)務(wù)開展,實(shí)際工作內(nèi)容可能會包括:指標(biāo)體系搭建、看板搭建、數(shù)據(jù)監(jiān)控、效果評估等等。這類職業(yè)的核心競爭力就是在長期與業(yè)務(wù)部門的對接合作當(dāng)中,積累自己對該業(yè)務(wù)的數(shù)據(jù)熟悉度與敏感度,積累一些業(yè)務(wù)sense。但是這類數(shù)據(jù)分析師特別容易淪為SQL取數(shù)機(jī)器…針對業(yè)務(wù)方所設(shè)置的策略,數(shù)據(jù)分析師需要提供大量的數(shù)據(jù)支持,可能留給自己思考策略的時間并不多,大量的時間耗費(fèi)在了和業(yè)務(wù)方討論數(shù)據(jù)需求以及動手取數(shù)中。而且因?yàn)椴粚?shí)際在業(yè)務(wù)前線,而是通過長期的合作中得到業(yè)務(wù)方消化思考過的“二手知識”,缺乏從一手知識到實(shí)踐積累復(fù)盤的閉環(huán),所以一不小心就會變成一枚人肉提數(shù)機(jī)………
而商業(yè)分析師則有點(diǎn)類似咨詢,主要通過解讀經(jīng)濟(jì)趨勢、政策導(dǎo)向、復(fù)盤全盤數(shù)據(jù)、洞察競爭對手玩法,從而得出未來大方向上的業(yè)務(wù)開展思路與打法建議。這類崗位前景算是比較好的,視野很開闊,也不容易淪為取數(shù)機(jī)器…但是老實(shí)講我覺得并不適合應(yīng)屆生去干,具體想法在這里就不多說了。
總而言之,偏業(yè)務(wù)的數(shù)據(jù)分析師相對入門門檻會比較低一點(diǎn),也比較符合我的個性~
三、如何從零開始準(zhǔn)備數(shù)分求職
抱著“遇事不決,查經(jīng)驗(yàn)貼”的想法,我當(dāng)時翻查了很多網(wǎng)絡(luò)上的課程和知乎上的經(jīng)驗(yàn)貼。當(dāng)時是2019年,關(guān)于數(shù)據(jù)分析的經(jīng)驗(yàn)貼還不如現(xiàn)在這么多,質(zhì)量也不如現(xiàn)在的文章。所以我當(dāng)時在知乎上并沒有得到合適的的答案與方向。如果是現(xiàn)在看到這篇文章的同學(xué),我倒是建議你可以去大量檢索知乎上的相關(guān)話題、回答、文章,然后針對自己不懂的問題,做一個簡單的數(shù)據(jù)統(tǒng)計(jì)分析,避免陷入一家之談~
那么現(xiàn)在,有了這么多經(jīng)驗(yàn)貼的情況下,我還能跟大家聊點(diǎn)什么呢?我想主要是以下兩點(diǎn):
(1)關(guān)于數(shù)分的書籍和資源推薦多如牛毛,我會幫大家篩選吐槽一批資料,從而幫助你更好的認(rèn)識到一些“殘酷的真相”
(2)關(guān)于求職路徑到底要如何規(guī)劃?心態(tài)如何調(diào)整?我也有一些話想說
3.1 數(shù)分資料吐槽與推薦
3.1.1 SQL
對于這個數(shù)據(jù)分析師安身立命的看家本事,我想許多人已經(jīng)耳熟能詳了。首先,我先講講我自己SQL能力是如何精進(jìn)的,以及目前大廠對數(shù)分的SQL能力的要求。
我自己的SQL能力精進(jìn)主要分為4個階段:一、菜鳥期,選修了學(xué)校的MySQL選修課,以為SQL不過如此,也就是select where group by....二、第一份小公司實(shí)習(xí),面試的時候憑借著自己的小聰明答對了SQL題,進(jìn)去實(shí)習(xí)以后,通過看別人的SQL代碼,增長了不少知識(原來SQL可以寫到上百行、原來JOIN可以這么用、原來還有explode lateral view這種寫法、原來窗口函數(shù)有這么多妙用……)三、練熟了SQL以后,去到了第二份中廠實(shí)習(xí),這份實(shí)習(xí)帶我的人要求很高,要求我從零開始寫自己的SQL,不可以參考別人的。這段時間我從熟悉底表、自己寫SQL、瘋狂報錯查錯的時間,是我對SQL能力掌握的增長期,到這里,加上在學(xué)校的時間和工作后的鍛煉,我差不多寫了3個月的SQL,才算是得心應(yīng)手了起來。四、搭配業(yè)務(wù)思維與高速取數(shù),很多時候業(yè)務(wù)方提來的需求需要被詳細(xì)解讀、溝通后,再著手開始寫代碼,而不是一上來就類似解題一樣,“一頓操作猛如虎,最后結(jié)果二百五”
目前各大廠對數(shù)據(jù)分析師SQL能力的要求普遍是在3階段,需要手寫復(fù)雜邏輯,熟練掌握較為高階用法的。
【吐槽時刻】
不知道多少回答推薦的SQL入門書籍只有一本《SQL必知必會》,在這里我想說,這本書里的內(nèi)容用一張A4紙就可以總結(jié)完,都是SQL最基礎(chǔ)的語法,掌握這本書的內(nèi)容是遠(yuǎn)遠(yuǎn)不夠的。
除此之外,在練習(xí)方面,有許多答主推薦SQL的leetcode來進(jìn)行刷題,我個人也不太推薦這種“為了寫SQL而寫SQL”的刷題網(wǎng)站,缺乏業(yè)務(wù)場景的SQL練習(xí)失去了靈魂………
【推薦時刻】
推薦大家閱讀 這本書,采用對比的方式同時講解Excel與SQL,同時get兩個技能。同時許多SQL問題都是基于實(shí)際業(yè)務(wù)場景的,突出一個香!
最后要說一句,真正的SQL能力提升,還是要在實(shí)戰(zhàn)中不斷磨練的。所以,以最快的速度加入一份數(shù)據(jù)分析的實(shí)習(xí),是SQL能力提升的最好方式~
3.1.2 Python
Python能夠處理較大數(shù)據(jù)量的數(shù)據(jù),同時還有各個現(xiàn)成算法包,可謂是數(shù)據(jù)分析師的一把利器。應(yīng)用場景:業(yè)務(wù)方甩過來一個千萬行的數(shù)據(jù),Excel與SQL處理都將會很慢,這個時候Python就派上了用場。
先講講我自己是怎么提升Python水平的吧。我于2019年3月選修了學(xué)校的Python課程,熟悉了Python的基本語法。在此之后,我從網(wǎng)上找了不少Python數(shù)據(jù)分析的現(xiàn)成項(xiàng)目,練習(xí)了Pandas、numpy、matplotlib、sklearn等經(jīng)典包的用法(大概花了2個月),之后就是漫長而繁忙的實(shí)習(xí)了。其實(shí)實(shí)習(xí)+全職的過程中,用到Python的地方也不多,面試也很少會問到Python的具體問題,但是一旦用到的時候,那就是一把利器了!建議大家有時間的話盡早掌握這門語言~
【吐槽時刻】
記得之前搜索過,許多答主推薦國外的Python課程,我也去聽了。但是真心表示,諸多國外網(wǎng)紅Python課如密歇根大學(xué)的那個,學(xué)習(xí)效率真的有點(diǎn)低…當(dāng)然,這可能是個人學(xué)習(xí)偏好的原因。所以,如果你也需要一些短平快、沒有什么花里胡哨的好課和資料推薦的話,我要開始了!
【推薦時刻】
本書主要介紹了Python基本的語法,主編為北京理工大學(xué)的Python網(wǎng)紅老師嵩天~搭配嵩天老師的慕課課程,系統(tǒng)學(xué)習(xí)效果更佳!由于符合中國人一貫的思維方式與學(xué)習(xí)習(xí)慣,我覺得用嵩天的老師的課程入門Python真的十分簡潔高效!
這本書主要是Pandas的字典書!如果說什么包在數(shù)分手里最常用的話,那一定是Pandas~手頭拿著一本Pandas的字典書,隨翻隨看用法~
《誰說菜鳥不會數(shù)據(jù)分析》Python篇,簡直是入門Pandas最友好的書籍沒有之一…甚至菜鳥數(shù)據(jù)分析的全系列我都推薦大家購買,真的十分簡潔易懂,絲毫不用耗費(fèi)腦細(xì)胞~
3.1.3 統(tǒng)計(jì)學(xué)知識
數(shù)據(jù)分析師工作場景中需要統(tǒng)計(jì)學(xué)知識最多的就是各類實(shí)驗(yàn)效果的評估了~AB測試問題也算是面試中的高頻問題了。
主要會考察候選人的統(tǒng)計(jì)學(xué)基礎(chǔ)知識功底+AB測試相關(guān)知識。
【推薦時刻】
這本書比許多國內(nèi)大學(xué)的統(tǒng)計(jì)學(xué)教材都要更加實(shí)用,每個統(tǒng)計(jì)學(xué)概念都會搭配許多經(jīng)濟(jì)學(xué)中的案例來講解,十分有利于讀者理解許多統(tǒng)計(jì)學(xué)概念~建議重點(diǎn)閱讀里面的統(tǒng)計(jì)推斷相關(guān)章節(jié)
上述兩本書為國內(nèi)和國外僅有的基本abtest實(shí)操書籍了,內(nèi)容十分細(xì)致,值得好好研讀!
加餐時刻!這本書雖然比較冷門,但是也確實(shí)是一本寶藏書籍了!介紹了許多數(shù)據(jù)科學(xué)中實(shí)用的統(tǒng)計(jì)學(xué)概念~感興趣的同學(xué)可以買來看看,有許多小知識搭配論文還是很能給人驚喜感的~
3.1.4 業(yè)務(wù)分析思維
數(shù)據(jù)分析師面試中還經(jīng)常會被問到的問題是關(guān)于分析思維的:
“某日DAU/留存率/……突然出現(xiàn)了下降,要怎么分析?”
“如何從0-1搭建一個渠道質(zhì)量評估的指標(biāo)體系?”
這類問題實(shí)際上最好的學(xué)習(xí)方法是找一份相關(guān)的實(shí)習(xí),從實(shí)際工作中,你可以從公司現(xiàn)有文檔及前輩同事的講解中,學(xué)到許多寶貴的分析思路,最終,慢慢沉淀出自己的分析思路
但是,許多0經(jīng)驗(yàn)的同學(xué)也會在面試中一視同仁地被問到,因此,我推薦大家可以多去知乎、微信公眾號上面搜一搜。近兩年不少成熟的數(shù)據(jù)分析師踴躍地在知乎和微信公眾號上分享了很多干貨,努力搜的話一定能找到不少相關(guān)的文章。通過對這些文章里的思路的總結(jié)匯總,面試中也能回答個八九不離十了(因?yàn)?經(jīng)驗(yàn)的同學(xué)不會要求太高)
在這里,由于業(yè)務(wù)場景實(shí)在是太多了,基于不同業(yè)務(wù)場景下的數(shù)據(jù)分析思路其實(shí)需要基于具體業(yè)務(wù)來設(shè)計(jì),因此我就不在這里推薦相關(guān)書籍了。感興趣的同學(xué)可以私信我~比如用戶增長、電商、廣告等方向的公司,具體指標(biāo)的分析方法都會有其常用的套路。
因此,在這里,我還推薦大家,不要局限于看一些數(shù)據(jù)分析類的書,任何與你所面試公司業(yè)務(wù)有關(guān)的書籍、文章等都值得一讀。試著去了解一個業(yè)務(wù),自然而言會有一些分析思路的總結(jié)~
3.1.5 機(jī)器學(xué)習(xí)算法
雖然說數(shù)據(jù)分析師在實(shí)際業(yè)務(wù)場景中使用機(jī)器學(xué)習(xí)算法也不多,但是作為數(shù)據(jù)科學(xué)領(lǐng)域一個強(qiáng)有力的探索數(shù)據(jù)規(guī)律的工具,還是建議大家多掌握一些知識,以備不時之需。算法這塊在許多面試中也可能會被問到:
“Kmeans算法的原理是什么?”
“XGboost與隨機(jī)森林的區(qū)別是什么?”
以此來考察候選人的機(jī)器學(xué)習(xí)算法功底,關(guān)于機(jī)器學(xué)習(xí)算法的書籍在知乎上已經(jīng)有很多人推薦了,在這里我就不推薦了。經(jīng)典書籍:西瓜書、李航統(tǒng)計(jì)學(xué)習(xí)方法等都值得好好研讀。
這塊唯一需要注意的是:不要貪多,仔細(xì)啃完一兩本經(jīng)典書籍,基本上就夠用了。也不需要太過執(zhí)拗于數(shù)學(xué)原理(雖然我本人曾經(jīng)一度沉迷于數(shù)學(xué)原理的推導(dǎo)和手寫算法),但是后來覺得,不需要也沒有必要重復(fù)造輪子。sklearn已經(jīng)有很多現(xiàn)成的包了,作為算法應(yīng)用層的數(shù)據(jù)分析師,其實(shí)只要學(xué)會大概的原理+現(xiàn)成包的使用就可以了~
3.1.6 其他方面知識
其實(shí)熟練掌握以上五點(diǎn),已經(jīng)足夠應(yīng)對絕大部分?jǐn)?shù)據(jù)分析師的面試了。當(dāng)然,有些崗位還會特別強(qiáng)調(diào),候選人需要會使用tableau等數(shù)據(jù)可視化軟件。關(guān)于這類軟件的介紹書籍有很多,在這里就不多贅述了。
四、寫在最后
文章到這里,已經(jīng)是接近尾聲了。作為第一次輸出經(jīng)驗(yàn)貼的我,還是有點(diǎn)小小的緊張和惶恐的。希望看到這里的鐵子們,可以多多點(diǎn)贊支持?。?!你們的支持是我下次創(chuàng)作的動力?。?!
最后我想嘮叨一下,希望大家能夠比較冷靜、理想地去看待和了解數(shù)據(jù)分析師這個崗位。它有存在的價值,也有一定的職業(yè)壁壘,但是并不像營銷號口中說的那么“高大上”和“性感”。因此不必對其抱有過高的預(yù)期,而導(dǎo)致在工作中整天干一些臟活累活而感到落差很大~
在求職過程中,不必太過在意公司title。我認(rèn)為,只要你覺得這個公司有你想學(xué)習(xí)/感興趣的東西,都可以考慮去。不必在心中對公司劃成三六九等~大公司有大公司的優(yōu)勢,小公司也有小公司的優(yōu)勢~如果你是從零開始的同學(xué),很難第一份工作就找到大廠,從小廠開始,慢慢學(xué)習(xí)積累,也不失為一條很舒服的路子。
最后,鐵子們,如有意見,請不要噴我。歡迎在評論區(qū)或私信與我產(chǎn)生友情討論~
一日一書
《阿里云天池大賽賽題解析——深度學(xué)習(xí)篇》本書聚焦深度學(xué)習(xí)算法建模及相關(guān)技術(shù),選取醫(yī)療、視頻、工業(yè)三個非常有行業(yè)代表性的賽題:瑞金醫(yī)院MMC人工智能輔助構(gòu)建知識圖譜、阿里巴巴優(yōu)酷視頻增強(qiáng)和超分辨率挑戰(zhàn)賽、布匹疵點(diǎn)智能識別,介紹賽題涉及的技術(shù)知識和選手的創(chuàng)新思路與模型,對賽題的解決方案從0到1層層拆解。
這本書從經(jīng)典行業(yè)案例出發(fā),內(nèi)容由淺入深、層層遞進(jìn),既可以作為專業(yè)開發(fā)者用書,也可以作為參賽選手的實(shí)戰(zhàn)手冊。
- END -
推薦閱讀
推薦一個公眾號,幫助程序員自學(xué)與成長
覺得還不錯就給我一個小小的鼓勵吧!


