1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        面經 | 阿里淘系數(shù)據(jù)分析1+5面 offer報批中

        共 4448字,需瀏覽 9分鐘

         ·

        2020-11-28 00:51

        篇分成三part:
        1. 超重要的簡歷面

        2. 面經

        3. 面試 over


        part1 超重要的簡歷面


        阿里今年多是業(yè)務線各自組織招聘,二月底我就在淘系技術部的內推群里投了簡歷。這次簡歷面也算是我人生中第一次正式的工作面試吧(我yy的mentor看到可能會氣死hhh)。可以說,從0基礎的萌新小白,到后來get TAT三家大廠offer的初級小白,都得感謝這次面試。

        當時簡歷一塌糊涂,方向不清晰,目標不明確。

        簡歷面 2020.02.24? ? 30min

        1. 實習經歷
        2. 一個指標在30天內有波動,怎么判斷屬于正常波動還是數(shù)據(jù)異常?
        3. 實習具體做了什么工作
        開發(fā)ltv報表如何選取指標?有討論嗎?報表的維度有哪些?怎么分析?你做的報表能發(fā)現(xiàn)什么?可以提供給產品什么建議?
        4. 如果讓你來選指標,除了ltv(屬于中后期指標),還可以選什么?如何用圖表呈現(xiàn)?

        5. sql問題
        • row_number()實際用法介紹

        • 如何優(yōu)化連接

        6. 統(tǒng)計
        • 貝葉斯公式一般解決什么問題

        • 現(xiàn)在新型冠狀病毒,有一個病人發(fā)燒咳嗽,讓你用試劑盒檢測,拿到陽性或陰性的結果,怎么判斷他到底有沒有患病?

        • 假設檢驗和置信區(qū)間的區(qū)別

        • 中心極限定理

        7. 機器學習
        • 比較熟悉的機器學習算法有哪些?

        • 支持向量機的原理是什么?和感知機的區(qū)別?那線性可分和不可分有什么區(qū)別呢?

        8. 建議:
        • 系統(tǒng)地梳理一遍業(yè)務知識

          • AARRR

          • 廣告的投放、變現(xiàn)過程...

        小哥說了很多,但我的字跡太潦草,后來我只認出了這幾個字...
        • 熟悉兩三個算法,可以從這幾個角度:

        ?解決什么問題、算法原理、推導過程、缺點、怎么優(yōu)化。

        整理面經時看見之前的答案真的好辣雞,所以就沒有貼我的回答啦

        e.g:
        被問到svm怎么用于線性不可分數(shù)據(jù)集,我:怎么會線性不可分哇,從數(shù)學上來講,只要不是無限維的,映射到高維空間,都能給他分得開?

        當時屬于完全get不到面試官想考我什么的菜?水平

        不過這次面試讓我知道應該從這幾個方向去準備
        • 算法:小哥說,一般面試也沒兩個人能把svm的來龍去脈講清楚,所以重點弄明白兩三個經典算法就好了(可能需要svm的smo這種深度吧

        • 業(yè)務:系統(tǒng)學習和整理相關知識,思路才會更有框架性

        • 自己簡歷的case得從多方面深挖


        好像講的都是大家知道的,但我最初是很抵觸去看算法的,覺得內容多且雜,沒有辦法面面俱到。但是掌握兩三個就很容易了,再從算法的異同點逐漸拓展開來,每次面試前復習一遍,讀書百遍,其義自就是這個道理吧


        緊接著就是前面兩篇寫過的騰訊&字節(jié)的面試,直到3月18阿里開正式系統(tǒng),才有之后的故事:part2:3+1交叉面+1hr面?其中第3面簡單粗暴 & 慘不忍睹


        part2 面經


        淘系技術部 數(shù)據(jù)分析


        一面 2020.03.26 30min
        1. 自我介紹
        2. 為什么轉到數(shù)學?遇到的最大困難和解決辦法
        3. 數(shù)據(jù)分析分很多種,阿里實習和轉正要求是同一崗位,你為什么想做偏業(yè)務的呢?

        4. 你在yy具體什么部門負責什么業(yè)務?組織架構是怎樣的?

        5. 統(tǒng)計

        • 用小白鼠做實驗,如何驗證新藥劑是否有作用?

        • 如果p值比a大,就斷定新藥劑有作用嗎?

          統(tǒng)計顯著性和檢驗顯著性


        6. 業(yè)務題

        • 淘寶活動,怎么設計優(yōu)惠券的滿、減金額,使gmv最大?怎么設計?怎么對比?最后看什么數(shù)據(jù)?

          對比:不能只考慮gmv值的絕對差異,還要考慮退貨訂單率

        • 對于設計出來的兩三種優(yōu)惠券,基于過去的數(shù)據(jù),怎么給商家配比?通過什么維度?如何衡量好壞?

        7. 提問:
        • 具體部門:淘系技術部 - 商業(yè)機器智能部門

        • 不足:互聯(lián)網相關實踐較少,多看一些行業(yè)報告是如何分析問題的


        面試官說他之前面的都是社招,也不太了解我這種沒啥實踐的校招生應該是什么水平(害 maybe他以為校招生都跟我一樣菜了 ?

        二面 2020.04.01 35min+11min(面試官介紹工作內容)

        1. 實習的匯報線和分工,圍繞具體負責的產品功能介紹工作內容
        2. 實習case
        • 你覺得最難的點?

          分業(yè)務和技術展開講

        • 技術層面遇到的問題 & 怎么解決的?技術層面的提升有哪些?

        3. sql
        • sql的優(yōu)化有哪些

        • 小表在前,大表在后的優(yōu)化原理

        • tb有一列數(shù),保證不重復,打印出相加等于100的數(shù),2&98 與98&2只打印出一行即可


        4. 業(yè)務題

        • 道路交通事故,男司機出現(xiàn)事故占90%,女司機出現(xiàn)事故占10%,是否說明男司機比女司機更容易出現(xiàn)交通事故?

          不對,基數(shù)不一樣

        • 除了人數(shù),還需要考慮什么因素?(這才意識到是想考我控制變量法)

          除了性別,其他因素都一樣:統(tǒng)計的時間區(qū)間、駕駛車的類型(幾座、牌子)、車齡、司機駕齡...


        5. 概率題54張牌分成三份,4個A一起的概率
        ????高中數(shù)學的古典概型問題

        6. 代碼能力,python什么程度?具體使用情況?spark的使用?數(shù)據(jù)清洗的時間格式轉換?

        7. 提問:

        • 數(shù)據(jù)分析具體工作做什么?

        ????????數(shù)據(jù)賦能,大團隊包括算法、數(shù)據(jù)

        ????????對外發(fā)揮價值的方式:以分析為主導,為運營、產品迭代提供幫助;算法賦能,抽象建模

        • 如何提升?

        ????????業(yè)務上的理解可以在實習中逐漸積累、繼續(xù)沉淀;技術層面:python等是一方面,還要學習機器學習、數(shù)據(jù)挖掘相關算法


        三面 2020.04.03 15+3min

        面試官前一天打電話約時間和面試時都十分高冷,看??蜕系拿娼浾f第三面很有可能是壓力面,不出所料,果然面到心態(tài)爆炸?

        1. spark是用java還是scala?
        ????emmm 主要是在云計算平臺上寫spark sql,沒有涉及到更底層的

        2. spark sql和普通sql有什么區(qū)別?運行的時候遇到過哪些錯誤?具體報錯的信息是什么?

        ????再次... ?這兩個spark相關的問題答得是相當辣雞,這一刻感覺自己呼吸都是尷尬的


        3. 靈魂拷問系列

        ??? Q:對一列數(shù)據(jù)進行二值化,使得二值化后的數(shù)據(jù)均方誤差最小

        ??? A:聚類算法的思想:k-means

        ??? Q:你確定你的答案嗎?還有什么快速方法?

        ??? A:確定。從小到大排列,取1/4和3/4分位數(shù)

        ??? Q:如果不排序,還有什么方法?

        ??? A:是否需要精確找到這兩個數(shù)?數(shù)據(jù)量很大嗎?可以當成正態(tài)分布來做嗎

        ??? Q:精確找到,沒有分布信息

        ????...

        ??? A:是要精確找到這個數(shù)嗎?

        ??? Q:是,你剛才已經問過了

        ????...

        ??? A:用二分法,對于排在中間位置的數(shù),比它小就往前排,比它大就往后排...


        4. 30個人去旅游,有A、B、C、D、E 5個地方供選擇,每人投一票,兩種投票方式:

        :選出票數(shù)最多的地點(如果票數(shù)相同,對于相同地點繼續(xù)投票)

        二:每一輪淘汰一個票數(shù)最少的地點,直到只剩一個地點

        這兩種投票方式有區(qū)別嗎?為什么?講出這兩種投票方式的優(yōu)缺點2-3個

        一:盡可能滿足更多人的第一志愿,二:盡可能提升所有人的平均滿意度

        5. 提問:

        • 和前面的面試官是一個部門嗎?

        ????????面試官:你還沒有到交叉面試環(huán)節(jié)

        • spark sql那一塊是不是答得很不好?

        ????????面試官:你覺得這是什么原因?


        靈魂拷問系列中的兩個...,是我面試中度過最漫長的兩分鐘。最后這兩個死亡提問,現(xiàn)在回憶起來仍令我倒吸一口涼氣,maybe真是壓力面?!但我還是硬著頭皮認真解釋了剛開始為什么答得不好以及之后的改進方向,可能有扳回0.1成?



        因為三面回答得太辣雞,一直以為自己被掛掉了,但是官網流程沒更新。14號接到阿里面試官電話,開口第一句:我是螞蟻金服的算法工程師...

        學姐說阿里的交叉面一般是阿里內部or螞蟻內部的交叉,我可能是被轉崗了,想到自己又要從頭開始,仿佛看到騰訊0-7的悲慘戰(zhàn)績,差點沒緩過來?

        四面 2020.04.14 30min (螞蟻金服交叉面)

        1. ccf項目 ? 13min

        • 方案賽和算法賽的區(qū)別、復賽思路展開

        • 你們都不是網絡安全相關專業(yè)的,怎么想到這么去做的呢?

        • 如果不知道業(yè)務知識,怎么去分析?

          數(shù)據(jù)如果脫離業(yè)務背景,分析就沒有意義

        • 企業(yè)里復用,對于噪聲影響怎么優(yōu)化分析思路?

        • 具體分工 & 最終得到的結果


        2. 簡歷里提到的用戶行為分析 ? ?7min

        • 具體:

          從用戶打開app開始,分析付費用戶的前續(xù)行為

        • 報表的作用:

          為選取搭建基礎數(shù)據(jù)報表體系的指標提供支持,為產品迭代提供方向

        • 除了數(shù)據(jù)結果,還可以從哪些方向優(yōu)化app?


        3. 遷移到螞蟻金服的業(yè)務(數(shù)字金融線),怎么界定行為的轉化,比如用戶從最初使用余額寶??穩(wěn)健型理財產品??風險型基金這樣一個進階過程

        • 定義優(yōu)質客戶:在螞蟻上花費較多的用戶,時間序列觀察行為轉變過程

        • 定義轉化的關鍵步驟:從數(shù)據(jù)上發(fā)現(xiàn)哪兩步之間存在比較大的gap,結合業(yè)務定位問題

        4. 提問:

        • 面試流程:面試官表示是他老板讓他面的,他不清楚我前面的流程,以為是一面

        • 具體工作:用數(shù)據(jù)指導業(yè)務同學推薦適合的理財產品;描繪用戶的進階路線(用戶行為模式的探索)


        算是最順利的一次面試了,面試官表示我的分析思路和他們的實際工作基本一致,詢問到的工作內容也是我比較感興趣的,好像互相都還覺得比較match。當時我倆都以為是一面,問題也都是圍繞簡歷展開的。

        第二天問了內推的大哥(第一次簡歷面的面試官)才知道,交叉面通過了,可以安心等待hr面

        如果四面面試官知道這是交叉面,想必不會這么容易了吧

        hr面 2020.04.16 30min 視頻面

        1. 疫情期間在家的安排
        2. 阿里業(yè)務介紹
        ????部門200人,90%以上是算法工程師
        3. 交叉面的問題
        hr姐姐表示他們是淘系面試最嚴格的部門,交叉面必須要跨大的bu
        4. 實習時間:
        • 之前沒有疫情影響,阿里是要求5月-10月底,具體看同學的時間

        • 10月底會有轉正面試,11/12月三方簽署


        5. 你是一個什么樣的人 & 興趣愛好
        6. 你想和什么樣的人一起工作
        老板:邏輯清晰,一針見血,有整體的框架性考慮,工作時認真,私下略活潑。拎得清、分得開
        同事:工作能力強,善于溝通,好相處
        7. 你遇到的比較難的事?
        8. 你想在哪個城市工作?
        淘系大部分base杭州,少量北京

        03 面試 over


        阿里面試風格還是比較鮮明

        1. 很可能沒有自我介紹,直接看簡歷問問題,我hr面都沒有讓自我介紹?

        2. 之前實習工作的部門組織架構及匯報線
        被問到三四次,考察你是否了解公司和業(yè)務的整體運作情況

        3.?更注重發(fā)現(xiàn)問題 & 怎么想到解決方法的思路
        騰訊更多會問怎么解決,阿里更多會問怎么想到這么去解決

        4.?如果面試發(fā)揮得不好,最后提問環(huán)節(jié)也是一個重要機會噢


        ·················END·················

        推薦閱讀

        1. 說說心里話

        2. 寫給所有數(shù)據(jù)人。

        3. 從留存率業(yè)務案例談0-1的數(shù)據(jù)指標體系

        4. NB,真PDF神處理工具!

        5. 超級菜鳥如何入門數(shù)據(jù)分析?


        歡迎長按掃碼關注「數(shù)據(jù)管道」

        瀏覽 110
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            在线国产麻豆 | 美女扒开腿秘 免费网站 | 日韩中文字幕网 | 国产经典一区二区三区 | 亚洲天堂黄色 | 国产精品国产自产拍高清AV | brazzersvideosexhd欧美高清 | 日韩黄色免费观看 | 对白刺激国产子与伦 | 123** |