1. 六成大學(xué)生認(rèn)為畢業(yè)十年能年入百萬,這數(shù)據(jù)靠譜嗎?

        共 2912字,需瀏覽 6分鐘

         ·

        2021-10-02 01:17


        導(dǎo)讀:數(shù)據(jù)分析應(yīng)當(dāng)如何采集數(shù)據(jù)?


        作者:Crossin先生
        來源:Crossin的編程教室(ID:crossincode)



        近日看到一則新聞,讓我虎軀一震:



        新聞下面很多評(píng)論都是過來人的口吻在批判,我倒是覺得樂觀總歸是件好事,“想到”是“做到”的前提。子曾經(jīng)曰:后生可畏,焉知來者之不如今也!某位最近十分低調(diào)的“大佬”也曾經(jīng)曰:夢(mèng)想還是要有的,萬一實(shí)現(xiàn)了呢?


        別說剛剛踏入社會(huì)意氣風(fēng)發(fā)的00后了,就我這樣已經(jīng)畢業(yè)十年的老碼農(nóng),也憧憬可以通過自己的努力年入百萬不是嘛。


        不過作為一個(gè)比大學(xué)生多十年經(jīng)驗(yàn)的社會(huì)人,我來好為人師地灌兩句雞湯:


        1. 前途是光明的,但道路是曲折的。年薪百萬不是不可能,但終究是少數(shù)。要超過六成?那一百萬的購(gòu)買力恐怕也貶值的厲害。(瞧瞧隔壁知乎就知道了:人均百萬,剛下飛機(jī),稀松平常,沒啥稀奇。匿了匿了~)


        2. 財(cái)富是結(jié)果,不是目的。我這不是站在道德的角度說漂亮話,而是以大部分人的心態(tài)來說,如果你只盯著掙錢這個(gè)目的,往往只能掙小錢,搞不好還會(huì)吃大虧。反倒是專注于做好事情、提升自我能力的那些人,能得到更好的經(jīng)濟(jì)回報(bào)。財(cái)富就像狗尾巴,追著自己的尾巴只會(huì)原地轉(zhuǎn)圈,但只要向前跑,尾巴永遠(yuǎn)會(huì)跟著。(狗:你禮貌嗎?)


        然后我不禁回憶了一下當(dāng)年大學(xué)時(shí)對(duì)未來薪資的預(yù)期。記得當(dāng)時(shí)我們班有倆同學(xué)在食堂一邊啃著一塊五的大排一邊聊天:


        • A說:你說咱們畢業(yè)后工資能有多少???

        • B說:我覺得怎么著也得有3000吧!

        • A想了想說:嗯,我也覺得差不多。


        十年下來,這倆人現(xiàn)在有沒有百萬不知道,但三千加個(gè)零肯定不在話下。


        當(dāng)年985的畢業(yè)生,月薪三千的“野心”算是保守了。然而放在當(dāng)年那會(huì)兒,在南京河西也是可以買下兩平米的。如今要是能拿河西兩平米房?jī)r(jià)的月薪,算下來可不就是年薪百萬嗎?從這個(gè)角度來看,大家也彼此彼此嘛


        來都來了,咱們也來做個(gè)調(diào)查:



        既然說到了問卷調(diào)查,這也算是我們經(jīng)常提到“數(shù)據(jù)分析”的一部分。最近我正好在統(tǒng)計(jì)學(xué)之家(tjxzj.net)上面看到關(guān)于收集數(shù)據(jù)的幾個(gè)不錯(cuò)的觀點(diǎn),結(jié)合我自己的經(jīng)驗(yàn),來跟大家分享一下。


        收集數(shù)據(jù)的三個(gè)原則 [1]


        1. 數(shù)據(jù)必須真實(shí)


        有人說,我這數(shù)據(jù)都是真的,沒有造假。這里說的“真實(shí)”,并不僅僅說不造假,而是說能反映被調(diào)研者的真實(shí)想法。像問卷調(diào)查這種形式其實(shí)就經(jīng)常會(huì)因?yàn)閱栴}的設(shè)置或者調(diào)研的環(huán)境等影響,造成被訪者做出并非完全真實(shí)想法的回答。假如一個(gè)公司通過內(nèi)部系統(tǒng)調(diào)研員工對(duì)公司某些制度的意見,那想必是很難得到真實(shí)反饋的。


        如果做產(chǎn)品調(diào)研,通常來說,不是要看用戶怎么“說”,而是要看用戶怎么“做”。一個(gè)很經(jīng)典的例子,Netflix 根據(jù)用戶的觀影行為來分析用戶的觀影喜好,進(jìn)而確定出《紙牌屋》的類型、導(dǎo)演、主演,并大獲成功。如果僅僅是通過發(fā)放問卷,恐怕會(huì)有較大的偏差。


        2. 數(shù)據(jù)一定要準(zhǔn)確


        造成數(shù)據(jù)不準(zhǔn)確的原因有很多,比如監(jiān)控粒度過粗、問卷設(shè)置有歧義、樣本過少或過于集中等等。假如我在編程教室搞個(gè)調(diào)研,可能就得出超六成大學(xué)生想學(xué)Python;而在B站搞個(gè)調(diào)研,得出超六成大學(xué)生想娶王冰冰這樣的結(jié)論也不奇怪。


        不準(zhǔn)確的數(shù)據(jù)源 + 正確的分析邏輯,也只能得出錯(cuò)誤的結(jié)論。


        3. 數(shù)據(jù)必須是可以使用的


        是否可用,其實(shí)是一個(gè)相對(duì)的概念。比如 Netflix 采集了用戶播放時(shí)的暫停、快進(jìn)、跳過等操作,對(duì)他們來說這些數(shù)據(jù)是有用的、可用的。但如果我把編程教室網(wǎng)站上的視頻教程播放操作也記錄下來,對(duì)我來說就是無法使用的。類似的,大量的文本或語言聊天記錄,只有具備相應(yīng)的分析技術(shù)能力,才有分析的價(jià)值。


        而另一方面,可以使用也不僅僅是技術(shù)層面,還有法律層面的考量。俗話說:爬蟲學(xué)得好,牢飯吃到飽。這話可不是段子而已。版權(quán)、隱私、商業(yè)協(xié)議都是采集數(shù)據(jù)之前需要仔細(xì)斟酌的。


        以上僅僅是數(shù)據(jù)采集階段的一些建議,這是數(shù)據(jù)分析的最初階段。一個(gè)完整的數(shù)據(jù)分析流程往往還包括:數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)清洗、建模分析、數(shù)據(jù)可視化等步驟。感興趣的同學(xué)可以留言說一下,哪一塊想聽的人多我之后會(huì)做詳細(xì)解讀。


        之前有不少同學(xué)問過:要做數(shù)據(jù)分析方面的工作,需要學(xué)習(xí)哪些內(nèi)容?是不是學(xué)會(huì)Python就能做數(shù)據(jù)分析師了?


        我用下面這張圖來回答:


        最底層是技術(shù)基礎(chǔ),是進(jìn)行數(shù)據(jù)分析的工具。Python是目前最流行的工具之一,但不是唯一,甚至不是必須。但如果你掌握Python,并且熟悉Pandas、Numpy、Matplotlib這幾個(gè)數(shù)據(jù)分析常用庫(kù),那這一層面你就沒問題了。它是一個(gè)必要條件,但不是充分條件。作為一個(gè)合格的數(shù)據(jù)分析師,你必須要有使用相關(guān)工具的能力;但如果你只是會(huì)寫Python,距離數(shù)據(jù)分析師還尚有距離。


        工具之上,你需要有統(tǒng)計(jì)學(xué)的基本常識(shí),了解常見的分析方法,并可以用工具對(duì)數(shù)據(jù)進(jìn)行相應(yīng)的分析工作,如果了解一些機(jī)器學(xué)習(xí)的模型就更好了。這些都可以通過相關(guān)的書籍、案例進(jìn)行學(xué)習(xí)和練習(xí)。到了這一步,你差不多就入門數(shù)據(jù)分析了,但此時(shí)也還只是個(gè)“工具人”,只能實(shí)現(xiàn)別人給你定好的分析指標(biāo)。


        最上層的軟實(shí)力才是一個(gè)數(shù)據(jù)分析師的核心競(jìng)爭(zhēng)力。你需要對(duì)業(yè)務(wù)有足夠的理解,可以選擇合適的指標(biāo)、模型,找出并驗(yàn)證數(shù)據(jù)的相關(guān)性,提出并推進(jìn)有效的優(yōu)化方案。


        這一步離不開長(zhǎng)期的實(shí)踐、復(fù)盤、思考,作為一個(gè)新人來說或許還很難,但多做、多想,是需要從一開始就養(yǎng)成的習(xí)慣。假如交給你的任務(wù)是分析某個(gè)指標(biāo),那你是就只看這一個(gè)指標(biāo),做完拉倒,還是再多試試其他指標(biāo)、其他模型,完全取決于你自己。


        大家都是同一年畢業(yè),但十年后的薪資差異,就都在這一點(diǎn)一滴的細(xì)節(jié)中產(chǎn)生了分化。(好嘛,最后居然又扯回來了)


        一點(diǎn)淺見,如果對(duì)你有幫助,歡迎轉(zhuǎn)發(fā)/點(diǎn)贊/收藏~你們的支持是我更新的動(dòng)力。


        參考:

        [1] http://www.tjxzj.net/1236.html



        延伸閱讀??

        延伸閱讀數(shù)據(jù)分析即未來


        干貨直達(dá)??


        更多精彩??

        在公眾號(hào)對(duì)話框輸入以下關(guān)鍵詞
        查看更多優(yōu)質(zhì)內(nèi)容!

        讀書 | 書單 | 干貨 | 講明白 | 神操作 | 手把手
        大數(shù)據(jù) | 云計(jì)算 | 數(shù)據(jù)庫(kù) | Python | 爬蟲 | 可視化
        AI | 人工智能 | 機(jī)器學(xué)習(xí) | 深度學(xué)習(xí) | NLP
        5G | 中臺(tái) | 用戶畫像 數(shù)學(xué) | 算法 數(shù)字孿生

        據(jù)統(tǒng)計(jì),99%的大咖都關(guān)注了這個(gè)公眾號(hào)
        ??
        瀏覽 19
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
          
          

            1. 久久久熟女| 波多野结衣在线观看免费视频大全 | 在线观看免费视频一区 | 亚州一区二区豆花 | 欧美精品啪啪啪 |