1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        新書上市 | 史上最系統(tǒng)全面的預(yù)處理教程來了!

        共 1654字,需瀏覽 4分鐘

         ·

        2021-02-02 10:10


        “三天了,我還在做數(shù)據(jù)預(yù)處理?!?/span>

        “第一步就卡住了,數(shù)據(jù)預(yù)處理也太難了吧!”

        “媽呀,弄了我?guī)讉€(gè)月的問題,原因竟然是我預(yù)處理數(shù)據(jù)的時(shí)候方法不好。”

        “腦子空空如也,此時(shí)此刻,為啥沒有人告訴我,原來我可以死在數(shù)據(jù)預(yù)處理上?!?/span>

        ……


        網(wǎng)上隨手搜一下,就會(huì)發(fā)現(xiàn)對數(shù)據(jù)預(yù)處理的抱怨比比皆是。圍繞數(shù)據(jù)預(yù)處理的關(guān)鍵詞有兩個(gè)——“重要”“難”。很多數(shù)據(jù)分析相關(guān)的圖書和文章都這樣介紹預(yù)處理:


        預(yù)處理的工作量占數(shù)據(jù)分析任務(wù)的80%


        預(yù)處理是數(shù)據(jù)分析中必不可少的工程



        預(yù)處理之所以重要,是因?yàn)樗鼤?huì)對后續(xù)的數(shù)據(jù)分析質(zhì)量、模型預(yù)測精度產(chǎn)生極大影響。我們在實(shí)際項(xiàng)目中拿到的數(shù)據(jù)往往是雜亂無章的(數(shù)據(jù)缺失、數(shù)據(jù)不一致、數(shù)據(jù)重復(fù)等),要想應(yīng)用恰當(dāng)?shù)姆治龇椒ǖ玫嚼硐虢Y(jié)果,就必須通過一些方法提高數(shù)據(jù)質(zhì)量,而這就是預(yù)處理的工作。


        然而,預(yù)處理如此重要,市面上相關(guān)圖書卻少之又少,原因在于預(yù)處理是一項(xiàng)難以總結(jié)的技術(shù),其知識(shí)不夠體系。這就導(dǎo)致我們只能得到一些碎片式的信息,無法系統(tǒng)了解。專業(yè)資料之匱乏,可能也是下面這本《數(shù)據(jù)預(yù)處理從入門到實(shí)戰(zhàn):基于SQL、R、Python》原版一上市就迅速進(jìn)入日亞計(jì)算機(jī)類圖書銷量排行榜No1,并在3個(gè)月內(nèi)重印4次的原因之一。



        一本書掌握大數(shù)據(jù)、人工智能時(shí)代需要的數(shù)據(jù)預(yù)處理技術(shù)

        KDD CUP 2015亞軍得主多行業(yè)實(shí)戰(zhàn)經(jīng)驗(yàn)總結(jié)

        [日]本橋智光 著

        陳濤 譯



        如果你對數(shù)據(jù)預(yù)處理感興趣,或者正在受其困擾,不妨讀一讀這本書。


        本書結(jié)構(gòu)


        (覆蓋各種類型的數(shù)據(jù)預(yù)處理任務(wù),系統(tǒng)而全面)


        本書特色


        54道例題,涵蓋常見數(shù)據(jù)預(yù)處理技術(shù)

        本書采用問題驅(qū)動(dòng)式結(jié)構(gòu),先拋出常見預(yù)處理任務(wù),引導(dǎo)讀者思考如何實(shí)現(xiàn)。像這樣帶著問題學(xué)習(xí),可以大大提高學(xué)習(xí)效果,讓理解更深入。

        (本書例題示例)





        3種語言實(shí)現(xiàn)對比,把握每種語言的特長

        分別用SQL、R、Python對比解決相同的案例問題,可以了解各語言在處理各種預(yù)處理問題時(shí)有哪些優(yōu)缺點(diǎn),從而根據(jù)情況選擇合適的語言,提升預(yù)處理效率。

        左右滑動(dòng)查看更多





        同時(shí)給出一般代碼與理想代碼,優(yōu)化處理的關(guān)鍵一目了然

        對于每道例題,都同時(shí)給出用SQL、R、Python3種語言縮寫的一般代碼與理想代碼,并對代碼中的關(guān)鍵點(diǎn)進(jìn)行說明。讀者不僅可以邊閱讀邊思考如何修改一般代碼,還可以通過與理想代碼的對比明白如何優(yōu)化代碼。


        SQL一般代碼VS?
        SQL理想代碼? ?
        R一般代碼VSR理想代碼
        Python一般代碼VSPython理想代碼







        通過3個(gè)綜合的實(shí)戰(zhàn)案例,帶領(lǐng)讀者體驗(yàn)真實(shí)的預(yù)處理過程

        (案例之一)


        (針對案例首先給出預(yù)處理步驟,再分步驟詳細(xì)講解






        讀者對象

        本書適合新手?jǐn)?shù)據(jù)科學(xué)家和對數(shù)據(jù)分析、數(shù)據(jù)挖掘感興趣的讀者閱讀。

        初學(xué)者可以先瀏覽目錄,選擇感興趣的章節(jié)仔細(xì)閱讀,以在自己的業(yè)務(wù)中靈活應(yīng)用;有一定經(jīng)驗(yàn)的讀者通過閱讀本書,可以查漏補(bǔ)缺,進(jìn)一步提高預(yù)處理效率。





        任何工作都有輝煌的瞬間,例如足球運(yùn)動(dòng)員進(jìn)球的瞬間,廚師大火收汁后菜肴出鍋的瞬間,專家顧問做報(bào)告的瞬間。而對于數(shù)據(jù)科學(xué)家,最輝煌的大概就是有了奇妙的發(fā)現(xiàn)或創(chuàng)建出高精度模型的那個(gè)瞬間。輝煌的瞬間是否會(huì)到來,與前一階段準(zhǔn)備工作的好壞密切相關(guān)。不同于那一刻輝煌的瞬間,準(zhǔn)備的過程往往平淡無奇且漫長,但成敗也正是在這一階段決定的。如果你的目標(biāo)是成為一流的數(shù)據(jù)科學(xué)家,那就跟隨本書,把平淡無奇的預(yù)處理做到極致吧!


        也可以加一下老胡的微信
        圍觀朋友圈~~~


        推薦閱讀

        (點(diǎn)擊標(biāo)題可跳轉(zhuǎn)閱讀)

        我愛線代,線代使我快樂

        麻省理工學(xué)院計(jì)算機(jī)課程【中文版】

        【清華大學(xué)王東老師】現(xiàn)代機(jī)器學(xué)習(xí)技術(shù)導(dǎo)論.pdf

        機(jī)器學(xué)習(xí)中令你事半功倍的pipeline處理機(jī)制

        機(jī)器學(xué)習(xí)避坑指南:訓(xùn)練集/測試集分布一致性檢查

        機(jī)器學(xué)習(xí)深度研究:特征選擇中幾個(gè)重要的統(tǒng)計(jì)學(xué)概念

        老鐵,三連支持一下,好嗎?↓↓↓


        瀏覽 25
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評論
        圖片
        表情
        推薦
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            spa高潮按摩少妇金手指 99精品啪在线观看国产老湿机 | 国产精品爽爽久久久久久鸭绿欲 | 自拍偷拍3p | 国产一级婬片A视频免费观看 | 麻豆成人91精品二区三区 | 宅男午夜视频 | 奇米影视7777狠狠狠狠视频 | 国产伦理久久精品久久久久 | 翔田千里无码二区三区 | 国产黄色录像 |