1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        《數(shù)據(jù)科學(xué)家100天精進(jìn)計(jì)劃》Day7:數(shù)據(jù)科學(xué)家常用R包

        共 2734字,需瀏覽 6分鐘

         ·

        2023-04-03 00:19

        數(shù)據(jù)科學(xué)家100天精進(jìn)計(jì)劃,分享我作為數(shù)據(jù)科學(xué)家的所學(xué)、所想和所做,希望幫助更多人了解數(shù)據(jù)科學(xué)家或者成為數(shù)據(jù)科學(xué)家。


        《數(shù)據(jù)科學(xué)家100天精進(jìn)計(jì)劃》Day1:數(shù)據(jù)科學(xué)家黃金圈法則
        《數(shù)據(jù)科學(xué)家100天精進(jìn)計(jì)劃》Day2:數(shù)據(jù)科學(xué)工作流 《數(shù)據(jù)科學(xué)家100天精進(jìn)計(jì)劃》Day3:數(shù)據(jù)科學(xué)家技能修煉 《數(shù)據(jù)科學(xué)家100天精進(jìn)計(jì)劃》Day4:我的數(shù)據(jù)科學(xué)高效工具分享 《數(shù)據(jù)科學(xué)家100天精進(jìn)計(jì)劃》Day5:數(shù)據(jù)科學(xué)家的SQL技術(shù)清單 《數(shù)據(jù)科學(xué)家100天精進(jìn)計(jì)劃》Day6:數(shù)據(jù)科學(xué)家R語(yǔ)言學(xué)習(xí)指南

        Day7:數(shù)據(jù)科學(xué)家常用R包

        R語(yǔ)言功能強(qiáng)大,R包功不可沒(méi)。

        有許多R包可供數(shù)據(jù)科學(xué)家在不同領(lǐng)域進(jìn)行數(shù)據(jù)處理、分析、可視化和建模。本文包括3個(gè)內(nèi)容。

        1)R包管理知識(shí)

        2)數(shù)據(jù)科學(xué)常用R包

        3)我學(xué)習(xí)和使用R包的心得

        1 R包管理知識(shí)

        R包管理知識(shí),我們需要掌握如何正確安裝和卸載R包。

        我使用過(guò)的R包安裝方法

        1)直接從CRAN上面安裝,選擇離自己最近的鏡像,使用install.packages()安裝R包。舉例說(shuō)明

              
              #?安裝數(shù)據(jù)科學(xué)套件包
        install.packages('tidyverse')

        2)從Github上面安裝,可以在線安裝或者下載源碼后,經(jīng)過(guò)編譯后,再安裝。舉例說(shuō)明

              
              install.packages("devtools")
        library(devtools)
        #?安裝github上的R包
        devtools::install_github('lchiffon/REmap')

        3)生物信息的一些R包,可以從Bioconductor包安裝,Bioconductor可以簡(jiǎn)單理解為基于R語(yǔ)言專(zhuān)門(mén)做生物信息學(xué)分析的眾多工具包的集合。舉例說(shuō)明

              
              #?安裝limma包
        if?(!requireNamespace("BiocManager",?quietly?=?TRUE))
        ???install.packages("BiocManager")
        BiocManager::install("limma")

        卸載R包,直接使用remove.packages()函數(shù)操作。

        2 數(shù)據(jù)科學(xué)家常用R包

        數(shù)據(jù)科學(xué)家們,經(jīng)常使用的R語(yǔ)言包,簡(jiǎn)單說(shuō)明如下,更詳細(xì)地介紹,可以查看對(duì)應(yīng)包的幫助文檔和使用范例。我的親身經(jīng)驗(yàn),要用好一個(gè)R包,一定要利用好幫助文檔和范例,還有基于這個(gè)R包的做項(xiàng)目的他人的代碼,這些都是很好的學(xué)習(xí)素材,值得你去閱讀和遷移。

        1) dplyr:這是一個(gè)功能強(qiáng)大的數(shù)據(jù)操作包,使數(shù)據(jù)清洗和操縱任務(wù)變得容易。dplyr提供了一系列函數(shù),用于進(jìn)行基本的數(shù)據(jù)操作,如篩選、聚合、排序、重命名變量等。這個(gè)包的一個(gè)顯著優(yōu)勢(shì)在于其符合直覺(jué)的語(yǔ)法。

        2)tidyr:tidyr是一個(gè)用于整理數(shù)據(jù)的包,目的是將數(shù)據(jù)整理為“長(zhǎng)格式”或“寬格式”。這有助于分組操作、存儲(chǔ)數(shù)據(jù)以及與ggplot2進(jìn)行集成。

        3) lubridate:lubridate是一個(gè)處理日期和時(shí)間數(shù)據(jù)的包,提供了一系列易于使用的函數(shù),用于解析、操作和格式化日期和時(shí)間數(shù)據(jù)。它簡(jiǎn)化了跨時(shí)間格式的工作,包括轉(zhuǎn)換為不同的時(shí)區(qū),處理閏年等。

        4) ggplot2:這是一個(gè)優(yōu)秀的數(shù)據(jù)可視化包,使用圖形語(yǔ)法(Grammar of Graphics)創(chuàng)建精美且信息豐富的圖表。ggplot2提供了一套靈活且統(tǒng)一的界面來(lái)構(gòu)建復(fù)雜的定制圖形。

        5) randomForest:這個(gè)包實(shí)現(xiàn)了隨機(jī)森林算法,用于分類(lèi)和回歸任務(wù)。隨機(jī)森林是一種強(qiáng)大的集成學(xué)習(xí)技術(shù),通過(guò)構(gòu)造多個(gè)決策樹(shù)來(lái)提高預(yù)測(cè)精度。

        6) xgboost:Extreme Gradient Boosting(xgboost)包提供了一個(gè)優(yōu)化梯度增強(qiáng)算法的實(shí)現(xiàn)。它在大量機(jī)器學(xué)習(xí)競(jìng)賽中取得了優(yōu)異成績(jī),被認(rèn)為是一種非常強(qiáng)大且實(shí)用的預(yù)測(cè)模型。

        7) caret:Classification And REgression Training(Caret)是一個(gè)流行的機(jī)器學(xué)習(xí)框架,用于構(gòu)建和評(píng)估各種預(yù)測(cè)模型。Caret包含大量常用的機(jī)器學(xué)習(xí)算法,并提供了一個(gè)簡(jiǎn)單的界面來(lái)進(jìn)行數(shù)據(jù)預(yù)處理、特征選擇、模型訓(xùn)練和評(píng)估等步驟。

        8)rmarkdown:rmarkdown包用于R Markdown文檔的編輯,R Markdown文檔(可以包含富文本和R代碼)方便寫(xiě)數(shù)據(jù)報(bào)告,支持生成多種格式,例如html、PDF等。

        9)shiny:shiny是一個(gè)構(gòu)建交互式web應(yīng)用程序的框架,用于實(shí)時(shí)發(fā)布、共享和探索數(shù)據(jù)??梢暬蚏代碼可以輕松地整合在一起,不需要任何web開(kāi)發(fā)經(jīng)驗(yàn)即可發(fā)布到Web上。

        3 我學(xué)習(xí)和使用R包的心得

        我在使用R語(yǔ)言做數(shù)據(jù)科學(xué)工作時(shí),離不開(kāi)R包。我簡(jiǎn)潔分享下自己學(xué)習(xí)和使用R包的心得。

        1)學(xué)習(xí)R包這塊

        第一步:明確問(wèn)題和目標(biāo),例如我要學(xué)習(xí)R語(yǔ)言做數(shù)據(jù)可視化分析,我會(huì)檢索R語(yǔ)言做可視化的包,確定所要學(xué)習(xí)的R包

        第二步:R包管理,對(duì)需要學(xué)習(xí)的R包進(jìn)行正確安裝,便于后續(xù)學(xué)習(xí)和使用。

        第三步:查看R包幫助文檔和范例。

              
              #?數(shù)據(jù)可視化包ggplot2
        help(package="ggplot2")

        結(jié)果如下

        36e8d580e5333692645e0cc53ed0b8a7.webp


        這份結(jié)果提供這些重要信息

        1)這個(gè)R包介紹和用途

        2)這個(gè)R包按著字幕排序的函數(shù)集和內(nèi)嵌數(shù)據(jù)集

        第四步:多閱讀這個(gè)R包使用的案例和代碼,我會(huì)基于我關(guān)注的問(wèn)題或者要學(xué)習(xí)的內(nèi)容從Github上面尋找代碼,并從代碼中學(xué)習(xí)。

        2)使用R包這塊,根據(jù)自己要解決的問(wèn)題,選擇合適的R包,然后就是安裝和加載R包,利用R包提供的函數(shù)集,解決自己的問(wèn)題或者做自己想做的事情。

        總之,作為一名數(shù)據(jù)科學(xué)家,學(xué)習(xí)和熟練上述R包,一來(lái)可以提升數(shù)據(jù)科學(xué)工作的水平,二來(lái)數(shù)據(jù)科學(xué)工作流各個(gè)環(huán)節(jié)都有了合理的解決方案。

        我的微信二維碼,歡迎你添加,大家多交流。

        瀏覽 91
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            午夜伦情电午夜伦情电影 | 美女嫩逼逼 | 男人添女人下面全程高潮黄黄 | 污污在线免费观看 | 91h片| 《美国式禁忌4 | 亚洲精品一二三四 | 四虎在线免费观看 | 国产精品羞羞无码久久久 | 免费簧片网站 |