1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        【深度學(xué)習(xí)】發(fā)展的必然及未來的思考

        共 3400字,需瀏覽 7分鐘

         ·

        2021-08-05 14:56

        來源:知乎 本文經(jīng)過作者同意轉(zhuǎn)載

        https://zhuanlan.zhihu.com/p/375226190


        1 前言

        凱文凱利的《必然》相信很多朋友都有讀過,里面描述了很多科技發(fā)展的必然趨勢。那么這里,我們想僅對深度學(xué)習(xí)領(lǐng)域的發(fā)展進(jìn)行思考,看是不是里面也存在著必然。我們會先探討一些已知的必然,然后再聊聊一些未來的必然。

        下面的觀點(diǎn)僅代表個人看法,如有不足敬請批評指正

        2 深度學(xué)習(xí)是AI的必然

        在過去,人們對于符號主義還是連接主義是有爭論的,但現(xiàn)在深度學(xué)習(xí)取得成功讓連接主義取得了勝利。

        這里的必然在于人寫不出所有的規(guī)則和特征,所以用神經(jīng)網(wǎng)絡(luò)作為載體,通過數(shù)據(jù)去擬合。

        未來要實(shí)現(xiàn)AGI還需要很多新的技術(shù),但如OpenAI的首席科學(xué)家ilya sutskever 在一次訪談中說的,AGI一定會是以深度神經(jīng)網(wǎng)絡(luò)的形式產(chǎn)生。

        3 深度學(xué)習(xí)的特性讓大數(shù)據(jù),大網(wǎng)絡(luò),高算力的發(fā)展成為必然

        這一條在現(xiàn)在看來是毋庸置疑的。早在深度學(xué)習(xí)剛火起來的那幾年,吳恩達(dá)就已經(jīng)宣傳了這三點(diǎn)的重要性。

        但就算如此,恐怕大多數(shù)人仍然會對網(wǎng)絡(luò)模型的爆炸式增長產(chǎn)生的效果感到震驚,比如去年的GPT-3。

        而接下來的幾年,網(wǎng)絡(luò)模型的大小仍然會繼續(xù)加大,直到神經(jīng)網(wǎng)絡(luò)的連接數(shù)超過人腦神經(jīng)元的連接數(shù),至于會產(chǎn)生什么效果,我們拭目以待。

        為什么是這樣?

        因?yàn)樯疃葘W(xué)習(xí)本質(zhì)是基于統(tǒng)計(jì)學(xué),深度學(xué)習(xí)做的事情就是對所有的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),只是神經(jīng)網(wǎng)絡(luò)能夠?qū)Ω呔S數(shù)據(jù)進(jìn)行復(fù)雜的統(tǒng)計(jì),從而輸出最優(yōu)的概率統(tǒng)計(jì)結(jié)果。所以,數(shù)據(jù)越多越全面,效果就有可能越好。

        并且,神經(jīng)網(wǎng)絡(luò)還具備泛化能力,看到相似的場景也能輸出相似的概率,從而讓深度學(xué)習(xí)進(jìn)入實(shí)用化階段。

        那么,這個時候,如何產(chǎn)生巨量的數(shù)據(jù)進(jìn)行訓(xùn)練呢?

        監(jiān)督學(xué)習(xí)需要對數(shù)據(jù)進(jìn)行標(biāo)注,而標(biāo)注需要靠人工,這是需要成本的。這就意味著標(biāo)注的數(shù)據(jù)是無法爆炸式增長的,也因此,圖靈獎得主Yann Lecun在幾年前就提出:

        2 無監(jiān)督/自監(jiān)督學(xué)習(xí)的發(fā)展是必然

        這幾年學(xué)術(shù)界的發(fā)展完全印證了這一點(diǎn),為什么大模型率先在NLP上取得成功,因?yàn)镹LP使用的語言數(shù)據(jù)可以不需要標(biāo)注。

        不過Yann Lecun對強(qiáng)化學(xué)習(xí)的判斷并不完全對。在現(xiàn)實(shí)世界,要獲取有用的樣本很難,但是在虛擬環(huán)境,樣本是可以無盡獲取的,所以這幾年強(qiáng)化學(xué)習(xí)依然取得了巨大的進(jìn)步。無論是AlphaStar還是OpenAI Dota Five,都是在虛擬環(huán)境下每天訓(xùn)練幾百萬,幾千萬局。

        我們只能說強(qiáng)化學(xué)習(xí)的樣本利用低是對的(Sample Inefficiency)。

        雖然強(qiáng)化學(xué)習(xí)有這樣的問題,但依然無法阻止它成為下一個必然!

        3 決策系統(tǒng)必然要使用深度強(qiáng)化學(xué)習(xí)

        這一條和深度學(xué)習(xí)是AI的必然是一樣的道理。

        人是無法手工寫出所有的規(guī)則和特征的!

        以自動駕駛為例,目前的自動駕駛主要還是以人工規(guī)則為主,只是在視覺感知端使用了深度學(xué)習(xí)。但是由于人工規(guī)則的局限性,就算使用了幾萬個if語句,也仍然無法保證自動駕駛系統(tǒng)能夠處理所有的corner case。對于自動駕駛來說,如果這個系統(tǒng)無法達(dá)到99.9999999%的有效性,就無法真正意義上的脫離人工讓其完全自己托管。這可以很容易計(jì)算,就算自動駕駛1000公里需要人介入一次,那每1000公里可能就有造成一次事故,這就很可怕了。

        如何解決?只能最終將希望寄托在深度強(qiáng)化學(xué)習(xí)+模仿學(xué)習(xí)上,讓AI在虛擬環(huán)境中去試錯,去遍歷所有的可能,去跑個1億億公里來學(xué)習(xí)。

        自動駕駛只是機(jī)器人的一種形態(tài),其他機(jī)器人的應(yīng)用也類似,比如機(jī)械臂的抓取,需要99.99%的準(zhǔn)確率才有使用的價值,根本上還是要讓人工介入的次數(shù)足夠少,從而真正意義上不需要人工,降低成本。

        基于這樣的判斷,我們有了下面的必然:

        4 Sim2Real是通往完全自動駕駛及其他通用機(jī)器人的必然

        現(xiàn)實(shí)世界不可能提供足夠的數(shù)據(jù),所以我們只能通過在虛擬環(huán)境中訓(xùn)練,再遷移到現(xiàn)實(shí)環(huán)境。

        虛擬環(huán)境好處很多,比如可以加速,可以大規(guī)模并行,可以不擔(dān)心安全問題。

        但要實(shí)現(xiàn)Sim2Real,卻對虛擬環(huán)境的真實(shí)性提出了極高的要求。

        比如自動駕駛的訓(xùn)練,我們需要能夠構(gòu)建出和真實(shí)別無二致的場景,去覆蓋所有的場景!

        所以,這帶來了下一個必然!

        5 AI在虛擬世界的應(yīng)用要領(lǐng)先于現(xiàn)實(shí)世界

        這里的原因不僅僅是因?yàn)楝F(xiàn)實(shí)世界的應(yīng)用依賴于虛擬世界,同時也是深度學(xué)習(xí)本身的內(nèi)在缺陷。

        什么缺陷呢?

        深度學(xué)習(xí)受益于數(shù)據(jù),也依賴于數(shù)據(jù),導(dǎo)致它存在的問題是無法自己推導(dǎo)出規(guī)則,從而在完全的ood(Out of Distribution)上work!

        也就是如果測試的時候樣本從來沒見過,也不是之前的樣本能組合出來的,那么神經(jīng)網(wǎng)絡(luò)就會傻掉!

        這和人很不一樣,人形成了一套符號系統(tǒng),所以給出規(guī)則就懂得使用規(guī)則。目前的深度學(xué)習(xí)還無法自己基于樣本產(chǎn)生有效的符號系統(tǒng)來實(shí)現(xiàn)這種泛化。

        也就是說深度學(xué)習(xí)要成功,其實(shí)就只有走大數(shù)據(jù)這條路,并且是要盡可能的窮盡所有可能,才能讓效果達(dá)到很好,讓corner case出錯的概率降到足夠低。

        所以

        6 凡是對Corner Case要求很高的AI應(yīng)用,都很難落地

        簡單點(diǎn)說就是出點(diǎn)錯也沒事的AI好落地,否則很難落地

        自動駕駛,機(jī)器人這些現(xiàn)實(shí)應(yīng)用就是,出個錯影響很大。

        而NLP,虛擬世界中的游戲AI,特效這些則影響沒有那么大。

        這也就印證了第5條的必然。我們可以看到AI已經(jīng)廣泛的應(yīng)用到搜索,游戲,視頻特效等領(lǐng)域,并帶來了巨大的商業(yè)價值。

        以深度強(qiáng)化學(xué)習(xí)為例,在游戲AI中得到了真正意義上的落地,如果把所有使用了深度強(qiáng)化學(xué)習(xí)Agent的游戲算上,估計(jì)每天被調(diào)用上億次,這是難以想象的。

        同樣,GAN在視頻特效上得到了巨大的應(yīng)用,一個火的特效可以被觀看幾十億次。

        基于前面的幾點(diǎn),虛擬世界的發(fā)展非常重要,現(xiàn)實(shí)世界的AI應(yīng)用,特別是機(jī)器人上的應(yīng)用,極度依賴于虛擬世界,因此

        7 Metaverse將先于機(jī)器人革命出現(xiàn)

        下面兩圖概括了Metaverse和機(jī)器人所需的AI技術(shù):


        幾乎是共通的,相信很多朋友會有不同意見,上圖完全建立在Sim2Real的必然上!

        這樣的技術(shù)路線和西部世界里的做法是一模一樣的。西部世界真是一部前瞻性極強(qiáng)的硬核科幻。

        這里多聊幾句Metaverse!

        Metaverse是永恒的虛擬世界,除了逼真的虛擬環(huán)境給予其外在,大量智能的虛擬人/機(jī)器人才是其內(nèi)核。這和目前游戲里的NPC一個道理。在3A游戲如GTA V中,NPC是一個必不可少的角色,在虛擬世界中充斥著大量的NPC來形成整個虛擬世界觀與故事線。一個僅有人類的虛擬世界無法構(gòu)造真正的Metaverse!

        (當(dāng)然,當(dāng)前每個人對Metaverse的看法都不盡相同,這里僅一家之言)

        鑒于Metaverse和機(jī)器人都對AI有著全方位的需求,我們可以得到下一個必然:

        8 AGI將在Metaverse的發(fā)展中誕生,然后作用于現(xiàn)實(shí)世界

        這里的AGI我們定義為具備完全擬人的語言,姿態(tài),動作,行為,能夠通過圖靈測試。我們依然可以以西部世界里的機(jī)器人作為AGI的代表。

        在發(fā)展Metaverse的NPC的時候,我們需要一步一步的改進(jìn)里面的Vision,Language,Motion,Mind,這都是AGI的核心組件,有些組件也可以直接作用于現(xiàn)實(shí)世界比如Language,有些則需要更多的發(fā)展來實(shí)現(xiàn)sim2real。

        9 小結(jié)

        有了上面的分析,我們會越來越明白機(jī)器人革命道阻且長,需要很多組件的逐步完成。雖然目前我們也已經(jīng)看到了很多機(jī)器人基于cv的應(yīng)用,但離完成更復(fù)雜任務(wù)還很遠(yuǎn)。

        但這也許不是什么壞事。

        Metaverse才是下一個世代的主題,擁抱它并發(fā)展它。也許這里面對的社會問題比機(jī)器人革命到來面對的問題更大,但似乎技術(shù)是無法阻擋的,人類在不斷的將自己推進(jìn)深淵或者通往下一個前所未有的光明!



        推薦閱讀

        (點(diǎn)擊標(biāo)題可跳轉(zhuǎn)閱讀)

        神經(jīng)網(wǎng)絡(luò)入門

        統(tǒng) 計(jì) 學(xué) 無 用 了 ???

        現(xiàn)代統(tǒng)計(jì)的思想飛躍:過去、現(xiàn)在到未來(伯克利丁鵬博士萬字長文)

        神經(jīng)網(wǎng)絡(luò)的可解釋性綜述!

        測評:《機(jī)器學(xué)習(xí)中的數(shù)學(xué)》

        統(tǒng)治世界的 10 大算法,你知道幾個?

        清華大學(xué)出版!《機(jī)器學(xué)習(xí)導(dǎo)論》PDF下載

        老鐵,三連支持一下,好嗎?↓↓↓


        瀏覽 46
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評論
        圖片
        表情
        推薦
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            欧美a片在线看 | 俺来俺也去www色在线观看 | 国产精品久久免费视频 | 超碰在线一区 | 亚洲欧美午夜精品 | 久久精品国产大片免费观看 | 人人舔人人 | 亚洲AV日韩AV无码裸体尤物 | 中文字幕伦理片 | 毛片学生妹 |