1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        多模態(tài)深度學(xué)習(xí):用深度學(xué)習(xí)的方式融合各種信息

        共 1442字,需瀏覽 3分鐘

         ·

        2020-10-18 00:04

        點擊上方AI算法與圖像處理”,選擇加"星標(biāo)"或“置頂”

        重磅干貨,第一時間送達(dá)


        作者:Purvanshi Mehta

        來源:AI公園?

        編譯:ronghuaiyang

        導(dǎo)讀

        使用深度學(xué)習(xí)融合各種來源的信息。

        多模態(tài)數(shù)據(jù)

        我們對世界的體驗是多模態(tài)的 —— 我們看到物體,聽到聲音,感覺到質(zhì)地,聞到氣味,嘗到味道。模態(tài)是指某件事發(fā)生或經(jīng)歷的方式,當(dāng)一個研究問題包含多個模態(tài)時,它就具有多模態(tài)的特征。為了讓人工智能在理解我們周圍的世界方面取得進(jìn)展,它需要能夠同時解釋這些多模態(tài)的信號。

        例如,圖像通常與標(biāo)簽和文本解釋相關(guān)聯(lián),文本包含圖像,以更清楚地表達(dá)文章的中心思想。不同的模態(tài)具有非常不同的統(tǒng)計特性。

        多模態(tài)深度學(xué)習(xí)

        雖然結(jié)合不同的模態(tài)或信息類型來提高效果從直觀上看是一項很有吸引力的任務(wù),但在實踐中,如何結(jié)合不同的噪聲水平和模態(tài)之間的沖突是一個挑戰(zhàn)。此外,模型對預(yù)測結(jié)果有不同的定量影響。在實踐中最常見的方法是將不同輸入的高級嵌入連接起來,然后應(yīng)用softmax。

        多模態(tài)深度學(xué)習(xí)的例子,其中使用不同類型的神經(jīng)網(wǎng)絡(luò)提取特征

        這種方法的問題是,它將給予所有子網(wǎng)絡(luò)/模式同等的重要性,這在現(xiàn)實情況中是非常不可能的。

        所有的模態(tài)對預(yù)測都有相同的貢獻(xiàn)

        對網(wǎng)絡(luò)進(jìn)行加權(quán)組合

        我們采用子網(wǎng)絡(luò)的加權(quán)組合,以便每個輸入模態(tài)可以對輸出預(yù)測有一個學(xué)習(xí)貢獻(xiàn)(Theta)。

        我們的優(yōu)化問題變成-

        對每個子網(wǎng)絡(luò)給出Theta權(quán)值后的損失函數(shù)。

        將權(quán)值附加到子網(wǎng)后預(yù)測輸出。

        把所有的都用起來!

        準(zhǔn)確性和可解釋性

        我們在兩個現(xiàn)實多模態(tài)數(shù)據(jù)集上得到了SOTA:

        Multimodal Corpus of Sentiment Intensity(MOSI) 數(shù)據(jù)集 —— 有417個標(biāo)注過的視頻,每毫秒標(biāo)注的音頻特征。共有2199個標(biāo)注數(shù)據(jù)點,其中情緒強度定義為從strongly negative到strongly positive,線性尺度從- 3到+3。

        模態(tài)包括:

        1、文本

        2、音頻

        3、語言

        每種模態(tài)對情緒預(yù)測的貢獻(xiàn)量

        Transcription Start Site Prediction(TSS)數(shù)據(jù)集 —— Transcription是基因表達(dá)的第一步,在這一步中,特定的DNA片段被復(fù)制到RNA (mRNA)中。Transcription起始位點是transcription開始的位置。DNA片段的不同部分具有不同的特性,從而影響其存在。我們將TSS分為三個部分:

        1. 上游DNA
        2. 下游DNA
        3. TSS位置

        我們?nèi)〉昧饲八从械母纳疲戎暗淖钕冗M(jìn)的結(jié)果3%。使用TATA box的下游DNA區(qū)域?qū)@一過程影響最大。


        END

        英文原文:https://towardsdatascience.com/multimodal-deep-learning-ce7d1d994f4


        下載1:OpenCV黑魔法


        AI算法與圖像處理」公眾號后臺回復(fù):OpenCV黑魔法,即可下載小編精心編寫整理的計算機視覺趣味實戰(zhàn)教程



        下載2 CVPR2020

        AI算法與圖像處公眾號后臺回復(fù):CVPR2020,即可下載1467篇CVPR?2020論文
        個人微信(如果沒有備注不拉群!
        請注明:地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱


        覺得有趣就點亮在看吧



        瀏覽 63
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            欧美日韩一级二级三级 | 狠狠a| 国产成人片无码免费视频导航 | 狠狠插狠狠爱 | 日本熟女性爱视频 | 成人毛片18女人毛片免费不卡在线 | 美女被人c | 国产三级精品在线 | 欧美成人aa免费 | 综合操逼 |