1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        【NLP】Attention函數(shù)手冊!

        共 1252字,需瀏覽 3分鐘

         ·

        2021-04-23 17:27

        作者:一元,四品煉丹師

        前言

        目前的諸多機(jī)器學(xué)習(xí)相關(guān)的問題,諸如推薦問題中的序列處理,時(shí)間序列的預(yù)測,文本分類等問題都會(huì)涉及到Attention函數(shù)的使用,Attention已經(jīng)成為了這些問題在建模時(shí)的最為核心的模塊。

        而我們在實(shí)踐的過程中發(fā)現(xiàn),attention計(jì)算方式的不同對于不同的問題會(huì)有些許影響,有的時(shí)候影響還很大,所以在本文我們看看有哪些常用的attention函數(shù)。

        權(quán)重函數(shù)

        我們用Q,K,V分別表示Query,Key和Value。

        我們將權(quán)重函數(shù)分為兩個(gè)模塊函數(shù)以及函數(shù)。

        1.A(Q,K)計(jì)算方式


        1.Concat策略

        其中,表示連接的意思,該策略簡單,在一些博客中說此類策略在大數(shù)據(jù)問題中效果較好,該計(jì)算方式來源于論文《NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE》

        2.Minus

        3.Add

        4.Dot Product

        Dot Product的形式最為簡單,很多時(shí)候我們也經(jīng)常會(huì)使用該函數(shù)作為Baseline,但是它的問題也很明顯,雖然降低了模型計(jì)算復(fù)雜度,但是有時(shí)會(huì)因?yàn)橄喑说玫竭^大的值影響模型的效果。

        5.Bilinear Dot

        Bilinear Dot可以認(rèn)為是Dot Product的擴(kuò)展形式,有些情況下,Bilinear Dot的效果和Dot Product稍微好一些。

        6.Scaled-dot Product

        其中是特征的維度。

        7.Content-Based

        使用cosine距離替代了直接相乘,該計(jì)算方式來源于論文《Neural Turing Machines》。

        8.擴(kuò)展

        從上面的諸多計(jì)算中,我們發(fā)現(xiàn)就像是在計(jì)算之間的距離,所以很多基于距離的函數(shù)都是可以套過來嘗試一下的,下面是一些距離的列表,有興趣的朋友可以比較一下。

        2.f()計(jì)算

        目前最常使用的計(jì)算方式主要有下面兩種。

        1.softmax函數(shù)

        softmax函數(shù)是使用最多的函數(shù)也是最為常見的函數(shù),在實(shí)踐中往往也可以取得不錯(cuò)的效果。

        2.TopN softmax

        同樣地,也是先使用softmax函數(shù)進(jìn)行計(jì)算,然后取softmax最大的N個(gè)值進(jìn)行保留,將其它的值全部設(shè)置為0,該方法曾經(jīng)出現(xiàn)在一些推薦相關(guān)的問題建模中,可以取得非常不錯(cuò)的效果。

        參考文獻(xiàn)
        1. Attention基本公式及其變種
        2. Attention? Attention!
        3. [機(jī)器學(xué)習(xí)]常用距離定義與計(jì)算

        往期精彩回顧





        1. 適合初學(xué)者入門人工智能的路線及資料下載

        2. 機(jī)器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印

        3. 機(jī)器學(xué)習(xí)在線手冊

        4. 深度學(xué)習(xí)筆記專輯

        5. 《統(tǒng)計(jì)學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯

        6. AI基礎(chǔ)下載

        7. 機(jī)器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)專輯

        8. 溫州大學(xué)《機(jī)器學(xué)習(xí)課程》視頻

        本站qq群851320808,加入微信群請掃碼:

        瀏覽 56
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            巨乳喷奶水wwww免费看 | 日本黄色免费在线观看 | 日本亚洲精品中字幕日产2020 | 美女被内射 | 国产a级免费观看 | 国产区一区二区三 | 91人人干 | 日韩三级影片 | 看全色黄大色黄大片美女 | 国产精品一区在线 |