圖數(shù)據(jù)的自監(jiān)督學(xué)習(xí)介紹

來源:DeepHub IMBA 本文約2100字,建議閱讀8分鐘
圖自我監(jiān)督學(xué)習(xí)是一個(gè)有趣的話題,因?yàn)榇蠖鄶?shù)數(shù)據(jù)都是圖結(jié)構(gòu)的,并且通常沒有標(biāo)簽。
深度學(xué)習(xí)在解決許多復(fù)雜的機(jī)器學(xué)習(xí)問題方面一直是一個(gè)有趣的課題,特別是最近在圖數(shù)據(jù)方面。然而,大多數(shù)的解決方案要么是監(jiān)督或半監(jiān)督,高度依賴于數(shù)據(jù)中的標(biāo)簽,導(dǎo)致過擬合和整體魯棒性較弱。自監(jiān)督學(xué)習(xí)(Self-Supervised Learning, SSL)是一種很有前途的解決方案,它從無標(biāo)記數(shù)據(jù)中挖掘有用的信息,使其成為圖數(shù)據(jù)領(lǐng)域中一個(gè)非常有趣的選擇。
圖形數(shù)據(jù)和定義
Node-level 節(jié)點(diǎn)級任務(wù)是與圖形中的節(jié)點(diǎn)相關(guān)的不同任務(wù),例如,節(jié)點(diǎn)分類,其中在少量標(biāo)記節(jié)點(diǎn)上訓(xùn)練的模型會(huì)預(yù)測其余節(jié)點(diǎn)的標(biāo)簽。 Link-level 鏈接級任務(wù)專注于節(jié)點(diǎn)的邊緣和表示形式,例如,鏈接預(yù)測,其目標(biāo)是識別邊緣之間的任何連接。 Graph-leve 圖級任務(wù)以圖形表示為目標(biāo),它們從多個(gè)圖中學(xué)習(xí)并預(yù)測單個(gè)圖的屬性。

預(yù)訓(xùn)練和微調(diào)是第一種訓(xùn)練方案,其中在編碼器中預(yù)先進(jìn)行預(yù)置任務(wù),然后在特定下游任務(wù)中進(jìn)行微調(diào)。 聯(lián)合學(xué)習(xí)是一種將編碼器與前置任務(wù)和下游任務(wù)一起進(jìn)行預(yù)訓(xùn)練的方案。 無監(jiān)督表示學(xué)習(xí),其中先使用前置任務(wù)對編碼器進(jìn)行預(yù)訓(xùn)練,然后在使用下游任務(wù)訓(xùn)練模型時(shí)凍結(jié)編碼器的參數(shù)。在此訓(xùn)練方案中,在編碼器訓(xùn)練期間沒有監(jiān)督。
圖自監(jiān)督學(xué)習(xí)的類型

蒙版特征回歸(MFR)。
屏蔽節(jié)點(diǎn)特征回歸圖補(bǔ)全—通過啟用GNN從上下文中提取特征; AttributeMask —它的目標(biāo)是重建經(jīng)過PCA處理的密集特征矩陣; AttrMasking —通過用特殊的掩碼替換邊和節(jié)點(diǎn)的屬性,強(qiáng)制GNN同時(shí)重建它們; 重構(gòu)技術(shù)-從干凈或損壞的輸入中重構(gòu)特征或嵌入,并使用它們以聯(lián)合學(xué)習(xí)的方式訓(xùn)練編碼器。
基于回歸的方法(R-APP)——在這種方法中,學(xué)習(xí)了圖的局部屬性,例如,關(guān)于圖的整體結(jié)構(gòu)的代表性節(jié)點(diǎn)屬性。然后,利用這些信息可以根據(jù)圖中預(yù)定義的簇預(yù)測未標(biāo)記節(jié)點(diǎn)的屬性; 基于分類的方法(C-APP)——與R-APP相比,這種方法依賴于構(gòu)建偽標(biāo)簽。在訓(xùn)練過程中分配偽標(biāo)簽并使用這些自我監(jiān)督標(biāo)簽(屬性)、基于固有拓?fù)?基于結(jié)構(gòu))對節(jié)點(diǎn)進(jìn)行分組、圖屬性預(yù)測(節(jié)點(diǎn)的統(tǒng)計(jì)屬性和節(jié)點(diǎn)的中心性)是基于分類方法(C-APP)的一些例子。
基于上下文的方法(C-SSC)-此方法的主要思想是在嵌入空間中拉近上下文節(jié)點(diǎn)。假設(shè)上下文相似的節(jié)點(diǎn)更可能在圖中互連: 基于增強(qiáng)的方法(A-SSC)-通過這種方法從原始數(shù)據(jù)樣本生成增強(qiáng)的數(shù)據(jù)樣本,并將來自同一來源的樣本視為正對,而來自不同來源的樣本視為負(fù)對。
例如,GPT-GNN將MFR和C-SSC組合成一個(gè)圖生成任務(wù)以預(yù)訓(xùn)練圖神經(jīng)網(wǎng)絡(luò); 使用節(jié)點(diǎn)特征重構(gòu)(MFR)和圖結(jié)構(gòu)恢復(fù)(C-SSC)來預(yù)訓(xùn)練圖變換器模型的Graph-Bert。

挑戰(zhàn)
結(jié)論
編輯:黃繼彥
校對:林亦霖
評論
圖片
表情
