国产秋霞理论久久久电影-婷婷色九月综合激情丁香-欧美在线观看乱妇视频-精品国avA久久久久久久-国产乱码精品一区二区三区亚洲人-欧美熟妇一区二区三区蜜桃视频

文檔智能理解:通用文檔預(yù)訓(xùn)練模型與數(shù)據(jù)集

共 10673字,需瀏覽 22分鐘

 ·

2020-11-27 19:39











向AI轉(zhuǎn)型的程序員都關(guān)注了這個(gè)號(hào)???

機(jī)器學(xué)習(xí)AI算法工程?? 公眾號(hào):datayx


預(yù)訓(xùn)練模型到底是什么,它是如何被應(yīng)用在產(chǎn)品里,未來(lái)又有哪些機(jī)會(huì)和挑戰(zhàn)?


預(yù)訓(xùn)練模型把遷移學(xué)習(xí)很好地用起來(lái)了,讓我們感到眼前一亮。這和小孩子讀書一樣,一開始語(yǔ)文、數(shù)學(xué)、化學(xué)都學(xué),讀書、網(wǎng)上游戲等,在腦子里積攢了很多。當(dāng)他學(xué)習(xí)計(jì)算機(jī)時(shí),實(shí)際上把他以前學(xué)到的所有知識(shí)都帶進(jìn)去了。如果他以前沒(méi)上過(guò)中學(xué),沒(méi)上過(guò)小學(xué),突然學(xué)計(jì)算機(jī)就不懂這里有什么道理。這和我們預(yù)訓(xùn)練模型一樣,預(yù)訓(xùn)練模型就意味著把人類的語(yǔ)言知識(shí),先學(xué)了一個(gè)東西,然后再代入到某個(gè)具體任務(wù),就順手了,就是這么一個(gè)簡(jiǎn)單的道理。


為什么要做預(yù)訓(xùn)練模型

自然語(yǔ)言處理(NLP),目的是使得計(jì)算機(jī)具備人類的聽、說(shuō)、讀、寫、譯、問(wèn)、答、搜索、摘要、對(duì)話和聊天等能力,并可利用知識(shí)和常識(shí)進(jìn)行推理和決策,并支持客服、診斷、法律、教學(xué)等場(chǎng)景。自然語(yǔ)言理解,被認(rèn)為是 AI 皇冠上的明珠。一旦有突破,則會(huì)大幅度推動(dòng) AI 在很多重要場(chǎng)景落地。

過(guò)去這五年,對(duì)自然語(yǔ)言是一個(gè)難忘的五年,它的一個(gè)標(biāo)志就是神經(jīng)網(wǎng)絡(luò)全面引入到了自然語(yǔ)言理解。從大規(guī)模的語(yǔ)言數(shù)據(jù)到強(qiáng)有力的算力,加上深度學(xué)習(xí),把整個(gè)自然語(yǔ)言帶到一個(gè)新的階段。


預(yù)訓(xùn)練模型,則是使自然語(yǔ)言處理由原來(lái)的手工調(diào)參、依靠 ML 專家的階段,進(jìn)入到可以大規(guī)模、可復(fù)制的大工業(yè)施展的階段。而且預(yù)訓(xùn)練模型從單語(yǔ)言、擴(kuò)展到多語(yǔ)言、多模態(tài)任務(wù)。一路銳氣正盛,所向披靡。


預(yù)訓(xùn)練通過(guò)自監(jiān)督學(xué)習(xí)從大規(guī)模數(shù)據(jù)中獲得與具體任務(wù)無(wú)關(guān)的預(yù)訓(xùn)練模型。體現(xiàn)某一個(gè)詞在一個(gè)特定上下文中的語(yǔ)義表征。第二個(gè)步驟是微調(diào),針對(duì)具體的任務(wù)修正網(wǎng)絡(luò)。訓(xùn)練數(shù)據(jù)可以是文本、文本-圖像對(duì)、文本-視頻對(duì)。預(yù)訓(xùn)練模型的訓(xùn)練方法可使用自監(jiān)督學(xué)習(xí)技術(shù)(如自回歸的語(yǔ)言模型和自編碼技術(shù))??捎?xùn)練單語(yǔ)言、多語(yǔ)言和多模態(tài)的模型。此類模型可經(jīng)過(guò)微調(diào)之后,用于支持分類、序列標(biāo)記、結(jié)構(gòu)預(yù)測(cè)和序列生成等各項(xiàng)技術(shù),并構(gòu)建文摘、機(jī)器翻譯、圖片檢索、視頻注釋等應(yīng)用。


為什么我們要做預(yù)訓(xùn)練模型?首先,預(yù)訓(xùn)練模型是一種遷移學(xué)習(xí)的應(yīng)用,利用幾乎無(wú)限的文本,學(xué)習(xí)輸入句子的每一個(gè)成員的上下文相關(guān)的表示,它隱式地學(xué)習(xí)到了通用的語(yǔ)法語(yǔ)義知識(shí)。第二,它可以將從開放領(lǐng)域?qū)W到的知識(shí)遷移到下游任務(wù),以改善低資源任務(wù),對(duì)低資源語(yǔ)言處理也非常有利。第三,預(yù)訓(xùn)練模型在幾乎所有 NLP 任務(wù)中都取得了目前最佳的成果。最后,這個(gè)預(yù)訓(xùn)練模型+微調(diào)機(jī)制具備很好的可擴(kuò)展性,在支持一個(gè)新任務(wù)時(shí),只需要利用該任務(wù)的標(biāo)注數(shù)據(jù)進(jìn)行微調(diào)即可,一般工程師就可以實(shí)現(xiàn)。


預(yù)訓(xùn)練模型的三個(gè)關(guān)鍵技術(shù)




首先,第一個(gè)關(guān)鍵技術(shù)是 Transformer。它在 NLP 各個(gè)任務(wù)中都取得了優(yōu)異的性能,它是預(yù)訓(xùn)練語(yǔ)言模型的核心網(wǎng)絡(luò)。給定一句話或是一個(gè)段落作為輸入,首先將輸入序列中各個(gè)詞轉(zhuǎn)換為其對(duì)應(yīng)的詞向量,同時(shí)加上每一個(gè)詞的位置向量,體現(xiàn)詞在序列的位置。然后將這些詞向量輸入到多層 Transformer 網(wǎng)絡(luò)中,通過(guò)自注意力(self-attention)機(jī)制來(lái)學(xué)習(xí)詞與詞之間的關(guān)系,編碼其上下文信息,再通過(guò)一個(gè)前饋網(wǎng)絡(luò)經(jīng)過(guò)非線性變化,輸出綜合了上下文特征的各個(gè)詞的向量表示。每一層 Transformer 網(wǎng)絡(luò)主要由 Multi-head self-attention 層(多頭自注意力機(jī)制)和前饋網(wǎng)絡(luò)層兩個(gè)子層構(gòu)成。Multi-head self-attention 會(huì)并行地執(zhí)行多個(gè)不同參數(shù)的 self-attention,并將各個(gè) self-attention 的結(jié)果拼接作為后續(xù)網(wǎng)絡(luò)的輸入,self-attention 機(jī)制會(huì)在后面中做詳細(xì)介紹。此后,我們得到了蘊(yùn)含當(dāng)前上下文信息的各個(gè)詞的表示,然后網(wǎng)絡(luò)會(huì)將其輸入到前饋網(wǎng)絡(luò)層以計(jì)算非線性層次的特征。


在每一層 Transformer 網(wǎng)絡(luò)中,會(huì)將殘差連接(residual connection)把自注意力機(jī)制前或者前饋神經(jīng)網(wǎng)絡(luò)之前的向量引入進(jìn)來(lái),以增強(qiáng)自注意力機(jī)制或者前饋網(wǎng)絡(luò)的輸出結(jié)果向量。并且還做一個(gè) layer normalization,也就是通過(guò)歸一化把同層的各個(gè)節(jié)點(diǎn)的多維向量映射到一個(gè)區(qū)間里面,這樣各層節(jié)點(diǎn)的向量在一個(gè)區(qū)間里面。這兩個(gè)操作加入在每個(gè)子層后,可更加平滑地訓(xùn)練深層次網(wǎng)絡(luò)。


Transformer 可以用于編碼,也可以用于解碼。所謂解碼就是根據(jù)一個(gè)句子的輸入得到一個(gè)預(yù)想的結(jié)果,比如機(jī)器翻譯(輸入源語(yǔ)言句子,輸出目標(biāo)語(yǔ)言句子),或者閱讀理解(輸入文檔和問(wèn)題,輸出答案)。解碼時(shí),已經(jīng)解碼出來(lái)的詞要做一個(gè)自注意力機(jī)制,之后和編碼得到的隱狀態(tài)的序列再做一個(gè)注意力機(jī)制。這樣可以做 N 層,然后通過(guò)一個(gè)線性層映射到詞表的大小的一個(gè)向量。每個(gè)向量代表一個(gè)詞表詞的輸出可能性,經(jīng)過(guò)一個(gè)softmax 層得到每個(gè)詞的輸出概率。


接下來(lái)介紹一下 self-attention 機(jī)制,以一個(gè) head 作為示例。假定當(dāng)前輸入包含三個(gè)詞,給定其輸入詞向量或是其上一層 Transformer 網(wǎng)絡(luò)的輸出,將其通過(guò)三組線性變換,轉(zhuǎn)換得到三組 queries、keys 和 values 向量。Query 和 key 向量用來(lái)計(jì)算兩兩詞之間的得分,也就是其依賴關(guān)系,這個(gè)得分會(huì)同其對(duì)應(yīng)的 value 向量做加權(quán)和,以得到每個(gè)詞綜合上下文信息的表示。給定當(dāng)前第一個(gè)詞的 query 向量,其首先同各個(gè)詞的 key 向量通過(guò)點(diǎn)積操作得到這兩個(gè)詞的得分,這些得分用來(lái)表示這兩個(gè)詞的依賴或是相關(guān)程度。這些得分之后會(huì)根據(jù) query 等向量的維度做一定比例的縮放,并將這些得分通過(guò) softmax 操作做歸一化。之后,各個(gè)得分會(huì)同其相對(duì)應(yīng)的 value 向量相乘得到針對(duì)第一個(gè)詞加權(quán)的各個(gè) value 向量,這些加權(quán)的 value 向量最終相加以得到當(dāng)前第一個(gè)詞的上下文表示。


在得到第一個(gè)詞的上下文表示后,給定第二個(gè)詞的 query 向量,我們會(huì)重復(fù)之前的操作,計(jì)算當(dāng)前 query 向量同各個(gè)詞 key 向量的得分,對(duì)這些得分做 softmax 歸一化處理,并將這些得分同其對(duì)應(yīng)的 value 向量做加權(quán)和,以得到其編碼上下文信息的表示。


第二個(gè)關(guān)鍵技術(shù)是自監(jiān)督學(xué)習(xí)。在預(yù)訓(xùn)練的模型中,AR(自回歸)LM 和 AE(自動(dòng)編碼器)是最常用的自監(jiān)督學(xué)習(xí)方法,其中,自回歸 LM 旨在利用前面的詞序列預(yù)測(cè)下個(gè)詞的出現(xiàn)概率(語(yǔ)言模型)。自動(dòng)編碼器旨在對(duì)損壞的輸入句子,比如遮掩了句子某個(gè)詞、或者打亂了詞序等,重建原始數(shù)據(jù)。通過(guò)這些自監(jiān)督學(xué)習(xí)手段來(lái)學(xué)習(xí)單詞的上下文相關(guān)表示。


第三個(gè)關(guān)鍵技術(shù)就是微調(diào)。在做具體任務(wù)時(shí),微調(diào)旨在利用其標(biāo)注樣本對(duì)預(yù)訓(xùn)練網(wǎng)絡(luò)的參數(shù)進(jìn)行調(diào)整。以我們使用基于 BERT(一種流行的預(yù)訓(xùn)練模型)為例來(lái)判斷兩個(gè)句子是否語(yǔ)義相同。輸入是兩個(gè)句子,經(jīng)過(guò) BERT 得到每個(gè)句子的對(duì)應(yīng)編碼表示,我們可以簡(jiǎn)單地用預(yù)訓(xùn)練模型的第一個(gè)隱節(jié)點(diǎn)預(yù)測(cè)分類標(biāo)記判斷兩個(gè)句子是同義句子的概率,同時(shí)需要額外加一個(gè)線性層和 softmax 計(jì)算得到分類標(biāo)簽的分布。預(yù)測(cè)損失可以反傳給 BERT 再對(duì)網(wǎng)絡(luò)進(jìn)行微調(diào)。當(dāng)然也可以針對(duì)具體任務(wù)設(shè)計(jì)一個(gè)新網(wǎng)絡(luò),把預(yù)訓(xùn)練的結(jié)果作為其輸入。


總體來(lái)講,預(yù)訓(xùn)練模型發(fā)展趨勢(shì):第一,模型越來(lái)越大。比如 Transformer 的層數(shù)變化,從12層的 Base 模型到24層的 Large 模型。導(dǎo)致模型的參數(shù)越來(lái)越大,比如 GPT 110 M,到 GPT-2 是1.5 Billion,圖靈是 17 Billion,而 GPT-3 達(dá)到了驚人的 175 Billion。一般而言模型大了,其能力也會(huì)越來(lái)越強(qiáng),但是訓(xùn)練代價(jià)確實(shí)非常大。第二,預(yù)訓(xùn)練方法也在不斷增加,從自回歸 LM,到自動(dòng)編碼的各種方法,以及各種多任務(wù)訓(xùn)練等。第三,還有從語(yǔ)言、多語(yǔ)言到多模態(tài)不斷演進(jìn)。最后就是模型壓縮,使之能在實(shí)際應(yīng)用中經(jīng)濟(jì)的使用,比如在手機(jī)端。這就涉及到知識(shí)蒸餾和 teacher-student models,把大模型作為 teacher,讓一個(gè)小模型作為 student 來(lái)學(xué)習(xí),接近大模型的能力,但是模型的參數(shù)減少很多。


預(yù)訓(xùn)練模型發(fā)展趨勢(shì)

第一,模型越來(lái)越大。比如 Transformer 的層數(shù)變化,從12層的 Base 模型到24層的 Large 模型。導(dǎo)致模型的參數(shù)越來(lái)越大,比如 GPT 110 M,到 GPT-2 是1.5 Billion,圖靈是 17 Billion,而 GPT-3 達(dá)到了驚人的 175 Billion。一般而言模型大了,其能力也會(huì)越來(lái)越強(qiáng),但是訓(xùn)練代價(jià)確實(shí)非常大。

第二,預(yù)訓(xùn)練方法也在不斷增加,從自回歸 LM,到自動(dòng)編碼的各種方法,以及各種多任務(wù)訓(xùn)練等。

第三,還有從語(yǔ)言、多語(yǔ)言到多模態(tài)不斷演進(jìn)。最后就是模型壓縮,使之能在實(shí)際應(yīng)用中經(jīng)濟(jì)的使用,比如在手機(jī)端。這就涉及到知識(shí)蒸餾和 teacher-student models,把大模型作為 teacher,讓一個(gè)小模型作為 student 來(lái)學(xué)習(xí),接近大模型的能力,但是模型的參數(shù)減少很多。


隨著許多行業(yè)的數(shù)字化轉(zhuǎn)型,電子商業(yè)文檔的結(jié)構(gòu)化分析和內(nèi)容提取成為一項(xiàng)熱門的研究課題。電子商業(yè)文檔通常包括兩大類:一類是紙質(zhì)文檔的掃描圖像件,另一類是計(jì)算機(jī)生成的數(shù)字文檔,這些文檔涵蓋采購(gòu)單據(jù)、行業(yè)報(bào)告、商務(wù)郵件、銷售合同、雇傭協(xié)議、商業(yè)發(fā)票、個(gè)人簡(jiǎn)歷等。


一般來(lái)說(shuō),電子商業(yè)文檔包含了公司對(duì)于內(nèi)部和外部事物的處理細(xì)節(jié),具有大量與行業(yè)相關(guān)的實(shí)體信息和數(shù)字信息。在過(guò)去,電子商業(yè)文檔的信息處理一般由人工來(lái)完成,然而,人工信息提取不僅耗時(shí)費(fèi)力,可復(fù)用性也不高,大大限制和阻礙了企業(yè)運(yùn)行效率。因此,電子文檔的自動(dòng)精準(zhǔn)快速處理對(duì)于企業(yè)生產(chǎn)力提升至關(guān)重要,這也促使了一些新興行業(yè)的出現(xiàn),幫助傳統(tǒng)行業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型,提高生產(chǎn)力。


近年來(lái),機(jī)器人流程自動(dòng)化(Robotic Process Automation, RPA)應(yīng)運(yùn)而生,正是利用人工智能技術(shù)幫助大量人力從繁雜的電子文檔處理任務(wù)中解脫出來(lái),提供了一系列配套的自動(dòng)化工具提升企業(yè)生產(chǎn)力。其中,最為關(guān)鍵的核心技術(shù)就是自動(dòng)文檔分析與識(shí)別技術(shù)。


傳統(tǒng)的文檔分析和識(shí)別技術(shù)往往基于人工定制的規(guī)則或少量標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí),這些方法雖然能夠帶來(lái)一定程度的性能提升,但由于定制規(guī)則和可學(xué)習(xí)的樣本數(shù)量不足,其通用性往往不盡如人意,針對(duì)不同類別文檔的分析遷移成本較高。


隨著深度學(xué)習(xí)預(yù)訓(xùn)練技術(shù)的發(fā)展,以及大量無(wú)標(biāo)注電子文檔的積累,文檔分析與識(shí)別技術(shù)進(jìn)入了一個(gè)全新的時(shí)代。大量的研究成果表明,大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型能夠通過(guò)自監(jiān)督任務(wù)在預(yù)訓(xùn)練階段有效捕捉文本中蘊(yùn)含的語(yǔ)義信息,經(jīng)過(guò)下游任務(wù)微調(diào)后能有效地提升模型效果。然而,現(xiàn)有的預(yù)訓(xùn)練語(yǔ)言模型主要針對(duì)文本單一模態(tài)進(jìn)行,而忽視了文檔本身與文本天然對(duì)齊的視覺結(jié)構(gòu)信息。

為了解決這一問(wèn)題,我們提出了一種通用文檔預(yù)訓(xùn)練模型 LayoutLM,對(duì)文檔結(jié)構(gòu)信息(Document Layout Information)和視覺信息(Visual Information)進(jìn)行建模,讓模型在預(yù)訓(xùn)練階段進(jìn)行多模態(tài)對(duì)齊。我們?cè)谌齻€(gè)不同類型的下游任務(wù)中進(jìn)行驗(yàn)證:表單理解(Form Understanding),票據(jù)理解(Receipt Understanding),以及文檔圖像分類(Document Image Classification)。


文檔智能相關(guān)的基準(zhǔn)數(shù)據(jù)集



大量的研究成果表明,大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型通過(guò)自監(jiān)督任務(wù),可在預(yù)訓(xùn)練階段有效捕捉文本中蘊(yùn)含的語(yǔ)義信息,經(jīng)過(guò)下游任務(wù)微調(diào)后能有效的提升模型效果。然而,現(xiàn)有的預(yù)訓(xùn)練語(yǔ)言模型主要針對(duì)文本單一模態(tài)進(jìn)行,忽視了文檔本身與文本天然對(duì)齊的視覺結(jié)構(gòu)信息。為了解決這一問(wèn)題,研究員們提出了一種通用文檔預(yù)訓(xùn)練模型LayoutLM[1][2],選擇了文檔結(jié)構(gòu)信息(Document Layout Information)和視覺信息(Visual Information)進(jìn)行建模,讓模型在預(yù)訓(xùn)練階段進(jìn)行多模態(tài)對(duì)齊。


在實(shí)際使用的過(guò)程中,LayoutLM 僅需要極少的標(biāo)注數(shù)據(jù)即可達(dá)到行業(yè)領(lǐng)先的水平。研究員們?cè)谌齻€(gè)不同類型的下游任務(wù)中進(jìn)行了驗(yàn)證:表單理解(Form Understanding)、票據(jù)理解(Receipt Understanding),以及文檔圖像分類(Document Image Classification)。實(shí)驗(yàn)結(jié)果表明,在預(yù)訓(xùn)練中引入的結(jié)構(gòu)和視覺信息,能夠有效地遷移到下游任務(wù)中,最終在三個(gè)下游任務(wù)中都取得了顯著的準(zhǔn)確率提升。


文檔結(jié)構(gòu)和視覺信息不可忽視


很多情況下,文檔中文字的位置關(guān)系蘊(yùn)含著豐富的語(yǔ)義信息。以下圖的表單為例,表單通常是以鍵值對(duì)(key-value pair)的形式展示的(例如 “DATE: 11/28/84”)。一般情況下,鍵值對(duì)的排布是以左右或者上下的形式,并且有特殊的類型關(guān)系。類似地,在表格文檔中,表格中的文字通常是網(wǎng)格狀排列,并且表頭一般出現(xiàn)在第一列或第一行。通過(guò)預(yù)訓(xùn)練,這些與文本天然對(duì)齊的位置信息可以為下游的信息抽取任務(wù)提供更豐富的語(yǔ)義信息。


表單示例


對(duì)于富文本文檔,除了文字本身的位置關(guān)系之外,文字格式所呈現(xiàn)的視覺信息同樣可以幫助下游任務(wù)。對(duì)文本級(jí)(token-level)任務(wù)來(lái)說(shuō),文字大小、是否傾斜、是否加粗,以及字體等富文本格式都能夠體現(xiàn)相應(yīng)的語(yǔ)義。例如,表單鍵值對(duì)的鍵位(key)通常會(huì)以加粗的形式給出;而在一般文檔中,文章的標(biāo)題通常會(huì)放大加粗呈現(xiàn),特殊概念名詞會(huì)以斜體呈現(xiàn),等等。對(duì)文檔級(jí)(document-level)任務(wù)來(lái)說(shuō),整體的文檔圖像能提供全局的結(jié)構(gòu)信息。例如個(gè)人簡(jiǎn)歷的整體文檔結(jié)構(gòu)與科學(xué)文獻(xiàn)的文檔結(jié)構(gòu)是有明顯的視覺差異的。這些模態(tài)對(duì)齊的富文本格式所展現(xiàn)的視覺特征,可以通過(guò)視覺模型抽取,再結(jié)合到預(yù)訓(xùn)練階段,從而有效地幫助下游任務(wù)。


將視覺信息與文檔結(jié)構(gòu)融入到通用預(yù)訓(xùn)練方案


建模上述信息需要尋找這些信息的有效表示方式。然而現(xiàn)實(shí)中的文檔格式豐富多樣,除了格式明確的電子文檔外,還有大量掃描式報(bào)表和票據(jù)等圖片式文檔。對(duì)于計(jì)算機(jī)生成的電子文檔,可以使用對(duì)應(yīng)的工具獲取文本和對(duì)應(yīng)的位置以及格式信息;對(duì)于掃描圖片文檔,則可以使用 OCR 技術(shù)進(jìn)行處理,從而獲得相應(yīng)的信息。兩種不同的手段幾乎可以使用現(xiàn)存的所有文檔數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,保證了預(yù)訓(xùn)練數(shù)據(jù)的規(guī)模。


基于文檔結(jié)構(gòu)和視覺信息的 LayoutLM 模型結(jié)構(gòu)


利用上述信息,微軟亞洲研究院的研究員們?cè)诂F(xiàn)有的預(yù)訓(xùn)練模型基礎(chǔ)上添加了二維位置嵌入(2-D Position Embedding)和圖嵌入(Image Embedding)兩種新的 Embedding 層,可以有效地結(jié)合文檔結(jié)構(gòu)和視覺信息:


1)?二維位置嵌入 2-D Position Embedding:根據(jù) OCR 獲得的文本邊界框?(Bounding Box),能獲取文本在文檔中的具體位置。在將對(duì)應(yīng)坐標(biāo)轉(zhuǎn)化為虛擬坐標(biāo)之后,則可以計(jì)算該坐標(biāo)對(duì)應(yīng)在 x、y、w、h 四個(gè) Embedding 子層的表示,最終的 2-D Position Embedding 為四個(gè)子層的 Embedding 之和。


2)?圖嵌入 Image Embedding:將每個(gè)文本相應(yīng)的邊界框?(Bounding Box)?當(dāng)作 Faster R-CNN 中的候選框(Proposal),從而提取對(duì)應(yīng)的局部特征。其特別之處在于,由于 [CLS] 符號(hào)用于表示整個(gè)輸入文本的語(yǔ)義,所以同樣使用整張文檔圖像作為該位置的 Image Embedding,從而保持模態(tài)對(duì)齊。


在預(yù)訓(xùn)練階段,研究員們針對(duì) LayoutLM 的特點(diǎn)提出了兩個(gè)自監(jiān)督預(yù)訓(xùn)練任務(wù):


1)?掩碼視覺語(yǔ)言模型(Masked Visual-Language Model,MVLM):大量實(shí)驗(yàn)已經(jīng)證明 MLM 能夠在預(yù)訓(xùn)練階段有效地進(jìn)行自監(jiān)督學(xué)習(xí)。研究員們?cè)诖嘶A(chǔ)上進(jìn)行了修改:在遮蓋當(dāng)前詞之后,保留對(duì)應(yīng)的 2-D Position Embedding 暗示,讓模型預(yù)測(cè)對(duì)應(yīng)的詞。在這種方法下,模型根據(jù)已有的上下文和對(duì)應(yīng)的視覺暗示預(yù)測(cè)被掩碼的詞,從而讓模型更好地學(xué)習(xí)文本位置和文本語(yǔ)義的模態(tài)對(duì)齊關(guān)系。


2)?多標(biāo)簽文檔分類(Multi-label Document Classification,MDC):MLM 能夠有效的表示詞級(jí)別的信息,但是對(duì)于文檔級(jí)的表示,還需要將文檔級(jí)的預(yù)訓(xùn)練任務(wù)引入更高層的語(yǔ)義信息。在預(yù)訓(xùn)練階段研究員們使用的 IIT-CDIP 數(shù)據(jù)集為每個(gè)文檔提供了多標(biāo)簽的文檔類型標(biāo)注,并引入 MDC 多標(biāo)簽文檔分類任務(wù)。該任務(wù)使得模型可以利用這些監(jiān)督信號(hào),聚合相應(yīng)的文檔類別并捕捉文檔類型信息,從而獲得更有效的高層語(yǔ)義表示。


實(shí)驗(yàn)結(jié)果:LayoutLM 的表單、票據(jù)理解和文檔圖像分類水平顯著提升


預(yù)訓(xùn)練過(guò)程使用了 IIT-CDIP 數(shù)據(jù)集,這是一個(gè)大規(guī)模的掃描圖像公開數(shù)據(jù)集,經(jīng)過(guò)處理后的文檔數(shù)量達(dá)到約11,000,000。研究員們隨機(jī)采樣了1,000,000個(gè)進(jìn)行測(cè)試實(shí)驗(yàn),最終使用全量數(shù)據(jù)進(jìn)行完全預(yù)訓(xùn)練。通過(guò)千萬(wàn)文檔量級(jí)的預(yù)訓(xùn)練并在下游任務(wù)微調(diào),LayoutLM 在測(cè)試的三個(gè)不同類型的下游任務(wù)中都取得了 SOTA 的成績(jī),具體如下:


1)?表單理解(Form Understanding):表單理解任務(wù)上,使用了 FUNSD 作為測(cè)試數(shù)據(jù)集,該數(shù)據(jù)集中的199個(gè)標(biāo)注文檔包含了31,485個(gè)詞和9,707個(gè)語(yǔ)義實(shí)體。在該數(shù)據(jù)集上,需要對(duì)數(shù)據(jù)集中的表單進(jìn)行鍵值對(duì)(key-value)抽取。通過(guò)引入位置信息的訓(xùn)練,LayoutLM 模型在該任務(wù)上取得了顯著的提升,將表單理解的 F1 值從70.72 提高至79.2。


2)?票據(jù)理解(Receipt Understanding):票據(jù)理解任務(wù)中,選擇了 SROIE 測(cè)評(píng)比賽作為測(cè)試。SROIE 票據(jù)理解包含1000張已標(biāo)注的票據(jù),每張票據(jù)都標(biāo)注了店鋪名、店鋪地址、總價(jià)、消費(fèi)時(shí)間四個(gè)語(yǔ)義實(shí)體。通過(guò)在該數(shù)據(jù)集上微調(diào),LayoutLM 模型在 SROIE 測(cè)評(píng)中的 F1 值高出第一名(2019)1.2個(gè)百分點(diǎn),達(dá)到95.24%。


3)?文檔圖像分類(Document Image Classification):對(duì)于文檔圖像分類任務(wù),則選擇了 RVL-CDIP 數(shù)據(jù)集進(jìn)行測(cè)試。RVL-CDIP 數(shù)據(jù)集包含有16類總記40萬(wàn)個(gè)文檔,每一類都包含25,000個(gè)文檔數(shù)據(jù)。LayoutLM 模型在該數(shù)據(jù)集上微調(diào)之后,將分類準(zhǔn)確率提高了1.35個(gè)百分點(diǎn),達(dá)到了94.42%。


微軟亞洲研究院的研究員們構(gòu)建了 DocBank 數(shù)據(jù)集[3][4],這是一個(gè)文檔基準(zhǔn)數(shù)據(jù)集,其中包含了50萬(wàn)文檔頁(yè)面以及用于文檔布局分析的細(xì)粒度 Token 級(jí)標(biāo)注。與常規(guī)的人工標(biāo)注數(shù)據(jù)集不同,微軟亞洲研究院的方法以簡(jiǎn)單有效的方式利用弱監(jiān)督的方法獲得了高質(zhì)量標(biāo)注。DocBank 數(shù)據(jù)集是文檔布局標(biāo)注數(shù)據(jù)集 TableBank[5][6] 的擴(kuò)展,基于互聯(lián)網(wǎng)上大量的數(shù)字化文檔進(jìn)行開發(fā)而來(lái)。例如當(dāng)下很多研究論文的 PDF 文件,都是由 LaTeX 工具編譯而成。LaTeX 系統(tǒng)的命令中包含了標(biāo)記作為構(gòu)造塊的顯式語(yǔ)義結(jié)構(gòu)信息,例如摘要、作者、標(biāo)題、公式、圖形、頁(yè)腳、列表、段落、參考、節(jié)標(biāo)題、表格和文章標(biāo)題。為了區(qū)分不同的語(yǔ)義結(jié)構(gòu),研究員們修改了 LaTeX 源代碼,為不同語(yǔ)義結(jié)構(gòu)的文本指定不同的顏色,從而能清楚地劃分不同的文本區(qū)域,并標(biāo)識(shí)為對(duì)應(yīng)的語(yǔ)義結(jié)構(gòu)。


從自然語(yǔ)言處理的角度來(lái)看,DocBank 數(shù)據(jù)集的優(yōu)勢(shì)是可用于任何序列標(biāo)注模型,同時(shí)還可以輕松轉(zhuǎn)換為基于圖像的標(biāo)注,以支持計(jì)算機(jī)視覺中的物體檢測(cè)模型。通過(guò)這種方式,可以使用 DocBank 公平地比較來(lái)自不同模態(tài)的模型,并且進(jìn)一步研究多模態(tài)方法,提高文檔布局分析的準(zhǔn)確性。


為了驗(yàn)證 DocBank 的有效性,研究員們使用了 BERT、RoBERTa 和 LayoutLM 三個(gè)基線模型進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,對(duì)于文檔布局分析任務(wù),LayoutLM 模型明顯優(yōu)于 DocBank 上的 BERT 和 RoBERTa 模型。微軟亞洲研究院希望 DocBank 可以驅(qū)動(dòng)更多文檔布局分析模型,同時(shí)促進(jìn)更多的自定義網(wǎng)絡(luò)結(jié)構(gòu)在這個(gè)領(lǐng)域取得實(shí)質(zhì)性進(jìn)展。


DocBank 數(shù)據(jù)集的數(shù)據(jù)樣例


實(shí)驗(yàn)結(jié)果


LayoutLM、BERT、RoBERTa 模型在 DocBank 測(cè)試集的準(zhǔn)確性


在 DocBank 的測(cè)試集上評(píng)估了六個(gè)模型后,研究員們發(fā)現(xiàn) LayoutLM 在摘要、作者、表格標(biāo)題、方程式、圖形、頁(yè)腳、列表、段落、節(jié)標(biāo)題、表格、文章標(biāo)題標(biāo)簽上得分最高。在其他標(biāo)簽上 LayoutLM 與其他模型的差距也較小。這表明在文檔布局分析任務(wù)中,LayoutLM 結(jié)構(gòu)明顯優(yōu)于 BERT 和 RoBERTa 結(jié)構(gòu)




?


?


?


?

原始文檔頁(yè)面

預(yù)訓(xùn)練BERT結(jié)果

真實(shí)結(jié)果

預(yù)訓(xùn)練LayoutLM結(jié)果

測(cè)試集上預(yù)訓(xùn)練 BERT 模型和預(yù)訓(xùn)練 LayoutLM 模型的樣例輸出


研究員們又選取了測(cè)試集的一些樣本,將預(yù)訓(xùn)練 BERT 和預(yù)訓(xùn)練 LayoutLM 的輸出進(jìn)行了可視化??梢杂^察到,序列標(biāo)記方法在 DocBank 數(shù)據(jù)集上表現(xiàn)良好,它可以識(shí)別不同的語(yǔ)義單元。對(duì)于預(yù)訓(xùn)練的 BERT 模型,某些 Token 沒(méi)有被正確標(biāo)記,這表明僅使用文本信息仍不足以完成文檔布局分析任務(wù),還應(yīng)考慮視覺信息。


與預(yù)訓(xùn)練的 BERT 模型相比,預(yù)訓(xùn)練的 LayoutLM 模型集成了文本和布局信息,因此它在基準(zhǔn)數(shù)據(jù)集上實(shí)現(xiàn)了更好的性能。這是因?yàn)槎S的位置嵌入可以在統(tǒng)一的框架中對(duì)語(yǔ)義結(jié)構(gòu)的空間距離和邊界進(jìn)行建模,從而提高了檢測(cè)精度。



附錄


[1]LayoutLM 論文:https://arxiv.org/abs/1912.13318

[2]LayoutLM 代碼&模型:https://aka.ms/layoutlm

[3]?DocBank 論文:https://arxiv.org/abs/2006.01038

[4]?DocBank 數(shù)據(jù)集&模型:https://github.com/doc-analysis/DocBank

[5]?TableBank 論文:https://arxiv.org/abs/1903.01949

[6]?TableBank 數(shù)據(jù)集&模型:https://github.com/doc-analysis/TableBank

[7]?“Injecting Artificial Intelligence into Financial Analysis”:https://medium.com/reimagine-banking/injecting-artificial-intelligence-into-financial-analysis-54718fbd5949

[8]?“Document Visual Question Answering”:https://medium.com/@anishagunjal7/document-visual-question-answering-e6090f3bddee





閱讀過(guò)本文的人還看了以下文章:


TensorFlow 2.0深度學(xué)習(xí)案例實(shí)戰(zhàn)


基于40萬(wàn)表格數(shù)據(jù)集TableBank,用MaskRCNN做表格檢測(cè)


《基于深度學(xué)習(xí)的自然語(yǔ)言處理》中/英PDF


Deep Learning 中文版初版-周志華團(tuán)隊(duì)


【全套視頻課】最全的目標(biāo)檢測(cè)算法系列講解,通俗易懂!


《美團(tuán)機(jī)器學(xué)習(xí)實(shí)踐》_美團(tuán)算法團(tuán)隊(duì).pdf


《深度學(xué)習(xí)入門:基于Python的理論與實(shí)現(xiàn)》高清中文PDF+源碼


特征提取與圖像處理(第二版).pdf


python就業(yè)班學(xué)習(xí)視頻,從入門到實(shí)戰(zhàn)項(xiàng)目


2019最新《PyTorch自然語(yǔ)言處理》英、中文版PDF+源碼


《21個(gè)項(xiàng)目玩轉(zhuǎn)深度學(xué)習(xí):基于TensorFlow的實(shí)踐詳解》完整版PDF+附書代碼


《深度學(xué)習(xí)之pytorch》pdf+附書源碼


PyTorch深度學(xué)習(xí)快速實(shí)戰(zhàn)入門《pytorch-handbook》


【下載】豆瓣評(píng)分8.1,《機(jī)器學(xué)習(xí)實(shí)戰(zhàn):基于Scikit-Learn和TensorFlow》


《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》PDF+完整源碼


汽車行業(yè)完整知識(shí)圖譜項(xiàng)目實(shí)戰(zhàn)視頻(全23課)


李沐大神開源《動(dòng)手學(xué)深度學(xué)習(xí)》,加州伯克利深度學(xué)習(xí)(2019春)教材


筆記、代碼清晰易懂!李航《統(tǒng)計(jì)學(xué)習(xí)方法》最新資源全套!


《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》最新2018版中英PDF+源碼


將機(jī)器學(xué)習(xí)模型部署為REST API


FashionAI服裝屬性標(biāo)簽圖像識(shí)別Top1-5方案分享


重要開源!CNN-RNN-CTC 實(shí)現(xiàn)手寫漢字識(shí)別


yolo3 檢測(cè)出圖像中的不規(guī)則漢字


同樣是機(jī)器學(xué)習(xí)算法工程師,你的面試為什么過(guò)不了?


前海征信大數(shù)據(jù)算法:風(fēng)險(xiǎn)概率預(yù)測(cè)


【Keras】完整實(shí)現(xiàn)‘交通標(biāo)志’分類、‘票據(jù)’分類兩個(gè)項(xiàng)目,讓你掌握深度學(xué)習(xí)圖像分類


VGG16遷移學(xué)習(xí),實(shí)現(xiàn)醫(yī)學(xué)圖像識(shí)別分類工程項(xiàng)目


特征工程(一)


特征工程(二) :文本數(shù)據(jù)的展開、過(guò)濾和分塊


特征工程(三):特征縮放,從詞袋到 TF-IDF


特征工程(四): 類別特征


特征工程(五): PCA 降維


特征工程(六): 非線性特征提取和模型堆疊


特征工程(七):圖像特征提取和深度學(xué)習(xí)


如何利用全新的決策樹集成級(jí)聯(lián)結(jié)構(gòu)gcForest做特征工程并打分?


Machine Learning Yearning 中文翻譯稿


螞蟻金服2018秋招-算法工程師(共四面)通過(guò)


全球AI挑戰(zhàn)-場(chǎng)景分類的比賽源碼(多模型融合)


斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


python+flask搭建CNN在線識(shí)別手寫中文網(wǎng)站


中科院Kaggle全球文本匹配競(jìng)賽華人第1名團(tuán)隊(duì)-深度學(xué)習(xí)與特征工程



不斷更新資源

深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、python

?搜索公眾號(hào)添加:?datayx??



機(jī)大數(shù)據(jù)技術(shù)與機(jī)器學(xué)習(xí)工程

?搜索公眾號(hào)添加:?datanlp

長(zhǎng)按圖片,識(shí)別二維碼



瀏覽 107
點(diǎn)贊
評(píng)論
收藏
分享

手機(jī)掃一掃分享

分享
舉報(bào)
評(píng)論
圖片
表情
推薦
點(diǎn)贊
評(píng)論
收藏
分享

手機(jī)掃一掃分享

分享
舉報(bào)

感谢您访问我们的网站,您可能还对以下资源感兴趣:

国产秋霞理论久久久电影-婷婷色九月综合激情丁香-欧美在线观看乱妇视频-精品国avA久久久久久久-国产乱码精品一区二区三区亚洲人-欧美熟妇一区二区三区蜜桃视频 粉嫩av懂色av蜜臀av熟妇| www.99av| 欧美大鸡巴在线观看| 国产性爱图| 久久国产无码| 亚洲精品无码电影| 搡女人视频国产一级午夜片| 99国产在线观看免费视频| 免费看片av| 亚洲AVwww| 欧美日韩一二三区| 亚洲成人性爱网站| 美女操逼图| 天堂a在线8| 无码网站内射| 中文字幕你懂的在线三级| 亚洲免费三级片| 国产一级aa| 911香蕉视频| 啊啊啊啊啊在线观看| 久久色在线视频| 欧美综合高清| 操逼A片| 成人做爰黄AAA片免费直播岛国 | 色av影音先锋无吗一区| 香蕉日逼| 日韩操逼网| 国产区精品| 超碰97在线免费观看| 777三级| 亚洲AV无码成人H动漫| 影音先锋AV资源网站| 国产三级片网站| 久久黄网| 黄色视频亚洲| 久久精品中文| 亚洲国产精品成人综合| 日韩精品视频一区二区三区| av性爱在线| igao在线观看| 18成人毛片| 人人妻人人澡| 亚州成熟少妇视频在线观看| 九九热精品视频在线观看| 成人激情视频网| 学生妹毛片视频| 精品视频网站| 影音先锋91久久网| 午夜福利av电影| 中字无码av| 成人福利小视频| 91一区| 午夜无码电影| 日韩黄片视频| 中文无码在线视频| 狼友精品| 亚洲小说欧美激情另类A片小说| 欧美视频基地| 亚洲综合色网站| 国产成人无码精免费视频| 操逼免费观看视频| 黄片WWW| 欧美黄色a片| 欧美视频色| 久久久久久久| 99国产精品| 国产免费一区二区在线A片视频| 久草中文视频| 91视频免费播放| 亚洲性爱手机版| 青娱乐亚洲精品| 嫩草国产| 黄色视频在线观看| 欧美日韩91| 久草香蕉视频| 中文乱伦视频| 国产精品免费观看视频| 国产精品日韩无码| 四虎成人精品无码永久在线的客服| www九九九| 伊人网av| 91爱在线| 久久国产一区二区三区| 亚洲肏屄网| 五月天婷婷黄色| 免费A片在线看| 99热激情在线| 日韩成人不卡| 99久久精品国产成人一区二区| 91精品午夜少妇| 国产69久久精品成人看| 亚洲色逼图片| 国产久久久久久久久久| AV中文在线| 特级西西444www高清| 欧美VA视频| 亚洲少妇无码| 西西444WWW无码大胆知乎| 欧美一级爱| 波多野吉衣高清无码| 看免费黄色视频| 自拍啪啪| jizz日韩| 亚洲国产激情视频| 精品无码一区二区三区的天堂| 欧美一级AA| 91肏屄视频| 伊人性爱网| 亚洲福利视频网站| 亚洲午夜精品视频| 国产亚洲一区二区三区| 97在线国产| 德美日三级片在线观看| 日韩小视频在线| 欧美日韩中国操逼打炮| 在线日韩av| 蜜桃视频日韩| 国产真人无码| 黄色视频在线观看| 手机在线毛片| 尤物yw| 婷婷五月成人| 亚洲免费观看高清完整版在线观| 欧美日韩激情视频| 内射视频免费观看| 日韩成人无码人妻| 午夜精品18视频国产17c| 日韩爱爱视频| 久久av一区二区三区| av在线无码| 日本黄色电影网站| 91熟女丰满原味| 日本久久人体视频| 日韩无码人妻系列| 操逼操逼操逼| 免费播放黄色成人片| 中文电视剧字幕在线播放网站| 国产精品乱| 肏屄视频在线看| 狼友视频免费观看| 国产乱子伦一区二区三| 久久久在线视频| 久久久久久久久久久久高清毛片一级| 国产99页| 免费看黄色的视频| 亚洲精品久久久久久久久豆丁网| 中出在线| 亚洲中文AV| 91天天干| 国产av资源| 日韩肏屄视频在线观看| 日本少妇激情视频| 夜夜爽夜夜| 一区免费在线| 天天干无码| 欧美成人一级| 桃色五月天| 91视频福利| 青榴视频免费观看| 在线综合国产欧美| 中文字幕免费在线观看| 亚洲精品97久久| 茄子av| 少妇搡BBBB搡BBB搡18禁| 日韩AV大片| 3D动漫精品一区二区在线播放免费 | 性中国熟妇| 88AV在线播放| 黄片高清无码| 91无码人妻传媒tv| 美少妇AV| 麻豆传媒一区| 国产在线观看无码| 五月婷婷激情五月| 中文字幕不卡视频| 国产肏屄视频| 大色欧美综合| 操逼视频大全| 在线有区别亚洲| www免费视频在线观看播放| 色视频在线观看免费| 亚洲自拍小说| 二区在线观看| 中文字幕在线观看免费高清完整版在线观看 | 欧美性爱香蕉视频| 日韩最新无码发布| 无码不卡中文字幕| 玖玖资源站中文字幕| 五月丁香花| 五月丁香综合网| 欧洲天堂在线视频网站| 伊人二区| 老太老熟女城中层露脸60| 亚洲码无| 一区二区三区高清| 青娱乐超碰在线| 操大爷影院| 老婆被黑人杂交呻吟视频| 在线视频A| 日韩一级在线视频| 国产视频99| 国产人妖在线观看| 一区在线观看| 天堂视频中文在线| 国产精品每日更新| 日本天堂在线| 唐山熟女工棚嗷嗷叫| 另类老妇性BBBWBBW| 亚洲成人黄色在线| 男人天堂视频网站| 黃色级A片一級片| 精品国产久久| 就去色色五月丁香婷婷久久久| 99都是精品| 亚洲无码高清在线视频| 农村一级婬片A片AAA毛片古装| 成人免费视频18| 黑人粗暴偷拍一区二区| 久久精品99| 一区二区高清无码视频| 在线国产黄色| 久久天堂| AV在线资源| 亚州精品无码| 激情毛片| 久久婷婷无码视频| 五月天一区二区三区| 亚洲综合久| 日韩电影一区| 豆花成人视频| adn日韩av| 国产精品做爱| 91热爆在线| 四虎性爱视频| 91精品国自产在线观看| 黄色无無| 成人欧美一区二区三区在线观看 | 狠狠躁夜夜躁人人爽人妻| 毛片A片免费看| 边添小泬边狠狠躁视频| 熟女内射| 翔田千里无码视频| 国产一精品一aⅴ一免费| 亚洲色成人网站www永久四虎 | 国产一二三四| 亚洲在线网站| 日本免费黄色电影| 青草视频精品| 国产21区| 欧美拍拍视频| 美妇肥臀一区二区三区-久久99精品国 | 黄色成人在线视频| 国产av一二三区| 国产精品小电影| 午夜天堂精品久久| 大香蕉伊人在线视频| 北条麻妃无码视频在线| 日韩成年视频| 狠狠躁日日躁夜夜躁A片男男视频| 免费黄色成人| 大帝av| 日本A一级片| 操逼视频91| 久久密| 日韩无码人妻一区二区三区| 麻豆91蜜桃传媒在线观看 | 亚洲女人被黑人巨大进入| 性视频人人| 国产成人精品无码片子的价格| 在线精品福利| 上海熟搡BBB搡BBBB| 羞羞涩漫无码免费网站入口 | 日本无码视频在线观看毒| 亚洲黄色免费看| 在线无码av| 丰满人妻一区二区免费看| 人人操人人爽人人妻| 五月天久久婷婷| 亚洲中文字幕在线观看| 天天日日日干| 精品人妻一区二区蜜桃视频| 详情:绿帽夫妻多人运动开淫啪-91n| 狠狠干五月天| 狠狠操狠狠撸| 动漫3d啪啪成人h动漫| 无码人妻一区| 天堂中文字幕在线观看| 免费乱伦视频| 无码在线免费| 2026AV天堂网| 欧美又大又粗| 免费黄色网址啊不卡| 国产91免费| 成人无码区免费A片| 一级黄片学生妹| 波多野结衣一级| 国产精品福利视频| 日韩成人无码影片| 91视频www| 欧美精品在线观看| 九九九视频在线观看| av无码中文字幕| 内射学生妹视频| 亚洲码无人客一区二区三区| 日韩黄色电影网站| 日韩少妇AV| 亚洲日韩一级片| 欧美亚洲国产精品| 免费中文字幕日韩欧美| 豆花网无码视频观看| 国产一区在线观看视频| 五月天久久久久久久| 日韩成人av在线| 日韩综合网| 精品久久三级片| 伊人视频在线| 黄工厂精品视频在线播| 逼特逼在线视频| 黄片久久| 91黄网站在线观看| 六月丁香网| 成人AV在线一区二区| 囯产精品久久久久久久久免费无码 | 亚洲毛片亚洲毛片亚洲毛片 | 97人人艹| 日韩精品一区二区亚洲AV观看| 日本少妇无码| 十八禁网站在线观看| 丁香色五月婷婷| 欧美城综合在线观看网| 久草不卡| 天天日夜夜爽| 国产精品国内自产| 91人妻人人澡人人爽精品| 国产一区二区三区免费视频| 中文爱爱视频| 无码波多野结衣| jizz在线观看| 久草免费在线视频| 中文字幕在线无码观看| 国产精品成人99一区无码| 激情AAA| 亚洲日韩成人在线| 久久久国产探花视频| 成人高清无码在线| 北条麻妃久久| 国内自拍视频网站| 欧美性爱自拍| 风间由美大荫蒂无码AV| 日韩精品123| 人人爽人人操人人爱| 99久视频| 亚洲一区视频在线| A视频在线观看| 国产成人V在线精品一区| 中文字幕精品亚洲熟女| 欧美性爱免费在线视频| AV在线一区二区| 国产精品一品二区三区的使用体验 | 国产成人精品一区二区三区视频| 欧美操比视频| 免费黄色视频网站在线观看| 欧美亚洲视频| 性久久久久久久久久| 成人精品在线观看| 成人A∨| 91成人精品一区在线播放| 中文字幕免费观看视频| 亚洲福利电影| 一级性爱毛片| 亚洲性爱在线| 夜夜操夜夜| 无码22p| 91人人操人人爽| 中文字幕乱伦性爱| 日皮在线观看| 久久er视频| 一级一级一级做a免费一级做a| 欧美第一网站| 国产成人高清无码| 亚洲天堂福利| 国产精品国产精品国产专区不卡| 国产成人久久精品麻豆二区| 亚洲中文网| 午夜传媒一区二区三区| 韩国成人啪啪无码高潮| 尤物视频在线观看视频| 午夜国产视频| 搡老熟女-91Porn| 亚洲欧美美国产| 做爰视频毛片下载蜜桃视频。| 东北成人毛片| 欧美v| 欧美成人免费精品| 男人天堂v| 三级片无码在线| 91无码精品| 免看一级a毛片一片成人不卡| 日韩理论片| 天堂a在线| 午夜精品久久久久久久久久久久 | 亚洲aⅴ| footjobvk| 六月天婷婷| 亚洲五月六月| 亚洲日本欧美| 日韩AV电影网站| 五月丁香六月激情| wwwsesese| 亚洲日韩中文无码| 免费看v片| 色婷婷综合视频| 亚洲激情网| 韩国三级HD久久精品| 爆乳一区二区三区AV| 青草草在线| 9l蝌蚪PORNY中文| 97在线免费视频| 91精品国产成人做爰观看奶头 | 欧美在线v| 一级片三级片| 人人射人人操| 久久成人影音| 婷婷丁香五月激情一区综合网| 91福利视频网站| 91视频黄| 特级西西WWW888| 中文字幕免费MV第一季歌词| 亚洲免费在线婷婷| 丝袜人妻| 天堂国产一区二区三区| 特级西西444www高清视频| 加勒比日韩| 在线观看免费视频无码| 99久久久久久| 日韩高清欧美| 日本三级片在线| Av一区二区三区| 一级一级a免一级a做免费线看内裤 | AV无码一区二区三区| 九九精品12| 黄色三级在线| 成年人免费毛片| 亚洲一区二区在线| 狠狠干五月天| 成人毛片视频网站| 亚洲小说区图片区| 亚洲激情片| 神马午夜激情| 日本成人电影| 亚洲www在线| 国产福利免费视频| 操b视频网站| 潮喷在线观看| 天堂成人AV| 久久夜色精品| 色婷婷激情视频| 苍井空精毛片精品久久久| 性爱乱伦视频| 日韩黄网| 欧美日韩国产成人在线观看| 亚洲天堂免费视频| 欧美日韩中文| 91精品少妇高潮一区二区三区不卡 | 九九九精品视频| 91AV一区二区| 成人国产精品秘欧美高清| 欧美日在线| 男女黄网站| 亚洲一区二区三区免费视频| 日韩视频免费在线观看| 人人操人人搞| 男女一区| 中文无码在线| 中国操逼| 五月天丁香花| 少妇无码一区| 人妻精品一区二区三区| 成人福利在线观看| 黄色a在线| 亚洲日韩AV无码专区影院| 高清无码中文字幕在线观看| 日韩不卡视频在线观看| 国产激情在线观看| www.亚洲精品| 天天天天日天天干| 黄色电影一区二区三区| 色色在线| 国产成人精品久久久| 国精品无码A区一区二区| 人人摸人人看| 最新在线中文字幕| 大香蕉天天操| 日本黄色大全| 欧美偷拍| 操b视频在线观看| 西西4444大胆无码视频| 国精产品一区二区三区在线观看 | 四川少妇搡bbbb搡bbbb| 日韩精品人妻中文字幕蜜乳| 99久久婷婷国产综合精品漫| 毛片A片免费看| 男人天堂99| www.黄色在线观看| 中文子幕免费毛片| 在线观看免费视频a| 操女人逼AV| 日韩二区三区| 开心老牛熟| 婷婷五月色播| 中文字幕淫乱视频欧美| 无码AV网站| 亚洲不卡在线观看| 久久综合无码内射国产| WWW.豆花视频精品| 亚洲国产高清视频| 成人精品水蜜桃| 免费在线观看A| 久久日韩视频| 九九九国产| 午夜无码精品一区二区三区99午 | 一本一道无码免费看视频| 亚洲GV成人无码久久精品| 在线观看免费高清无码| 日韩一区二区三区在线观看| 不卡视频在线观看| 国产手机精品视频| 亚洲天堂在线免费观看视频| 6969电视影片最新更新| 久久丝袜| 中文无码一区二区三区| 永久AV免费网站| 亚洲a在线视频| 亚洲福利| 国产精品成人免费精品自在线观看| 又大又粗又爽| 69成人在线电影| 99色综合网| 人人摸人人| 人妻少妇无码| 91秦先生在线播放| 99爱免费视频| 在线一区观看| 亚洲精品mv| 色欲AV在线| 人妻少妇一区| 日本中文在线观看| 日韩三级片在线播放| 在线aⅴ| 性欧美成人18| 欧美激情综合色综合啪啪五月| 视频在线一区| 超碰97老师| 久久国产2025| 乱伦99| 欲色av| 桃花岛tⅴ+亚洲品质| 五月丁香花婷婷| 国产精品操逼| 夜夜爽久久精品91| 亚洲激情黄色| 人人爽人人操人人| 91人人妻人人澡人人爽人人精品 | 日欧内射| 无码人妻丰满熟妇区17水蜜桃| 日本三级片网站在线观看| 内射毛片| 欧美精品一二三区| 高清无码中文字幕在线观看| 骚逼逼影院| 18网站视频| 日日视频| 亚洲激情网址| 激情99| 老熟女痒到不行-ThePorn| 亚洲欧美v| 在线欧美亚洲| www.91熊猫成人网| 天堂AV无码AV| 久久国产偷拍| 黑人vs亚洲人在线播放| 日韩视频中文字幕| 精品国产久久| 成人无码区免费A片| 精品欧美乱码久久久久久| 久久91精品| 国产综合久久久777777色胡同 | 婷婷久| 六月婷婷激情| 日韩AV一二三| 97超碰资源总站| 有码视频在线观看| 人人操91| 水蜜桃视频网站在线观看| 日本高清视频网站网wwwwww| 天天日天天草| 午夜日韩| 欧美综合在线观看| 日韩精品久久久久久久酒店| 波多野结衣一级婬片A片免费下载| 中文字幕天堂在线| 9999re| AV口爆| 人妻丝袜蕾丝高跟双飞| 青榴视频免费观看| 伊人成人在线视频| 久久综合九九| 久久久噜噜噜久久中文字幕色伊伊| 99热最新在线| 麻豆自拍偷拍| 久久久久蜜桃| 国产乱子伦-区二区三区熟睡91| 国内自拍视频网| 午夜福利123| 噼里啪啦免费观看视频大全| 老妇bbw| av福利在线观看| 五月丁香欧美性爱| 在线观看黄片| 一区二区在线视频| 中文字幕在线免费观看视频| 性无码一区二区三区| 91爱爱网| 中文字幕国产av| 日韩高清无码人妻| 2025精品视频| 成人福利午夜A片公司| 无码免费毛片一区二区三区古代| 国产高清小视频| 欧美日屄视频| 人妻丰满精品一区二区| 999在线视频| 91精品国产乱码久久久| 丁香色婷婷五月天| 操逼91视频| 精品國產一區二區三區久久蜜月 | 怡红院一区二区| 一本久久综合亚洲鲁鲁五月天 | 国产一级二级三级视频| 亚洲婷婷小说| 国产无码成人电影| 国产AV无码区亚洲| 韩国AV三级| 正在播放李彩斐被洋老外| 狠狠干| 日皮视频在线观看| 欧美口爆| 欧美日韩国产在线观看| 国产成人一区二区| 东京热精品| 操比视频| 亚洲另类视频| 青春草视频在线观看| 无码欧美| 特级西西444www高清视频| 丁香激情五月天| 无码欧美| 成人午夜福利| 大香蕉伊人在线视频| 91AV在线播放| 99这里只有精品| 国产黄网| 国产精品123| 亚洲成人在线播放| 欧美精品一区二区三区四区| 亚洲AV无码乱码| 在线观看国产| 1插菊花综合网| 日逼视频| 无码人妻日韩精品一区二区三| 激情男人网| 亚洲天堂一级片| 91在线无码精品国产三年| 日韩在线欧美在线| 男人天堂无码av| 西西人体大胆ww4444图片| free性欧美| 国产尤物在线| 亚洲色男人天堂| 国产超级无码高清在线视频观看| 爱爱亚洲| 亚洲婷婷在线观看| 国产久久性爱| 3p视频网站| 日韩人妻无码电影| 色视频在线播放| 成人AV中文字幕| 青娱乐老视频| 色婷婷在线观看视频| 国产综合久久久7777777| 爆乳尤物一区二区三区| 国产三级电影在线观看| 国产成人av在线播放| 欧美性爱中文字幕| 91人妻人人澡人人爽| 欧美一区二区三区婷婷五月| 五月天婷婷乱伦| 亚州加勒比无码| 337P大胆粉嫩噜噜噜| 婷婷色大师| 亚洲成人在线视频免费观看| 老汉av| 久久香蕉网站| 西西人体44www大胆无码| 97人人精品| 亚洲第一黄网| 欧美三级精品| 亚洲精品乱码| 久久国产精品波多野结衣AV| 亚洲日韩视频| 日本少妇黄色视频| 久9久9| 99热青青| 日本老女人视频| 免费在线观看视频黄| 成年人黄色视频在线观看| 亚洲日本高清| 国产1区2区3区| a视频在线免费观看| 麻豆一区二区三区| 色欧美大香蕉| 久久久精品久久| 操B视频在线播放| 中文字幕36页| 成人毛片18女人毛片真水| 安微妇搡BBBB搡BBBB| 国产成人va| 国产又粗又长的视频| 嫩BBB槡BBBB槡BBB| 2025精品精品视频| 男女高清无码| 亚洲视频偷拍| 日韩黄色小电影| 小视频你懂的| 国产女人18毛片水真多1| 天堂网av在线| 亚洲成人一区二区三区| 加勒比黑人和翔田千里在线播放| 无码人妻丰满熟妇区毛片蜜桃麻豆 | 国精品91无码一区二区三区在线 | 黄网站免费看| 国产精品久久久| 国产美女网站| 国产精品在线免费| 成人免费在线电影| 高清无码网址| 亚洲av| 日批视频网站| 欧美在线不卡综合| 按摩性高湖婬AAA片A片中国 | 亚洲视频a| 天天日天天射天天干| 日本不卡一区| 免费一级无码婬片A片AAA毛片| 国产毛片18水真多18精品| 69乱伦视频| 在线观看视频亚洲| 99热r| 五月激情丁香| 免费性爱视频| AV在线小说| 啪啪视频在线观看| 亚洲国产久久| 国产看片网站| 日韩欧美国产高清91| 欧美淫秽视频| 大香蕉久操网| 久艹综合| 亚洲欧洲免费| 欧美国产综合| 亚洲丝袜不卡| 亚洲a在线视频| 国产乱子伦一区二区三区免看| 国产最新地址| 欧美人妻视频| 一区二区三区四区在线| 国产激情123区| 国产精品一区二区免费| 无码黄漫| 天天插夜夜操| 成人性生活视频| 欧美日韩高清一区| 成人激情四射网| 一区二区三区四区精品视频| 五月婷在线| 国产美女裸体网站| 亚洲精品国产成人| 91久久婷婷亚洲精品成人| 日韩在线播放视频| 日韩A电影| 操逼综合网| 日韩最新高清无码| 麻豆精品秘国产| 日本视频一区二区三区| 国产成人网| 2025最新偷拍| 精品无码不卡| 91亚洲国产成人久久精品麻豆| 影音先锋国产资源| caoporen| 亚洲a在线视频| 日韩免费a| 欧美八区| 国产AV影院| 色哟哟视频在线观看| 日韩久久高清| 黄片午夜| 日韩国产在线观看| 色色色91| 色婷婷在线综合| 亚洲无码999| av在线天堂| 一区二区三区三级片| 日韩精品丰满无码一级A片∴ | 国产三级图片| 露脸老熟女91集合| 国产成人91| 特黄特黄免费看| 天堂网2018| 黄片免费看网站| 国产人妻| 三级国产网站| 精品国产区一区二| 丰满人妻精品一区二区在线| 午夜伊人| 亚洲最新在线视频| 日韩AV乱伦| 精品综合网| 最新版本日本亚洲色| 日韩极品在线观看| 欧美成人在线免费视频| 久久精品成人电影| 无码在线视频免费观看| 中文字幕精品视频在线| 黄色网页在线免费观看| 欧美激情一区二区| 精品国产AV鲁一鲁一区| 久久精品秘一区二区三免费| 美女黄色视频网站| 久久老熟女| 尻屄视频免费| 欧美精品成人在线| 国产成人高清| 欧美久久婷婷| 久久一区二区三区四区五区| 丁香五月天视频| 91精品酒店视频| 骚逼逼影院| 亚洲免费黄色| 天天爽夜夜爽精品成人免费| 91在线成人电影| JiZZjiZZ亚洲成熟熟妇| 亚洲狠狠| 日韩中文字幕在线高清| 日一日干一干| 尤物在线播放| 日本A∨在线| 九九精品在线观看| 亚洲av影院| 青青操天天干| 91在线无码精品秘国产-百度| 日日干天天干| 成人免费一级视频| 在线日韩AV| 国产女人在线| 日本成人不卡| 亚洲成人影片在线观看| 天天日综合| 天天做天天爱夜夜爽| 色五月婷婷基地| 国产a级毛片| 午夜爱爱免费视频| aa免费视频| 国产精品不卡| 大香蕉熟女| 操逼福利| 久久1234| 亚欧在线| 婷婷五月av| 亚洲午夜福利一区二区三区| 欧美日韩亚洲综合| 蜜臀久久99精品久久久电影| 日日碰狠狠躁久久躁婷婷| 午夜激情免费| 91人妻无码一区二区三区| 中文无码毛片| 麻豆国产91在线播放| 三级视频在线观看| 台湾精品一区二区三区| 色色色五月| 日韩ava| 婷婷色五月激情| 特级毛片| 99在线观看视频在线高清| 久久久久久婷婷| 尤物视频在线播放| 国产网站视频| 视色av| 蜜桃视频网站在线观看| 蜜桃视频在线观看视频|