機(jī)器學(xué)習(xí)學(xué)語言「太笨」?跟爸爸媽媽們多學(xué)學(xué)!

新智元報道
新智元報道
來源:外媒
編輯:Priscilla
【新智元導(dǎo)讀】芝加哥大學(xué)與卡內(nèi)基·梅隆大學(xué)的研究人員設(shè)計了一個游戲,了解父母是如何根據(jù)孩子習(xí)得的語言知識,準(zhǔn)確地調(diào)整與孩子交流時使用的語言。該研究結(jié)果也有助于機(jī)器學(xué)習(xí)的發(fā)展。

還記得自己牙牙學(xué)語的時候,父母是怎么教我們說話的嗎?
「叫媽媽,媽——媽——」「吃飯飯」
這種拖長發(fā)音,重復(fù)單詞的方式,是每個小孩學(xué)會說一個單詞的最基本方式。
而這種父母與孩童之間的交談方式與成年人之間的交談方式,在很多方面都不一樣。除了上面這種拖長發(fā)音、重復(fù)單詞的方式,父母還會根據(jù)我們已經(jīng)學(xué)會的詞語,繼續(xù)教我們別的內(nèi)容。
那么,機(jī)器又是如何學(xué)習(xí)語言呢?
來自芝加哥大學(xué)與卡內(nèi)基·梅隆大學(xué)的研究人員發(fā)現(xiàn)了一種新方法,用實驗評估父母在與孩子談話時,根據(jù)孩子已經(jīng)掌握的語言,改變自己的語言方式。而這種教育孩子說話的方式也適用于機(jī)器學(xué)習(xí)。
這是首個該類型的語言模式研究,相關(guān)論文已經(jīng)發(fā)布在Psychological Science上。
為孩子選擇合適的語言模式
「一直以來我們都知道,父母和孩子說話的方式與其他成年人說話的方式有很多不同的地方,比方說,簡化語言、重復(fù)單詞,或者拖長發(fā)音,這能讓孩子更好地掌握語言?!?/span>
「但是,我們并不知道父母是否在孩子學(xué)習(xí)語言的過程中,改變自己說話的方式,從而讓孩子能夠“恰到好處地”學(xué)習(xí)下一內(nèi)容?!箍▋?nèi)基·梅隆大學(xué)心理學(xué)副教授Daniel Yurovsky說道。

Daniel Yurovsky
研究人員發(fā)現(xiàn),成年人會放慢語速,用更高的音調(diào)和孩子說話。他們還會用夸張的發(fā)音,重復(fù)或者簡化自己的語言。除此之外,成年人還會問孩子問題,以確認(rèn)孩子的理解能力。整個交流模型會隨著孩子語言流利程度的提高而不斷變化。
Yurovsky教授表示,這就像學(xué)生在學(xué)校學(xué)習(xí)數(shù)學(xué)的方式。
學(xué)生先從代數(shù)開始學(xué)習(xí),然后是平面幾何,之后是微積分。Yurovsky教授說,「人們不假思索地使用相同的結(jié)構(gòu)和孩子交流,以便掌握孩子對語言的了解程度,并修改他們的說話方式,讓孩子能夠更好地理解他們?!?/span>
如何調(diào)整語言模式?
如何調(diào)整語言模式?
隨著孩子慢慢長大,父母也會改變與他們的互動方式。為更好了解這一過程,研究團(tuán)隊設(shè)計了一款游戲,讓父母協(xié)助孩子在三只動物中選出一只正確動物。在這些選項中,有一半的動物是孩子在2歲前就已經(jīng)認(rèn)識的,而剩下的則是2歲后才認(rèn)識的動物。
41對親子受邀參與該研究,研究人員則測量父母認(rèn)為孩子應(yīng)該認(rèn)識某些動物時的交流方式。

父母描述動物來指導(dǎo)孩子選擇正確的圖案
研究結(jié)果發(fā)現(xiàn),父母非常了解孩子的語言,因為他們一直見證著孩子的成長和學(xué)習(xí)。這表明,父母利用他們對孩子語言發(fā)展的了解來調(diào)整他們的語言。

用更長的表述來形容孩子不認(rèn)識的動物
研究還發(fā)現(xiàn),父母在向孩子表達(dá)「未知」的動物時用了各種方法,比如在描述動物的時候,使用孩子熟悉的其它詞語來形容動物。

在機(jī)器學(xué)習(xí)領(lǐng)域中的應(yīng)用
在機(jī)器學(xué)習(xí)領(lǐng)域中的應(yīng)用
自然語言處理(NLP)是一種專業(yè)分析人類語言的人工智能?,F(xiàn)代NLP是一門融合了語言學(xué)、計算機(jī)科學(xué)和機(jī)器學(xué)習(xí)的混合學(xué)科。
語音助手大家都很熟悉了,而各種語音助手上線前,必須要經(jīng)過訓(xùn)練。而訓(xùn)練的第一步就是文本預(yù)處理。簡單地說,就是輸入文本,以便于后續(xù)分析。
而語言模型能夠從無限制的大規(guī)模單語語料中學(xué)習(xí)到豐富的語義知識,這也是我們?nèi)缃裼?xùn)練機(jī)器學(xué)習(xí)語言的方式:提供我們所有的全部語言數(shù)據(jù)。
Yurovsky教授認(rèn)為,他們的研究結(jié)果能夠幫助人們理解機(jī)器學(xué)習(xí)的語言系統(tǒng)。
也就是說,如果人們不再一次性將所有語言數(shù)據(jù)「填鴨式」地進(jìn)行訓(xùn)練,而是在適當(dāng)?shù)臅r候向機(jī)器輸入適當(dāng)?shù)恼Z言數(shù)據(jù),就能讓機(jī)器在適當(dāng)?shù)膹?fù)雜程度學(xué)習(xí)語言。
機(jī)器之于研究人員,如同孩子之于父母。后者都十分清楚地掌握著前者的學(xué)習(xí)過程與學(xué)習(xí)能力。
如果研究人員能夠像父母一樣,調(diào)節(jié)機(jī)器學(xué)習(xí)語言的進(jìn)度和方式,能否更好地幫助機(jī)器學(xué)習(xí)就見仁見智了。
參考資料:
https://www.unite.ai/new-research-into-how-children-learn-language-can-help-machine-learning-field/
-往期精彩-



