近期神奇機器學(xué)習(xí)應(yīng)用大賞
導(dǎo)讀
眾所周知,Arxiv本質(zhì)上是一個預(yù)注冊研究想法的網(wǎng)站,優(yōu)點是文章更新又多又快,缺點是文章質(zhì)量良莠不齊,全得靠人肉分辨。今天的主題就是最近白鹡鸰看到的一些Arxiv上機器學(xué)習(xí)領(lǐng)域有趣的文章,無論它們的質(zhì)量如何,那研究內(nèi)容實在是真的獨特到讓人忍不住多看一眼。
大家好久不見呀這里是你們的白鹡鸰,不知道各位有沒有想我反正我是有想各位了~由于各種大人的原因,最近在賣萌屋存在感不高。雖然還要再等一段時間才能搞事情,但是,在日常的刷文章過程中,白鹡鸰實在是被整樂(yue)了,于是忍不住提前爬上來眾樂樂一波。
眾所周知,Arxiv本質(zhì)上是一個預(yù)注冊研究想法的網(wǎng)站,優(yōu)點是文章更新又多又快,缺點是文章質(zhì)量良莠不齊,全得靠人肉分辨。今天的主題就是最近白鹡鸰看到的一些Arxiv上機器學(xué)習(xí)領(lǐng)域有趣的文章,無論它們的質(zhì)量如何,那研究內(nèi)容實在是真的獨特到讓人忍不住多看一眼。

基于卷積神經(jīng)網(wǎng)絡(luò)的馬匹情感識別
Emotion Recognition in Horses with Convolutional Neural Networks
https://arxiv.org/abs/2105.11953
“您了解馬嗎?您關(guān)心馬嗎?這位朋友,請允許我用幾分鐘的時間,向您介紹一下基于卷積神經(jīng)網(wǎng)絡(luò)的馬的面部表情識別模型?!?/p>
兩位來自MIT的朋友八成是期末要交AI大作業(yè)了,硬生生搞出了這么個玩意兒。沒有專業(yè)人士支持的標(biāo)注,400張圖片的訓(xùn)練集和80張圖片的驗證集,就提一個問題——為什么要上CNN呢?迫擊炮打蚊子大概就是指這種情況吧。他們還特地做了個交互界面,上傳圖片,哦,是一匹好奇的馬。厲害,厲害。然而,我不關(guān)心馬,我目前見到的會關(guān)心馬的情緒的也只有你們倆,好了,下一個。

基于視覺的豬對新鮮事物的偏好行為識別
Vision-based Behavioral Recognition of Novelty Preference in Pigs
https://arxiv.org/abs/2106.12181
人的悲歡并不相通,但腦回路可能產(chǎn)生共鳴。UIUC不同專業(yè)的同學(xué)們,聯(lián)合起來!動物學(xué)農(nóng)業(yè)學(xué)再加上一個計算機的,他們的課題是豬對新事物的認(rèn)知情況。標(biāo)了幾段視頻,然后,LRCN。就報告內(nèi)容而言,看起來比做馬臉識別的那一組專業(yè)一點,好歹還知道調(diào)一調(diào)預(yù)訓(xùn)練模型的參數(shù),結(jié)果可視化也還可以,如果我是動物行為學(xué)課程的老師應(yīng)該能給個A+。不過,仔細(xì)想想這一組的分工,怎么都有點后背發(fā)涼。

人工智能,讓孩子的數(shù)學(xué)學(xué)習(xí)“減負(fù)”!
FINNger -- Applying Artificial Intelligence to Ease Math Learning for Children
https://arxiv.org/abs/2105.12281
為什么會變成這樣呢……明明數(shù)學(xué)是快(diao)樂(fa)的,機器學(xué)習(xí)也是快(diao)樂(fa)的,兩件快樂事情重合在一起,得到的,本該是像夢境一般幸(tu)福(ding)的時間……但是,為什么,會變成這樣?讓幼兒園小朋友學(xué)編程難不難我不知道,但好歹教材還是人寫的,但這拿機器學(xué)習(xí)來教數(shù)學(xué),還真就不是人干事了,?。?/p>
這篇論文的實質(zhì)是手勢識別,在小朋友做完計算題之后,圖像識別檢查正確答案。但是,這應(yīng)用背景真的太迷惑了,我把自己帶入了一下小朋友,如果都學(xué)會了加減乘除這樣抽象的邏輯思維,寫幾個數(shù)字必然不在話下,何必還要用手指來比劃呢?而作者宣稱的“這是面對欠發(fā)達(dá)地區(qū)的教育手段”也不成立,因為這樣的教育儀器做出來,成本絕對高于人工,對操作者的教育水平也有所要求,根本不是欠發(fā)達(dá)地區(qū)負(fù)擔(dān)得起的。這個動機簡直透著一股“何不食肉糜”的味道。
基于機器學(xué)習(xí)和自然語言處理的MBTI人格預(yù)測
Extending the Abstraction of Personality Types based on MBTI with Machine Learning and Natural Language Processing
https://arxiv.org/abs/2105.11798
看著文中羅列的機器學(xué)習(xí)方法,讓人回憶起了被綜述類大作業(yè)支配的恐懼。當(dāng)你對要綜述的學(xué)科和相關(guān)工作理解不夠深刻時,無論一篇文章與這門學(xué)科的實質(zhì)任務(wù)有什么關(guān)聯(lián),都只能胡亂復(fù)述一遍好湊字?jǐn)?shù)。然而,本科生水水報告還可以理解,一個國際心理學(xué)協(xié)會的成員還這樣泄洪就離譜了呀。針對特定領(lǐng)域的數(shù)據(jù)驅(qū)動型研究,對數(shù)據(jù)集的特征沒有描述和總結(jié),對任務(wù)沒有定義和限制。Logic Regression與BERT齊飛,SVM與LSTM共一色。如果是回顧型工作,就該介紹一下過往的相關(guān)研究;如果是開創(chuàng)型工作,那好歹也該說明應(yīng)用的算法的合理性。然而,翻開論文一看,這密密麻麻幾十頁的沒個重點,結(jié)論更是迷迷惑惑,橫豎看了半天,原來全篇都寫著兩個字:“灌水”!

基于機器學(xué)習(xí)的面部骨骼生長預(yù)測
Prediction of the Facial Growth Direction with Machine Learning Methods
https://arxiv.org/pdf/2106.10464
通過人在幼年時期頭骨的形狀,預(yù)測其成年時面相的變化。其實這個工作挺有價值的,比如說對走失兒童、無名尸體的鑒別,或者醫(yī)美方面都用得上,說不定還能給中國傳統(tǒng)文化之算命提供一定的可解釋性。但是,這個模型建不建得出來出來要打個問號:如果以頭骨的數(shù)據(jù)作為輸入,那這個任務(wù)隱含的假設(shè)是小時候長相相似的人在成長過程中面部變化的傾向也會相似,而實際上,基因、成長環(huán)境、生活習(xí)慣等因素都對人的長相有重要的影響。此外,如果真的想為這個任務(wù)建一個數(shù)據(jù)集,那么十年左右的數(shù)據(jù)采集周期是必不可少的。只能說,祝研究者好運 :)

利用深度學(xué)習(xí)的足球防守行為效果評估
What Happened Next? Using Deep Learning to Value Defensive Actions in Football Event-Data
https://arxiv.org/abs/2106.01786
歐洲杯期間發(fā)篇深度學(xué)習(xí)+足球防守的文章聽起來還是很合理的。今天研究防守中具體行為的效果,明天說不定就能做防守策略,再過一陣子,四舍五入就可以不用請足球教練了,這可真是節(jié)約經(jīng)費的好辦法。不過這個任務(wù)中,最難的應(yīng)該是收集球員的數(shù)據(jù),畢竟不同的人在應(yīng)對局勢時的選擇是不一樣的,想準(zhǔn)確預(yù)測個體行為建議輸入端多加幾個博弈模型。此外,人在極限情況下的爆發(fā)力是難以預(yù)計的,為了增加系統(tǒng)的穩(wěn)定性,建議未來的足球比賽將人換成機器人,從而方便控制數(shù)值上限。不過好像這樣一來還是不夠簡便,不如直接在計算機里做幾個人物模型跑跑VR足球比賽——體育比賽就是用來挑戰(zhàn)人類極限的娛樂活動,正擱這兒玩的起勁呢,非要用精密的計算破壞這種參與感,爪巴。
家居裝潢必備神經(jīng)網(wǎng)絡(luò)
Style Similarity as Feedback for Product Design
https://arxiv.org/pdf/2105.12256
“我要用神經(jīng)網(wǎng)絡(luò)來搞設(shè)計?!?br>“呃……”
“設(shè)計的是裝修風(fēng)格?!?br>“好耶!”
“設(shè)計裝修風(fēng)格的本質(zhì)是識別圖片。”
“呃……”
“可以給用戶推薦特定風(fēng)格的家具產(chǎn)品?!?br>“……”
這大概就是我在看論文的時候的心情波動。老實說,這個想法還挺誘人的,如果只需要輸入戶型,地理位置,想要的裝修風(fēng)格,計算機就能自動幫你生成裝修方案,甚至還找好裝修方案里所有商品的購買途徑。那么這個世界上應(yīng)該會少很多類似于門口放人俑,屋頂?shù)醍嬮艿难b修事故。然而,理想是美好的,現(xiàn)實是慘烈的,文章的開頭吹上了天,而實際功能只是風(fēng)格識別+相似推薦,和裝修限定版的電商推薦算法沒什么本質(zhì)區(qū)別,實在是欺騙感情。

基于深度神經(jīng)網(wǎng)絡(luò)的非侵入式電力負(fù)載監(jiān)控
More Behind Your Electricity Bill: a Dual-DNN Approach to Non-Intrusive Load Monitoring
https://arxiv.org/pdf/2106.00297
乍一看,白鹡鸰還以為這篇文章是講通過電費評估信貸能力的,還暗笑莫不是“不想查電表的研究人員不是好金融大佬”。然而,實際上這是正兒八經(jīng)用電表波動估計家電使用情況的研究。本質(zhì)是通過輸出波形還原多個輸入波的問題基于的原理是不同的電器耗電的波形和頻率都有各自獨立的特征。雖然波的疊加是線性的,看起來沒必要用機器學(xué)習(xí)。但是在正常情況下,要知道每個家庭有哪些電器和這些電器在不同工作狀態(tài)下的耗能模式顯然不是一件合法的事情(除非你真的干了什么要讓人查電表的事情)。而且,一般來說,電力監(jiān)控也不是針對任何個體的行為,而是為了獲得群體的用電習(xí)慣,從而更好地分配電力,需要處理的數(shù)據(jù)不僅量大還具有多樣性。因此,用DNN來做電力監(jiān)控監(jiān)控還是合理的。
當(dāng)然,想想這項技術(shù)還可以用來檢測個人的活動軌跡和生活習(xí)慣,還是有點令人毛骨悚然的。

基于視覺的食物識別與食譜評估
A Review of the Vision-based Approaches for Dietary Assessment
https://arxiv.org/pdf/2106.11776
The Food Recognition Benchmark: Using DeepLearning to Recognize Food on Images
https://arxiv.org/abs/2106.14977
不會吧不會吧,連圖片識別食物式營養(yǎng)學(xué)都配擁有綜述和benchmark了?看到這兩篇文章的時候,我的認(rèn)知出現(xiàn)了一些動搖。即使我們身處在一個一道菜只擁有一份配方的世界,能用一模一樣的火候,做出份量完全一樣的食物,請問火腿和人工肉怎么區(qū)分?長得像櫻桃的紅酒鵝肝又該怎么處理?更別提,最近開始流行用草莓做成的長得像草莓的龍吟草莓了。即使能夠解決靠圖片估計食物重量的問題,圖片這種單一模態(tài)的輸入也完全無法提供足夠用來確認(rèn)食物品種的信息啊。如果說,這個任務(wù)追求的只是粗糙的食物品種識別和單位重量內(nèi)熱量范圍估計,好吧,當(dāng)我沒說。但是這一點點的估計失誤,幾百卡的熱量可能就吃進(jìn)去了,這可令人放心不下啊。

來之不義的人臉數(shù)據(jù)集
Indian Masked Faces in the Wild Dataset
https://arxiv.org/abs/2106.09670
拿一個新發(fā)布的數(shù)據(jù)集作為壓軸,是想說兩件事:
作為研究者,請注意道德底線。 作為普通人,請注意保護(hù)隱私。
這篇文章的作者認(rèn)為他們提供了一個具有多樣性的面部有遮擋數(shù)據(jù)集,是在為新冠時期帶口罩的面部識別任務(wù)提供幫助。而我認(rèn)為,這群作者為了水文章丟掉了他們底線。他們在未經(jīng)授權(quán)的情況下,從Instagram上下載了他人的自拍圖像,而基于這些數(shù)據(jù)提出的挑戰(zhàn),卻未必是一個有價值的任務(wù)。事實上,人臉識別技術(shù)已經(jīng)比較成熟,用自己帶口罩的樣子多刷刷屏幕,手機已經(jīng)能學(xué)會自動解鎖。可以說,這項技術(shù)的上限基本已經(jīng)擺在那里了,實裝效果只和軟硬件配置條件有關(guān)。在這種情況下,為了發(fā)篇文章侵犯他人隱私,這種行為必須譴責(zé)。另一方面,這也說明了社交平臺上發(fā)自拍確實是一件有風(fēng)險的事情,這批研究者還只是拿臉來學(xué)學(xué)模型,萬一哪天自拍被用來FakeGAN了,哦呵呵呵呵呵呵。
最后的話
與往期各種nb到閃閃發(fā)光的推文不同,今天的故事是圍繞Arxiv上更能代表世界的參差——甚至是下限的那批文章展開的。有許許多多的工作,在假設(shè)沒有說清楚,問題價值沒有評估好的情況下,就稀里糊涂地開工了。他們的作者可能是迫于課程壓力、或者學(xué)位要求,制造了一堆創(chuàng)新性欠缺,實驗不充分的文本,還勇氣可嘉地投放到了Arxiv上分享。不過,禍兮福兮,他們的文章湊巧被浪行飛翔的白鹡鸰看到了,于是,至少拿來奇文共欣賞,成功吸引到與原本文章質(zhì)量不符的關(guān)注度了(手動滑稽)。
最后,請大家注意:
Arxiv有風(fēng)險,刷文需謹(jǐn)慎!
往期精彩:
【原創(chuàng)首發(fā)】機器學(xué)習(xí)公式推導(dǎo)與代碼實現(xiàn)30講.pdf
【原創(chuàng)首發(fā)】深度學(xué)習(xí)語義分割理論與實戰(zhàn)指南.pdf
求個在看
