冠軍親薦! 2021騰訊廣告算法大賽聯(lián)手ACM MM,攜百萬獎池再度來襲!
寫在前面
一年一度的算法界重磅賽事——騰訊廣告算法大賽又又又又要來了,為了讓更多技術(shù)人了解這個全球最受矚目的頂級賽事,Datawhale特別邀請了組織成員魚佬(id:魚遇欲語與余,蟬聯(lián)2019-2020兩屆騰訊廣告算法大賽冠軍),分享了他的參賽心得。
經(jīng)驗(yàn)分享
從2017年開始,每年的4月-8月之間最熱議的比賽莫過于騰訊廣告算法大賽,不僅賽事規(guī)模宏大,每年都超萬人報(bào)名,而且獎金豐厚,去年冠軍獎金高達(dá)50萬元人民幣。
今年的2021騰訊廣告算法大賽更是與計(jì)算機(jī)領(lǐng)域國際學(xué)術(shù)頂會ACM Multimedia聯(lián)合,圍繞視頻廣告開設(shè)的兩大賽道(“視頻廣告秒級語義解析”與“多模態(tài)視頻廣告標(biāo)簽”),同步啟動2021年ACM MM grand challenge,冠軍獎金更是高達(dá)100,000美金。
作為一名參加過三屆賽事的選手,每年我都很期待這個時刻的到來,因?yàn)橛挚梢耘c各路高手同臺競技,互相學(xué)(yan)習(xí)(xi)。當(dāng)然,作為兩屆騰訊廣告算法大賽的冠軍,也非常希望能夠進(jìn)入決賽,與大家在現(xiàn)場進(jìn)一步切磋交流。
我的參賽經(jīng)歷
在讀研期間,也就是2017年,我就了解到騰訊廣告算法大賽了,不過那時候比賽報(bào)名剛剛結(jié)束,完美錯過與大佬們同臺競技的機(jī)會。在那之后我對前排方案進(jìn)行了學(xué)習(xí)總結(jié),下定決心參加明年的騰訊廣告算法大賽。
記得去年騰訊廣告算法大賽,毫無自然語言處理項(xiàng)目實(shí)戰(zhàn)的經(jīng)驗(yàn),真的是邊學(xué)邊比賽,在比賽開始后經(jīng)常刷夜,嘗試很多以前沒有接觸過得模型,后來也是開腦洞搭了一些奇奇怪怪有點(diǎn)兒小用的模型。經(jīng)過個這場比賽獲得了很多的新知識,更加幸運(yùn)的是最后我們團(tuán)隊(duì)獲得冠軍。
今年的賽題是視頻行為識別相關(guān)問題,一如既往的沒有任何經(jīng)驗(yàn),看來又要在深夜中閱讀相關(guān)論文和開源代碼。不過為了在騰訊廣告算法大賽中有更多的收獲,我今年依舊會積極分享和總結(jié)。
值得挑戰(zhàn)的比賽
之所以每年都會參加騰訊廣告算法大賽,除了展示能力,獲得職業(yè)發(fā)展上的高起點(diǎn)以外,還是個扎扎實(shí)實(shí)提高自己能力的好機(jī)會。同時,賽題專注于計(jì)算廣告領(lǐng)域,這也讓我早早接觸這個方向,也深刻地影響了我的職業(yè)發(fā)展,如今我的工作方向也與這息息相關(guān)。
如果你是在校師生,這個比賽本身還是有非常多的實(shí)踐意義的,與我們在校園里接觸的項(xiàng)目相比,有很多根本性的區(qū)別:
1. 源于工業(yè)界的真實(shí)賽題
回顧四屆的騰訊廣告算法大賽題目,從2017年廣告點(diǎn)擊率預(yù)估問題,到2018年的look-alike問題,再到2019年的廣告流量預(yù)估和2020年的人口屬性分析問題,都是廣告系統(tǒng)中最重要的核心建模問題。不夸張地說,如果這幾年的比賽題目你都認(rèn)認(rèn)真真做過了,搞清了根本原理,基本上你也就具備了大廠商業(yè)化部門算法工程師的工作能力。
當(dāng)然,本屆賽事更具前沿挑戰(zhàn)性和商業(yè)價值。延續(xù)往年風(fēng)格,騰訊廣告從廣告應(yīng)用場景痛點(diǎn)出發(fā),圍繞視頻廣告提煉賽題,開設(shè)“視頻廣告秒級語義解析”和“多模態(tài)視頻廣告標(biāo)簽”兩大不同難度的賽道。
參賽者不僅需要對視頻,音頻,文本等多模態(tài)進(jìn)行內(nèi)容理解,同時需要捕獲時序信息,進(jìn)行時序解構(gòu),將視頻根據(jù)語義拆分為多個片段,其實(shí)這是一個非常富有算法技術(shù)挑戰(zhàn)的問題,而且在廣告領(lǐng)域也有著巨大的商業(yè)價值。
作為行業(yè)領(lǐng)域中的新興研究課題,騰訊廣告算法大賽今年還和國際學(xué)術(shù)頂會ACM Multimedia強(qiáng)強(qiáng)聯(lián)手,兩大賽道均已入選 ACM MM Grand Challenge。ACM MM被認(rèn)為是多媒體技術(shù)領(lǐng)域奧運(yùn)級別的頂級盛會,也是中國計(jì)算機(jī)學(xué)會(CCF)認(rèn)證和多媒體研究領(lǐng)域評級中唯一的A類國際頂級會議。一次比賽,就獲得兩大頂級機(jī)構(gòu)的實(shí)戰(zhàn)經(jīng)驗(yàn)和頂級背書,可謂一舉兩得。
2. 大規(guī)模的真實(shí)脫敏數(shù)據(jù)
對學(xué)校的師生來說,最苦惱的是得不到真實(shí)數(shù)據(jù)做訓(xùn)練,遑論大規(guī)模的數(shù)據(jù)。因?yàn)檫@樣的數(shù)據(jù)資產(chǎn),只有互聯(lián)網(wǎng)領(lǐng)域的大廠手里才有。所以,大家最好抓住這樣的機(jī)會,去體會一下自己的能力和見解構(gòu)建出來的模型,在大規(guī)模的真實(shí)數(shù)據(jù)面前,是不是真的有用、高效。
當(dāng)然,這樣的數(shù)據(jù)開放背后,需要非常嚴(yán)謹(jǐn)精密的脫敏和隱私保護(hù)技術(shù)。騰訊廣告在這方面的布局和實(shí)踐,一直走在業(yè)界前列,目前也在大力探索聯(lián)邦學(xué)習(xí)等保護(hù)隱私的機(jī)器學(xué)習(xí)技術(shù)。大家通過參與此次比賽,也可以對這方面的問題形成初步的認(rèn)識。
3. 強(qiáng)大的計(jì)算力支持
擔(dān)心自己沒有機(jī)器跑算法?騰訊廣告算法大賽將聯(lián)合騰訊云智能鈦機(jī)器學(xué)習(xí)平臺(TI-ONE)助力選手,解決機(jī)器問題。TI-ONE能夠?yàn)槲覀儏①愡x手提供從數(shù)據(jù)預(yù)處理、模型構(gòu)建、模型訓(xùn)練、模型評估的全流程訓(xùn)練能力。
記得2018年的時候,我們團(tuán)隊(duì)租服務(wù)器花費(fèi)了2000多元,對于在校生來說還是有壓力的,不過從2019年開始,我就基本上使用TI-ONE來打騰訊廣告算法大賽,而且還配有GPU。聽說今年資源再度升級,讓選手在解決算力難題上毫無壓力。
騰訊廣告算法大賽可謂是含著金湯勺出身,得到了騰訊多方的頂配資源支持。
據(jù)悉,除了上面提到的TI-ONE,本屆騰訊廣告算法大賽還得到了騰訊云AI、騰訊大數(shù)據(jù)、騰訊招聘、騰訊高校合作以及英偉達(dá)等眾多內(nèi)外部合作伙伴的全力支持。
其中騰訊云智能鈦機(jī)器學(xué)習(xí)平臺(TI-ONE)與英偉達(dá)共同支持AI算法平臺,同時攜手騰訊大數(shù)據(jù)Angel全棧機(jī)器學(xué)習(xí)平臺共同提供算法資源支持,主辦方對賽事的投入及重視程度可見一斑。
4. 我對賽題的理解
在很多頂會中,視頻中的行為識別都是熱點(diǎn)問題,也極具挑戰(zhàn)性。備受學(xué)術(shù)界與工業(yè)界關(guān)注的頂級學(xué)術(shù)會議CVPR就舉辦過視頻行為理解相關(guān)競賽,比如視頻動作分類、視頻事件分類。
今年騰訊廣告算法大賽的賽題也是聚焦視頻行為識別,更是推出兩道賽題,分別是賽題一的視頻廣告秒級語義解析(Video Ads Content Structuring)和賽題二的多模態(tài)視頻廣告標(biāo)簽(Multimodal Video Ads Tagging)
賽題一是對于給定測試視頻樣本,通過算法將視頻在時序上進(jìn)行“幕”的分段,并且預(yù)測出每一段在呈現(xiàn)形式、場景、風(fēng)格等三個維度上的標(biāo)簽,使用Mean Average Precision(MAP)進(jìn)行評分。
賽題二是對于給定的測試視頻樣本,通過算法預(yù)測出視頻在呈現(xiàn)形式、場景、風(fēng)格等三個維度上的標(biāo)簽,使用Global Average Precision(GAP)進(jìn)行評分。
從賽題難度上看,賽題一是大于賽題二的,賽題一需要能夠?qū)⒁曨l進(jìn)行準(zhǔn)確分段,然后對每一段進(jìn)行標(biāo)簽分類,然而賽題二僅需對視頻進(jìn)行標(biāo)簽分類,相比賽題一流程上變得簡化,這使得分類粒度變粗,不要考慮更加細(xì)致的內(nèi)容。在解決賽題二時,對視頻進(jìn)行分段需要考慮更多的影響因素,這也對算法提出了挑戰(zhàn),比如能夠適應(yīng)靈活的時序長度、精確的識別時序邊界和擁有可靠的置信度分?jǐn)?shù)。
關(guān)于賽事的信息
本屆大賽的報(bào)名和參賽都在線上進(jìn)行,報(bào)名期從即日至5月31日止,初賽階段時間為4月19日至6月7日,復(fù)賽階段時間為6月9日至7月7日,決賽將在8月份進(jìn)行。
算法大賽對參賽者來說,將有機(jī)會獲得最高100,000美元的獎金(這也打破了騰訊廣告算法大賽的冠軍獎金紀(jì)錄),同時也是一次難得的個人提升的機(jī)會。
參賽地址:https://algo.qq.com/signup.html?rfisource=AMSDATA0319(復(fù)制或閱讀原文)
面對廣告投放真實(shí)場景的業(yè)務(wù)問題,參賽者不但可以在比賽過程中一展自身的技術(shù)能力,還可獲得來自學(xué)術(shù)界、產(chǎn)業(yè)界等領(lǐng)域權(quán)威專家的專業(yè)點(diǎn)評和指導(dǎo)。更誘人的是,第一賽道排名前三的隊(duì)伍將有機(jī)會到現(xiàn)場參與2021 ACM MM Grand Challenge Session,到成都與更多算法大?,F(xiàn)場交流。
本次賽事的評委
2021騰訊廣告算法大賽還邀請到了四位經(jīng)驗(yàn)與實(shí)力兼并的騰訊高管給予參賽者專業(yè)的點(diǎn)評和指導(dǎo)。包括騰訊廣告的兩位高管蔣杰和楊毅果,騰訊公司副總裁王巨宏,還有優(yōu)圖實(shí)驗(yàn)室的黃飛躍。

對于我個人而言,騰訊廣告算法大賽,不僅是專注于算法領(lǐng)域的競技賽事,更是一個面向算法圈層的交流平臺。我每年參加騰訊廣告算法大賽都能有新的收獲,希望我們都可以在賽事中磨練自身技能,追求算法技術(shù)能力的成長。
