來源:清華大學(xué)
編輯:Priscilla 好困
【新智元導(dǎo)讀】近日,全球網(wǎng)絡(luò)通信頂會(huì)ACM SIGCOMM 2021公布了獲獎(jiǎng)名單,清華大學(xué)信息學(xué)院劉云浩、李振華團(tuán)隊(duì)研究影響蜂窩網(wǎng)絡(luò)可靠性的軟硬件及人類行為因素,獲本屆大會(huì)唯一最佳學(xué)生論文獎(jiǎng),成為首個(gè)獲得該獎(jiǎng)的亞洲研究院校。
清華大學(xué)團(tuán)隊(duì)獲得ACM SIGCOMM 2021唯一最佳學(xué)生論文獎(jiǎng)。成為亞洲地區(qū)首個(gè)獲得該獎(jiǎng)的研究院校!清華大學(xué)信息學(xué)院劉云浩教授和李振華副教授團(tuán)隊(duì)帶領(lǐng)信息學(xué)院2021級(jí)博士生李洋和信息學(xué)院2020級(jí)博士生林灝,研究影響蜂窩網(wǎng)絡(luò)可靠性的軟硬件及人類行為因素。有趣的是,團(tuán)隊(duì)之前聚餐的時(shí)候還討論過論文的「后路」:要是論文沒被大會(huì)收錄,還能往哪投。這下團(tuán)隊(duì)?wèi)?yīng)該能放心了,不僅論文投中了,還直接拿了本屆唯一的最佳學(xué)生論文獎(jiǎng)。
蜂窩網(wǎng)絡(luò)是人類移動(dòng)通信的普適技術(shù)。從傳統(tǒng)的2G、3G,到現(xiàn)在普及的4G、高速的5G、未來的6G,蜂窩網(wǎng)絡(luò)的不斷進(jìn)化為超高清視頻直播、增強(qiáng)現(xiàn)實(shí)、虛擬現(xiàn)實(shí)、實(shí)時(shí)人工智能和自動(dòng)駕駛等一系列前沿應(yīng)用提供基礎(chǔ)傳輸架構(gòu)支撐。高速蜂窩網(wǎng)絡(luò)不僅代表高帶寬,還要求低時(shí)延和高服務(wù)密度。「手機(jī)不斷網(wǎng)」成為了一個(gè)至關(guān)重要但又難以克服的問題。如何在大規(guī)模異構(gòu)高動(dòng)態(tài)蜂窩環(huán)境中保證網(wǎng)絡(luò)連接的可靠性,同時(shí)涉及了手機(jī)制造商、網(wǎng)絡(luò)服務(wù)提供商、操作系統(tǒng)和應(yīng)用軟件開發(fā)商。由此,清華大學(xué)的團(tuán)隊(duì)與工業(yè)界結(jié)合,共同研究了蜂窩網(wǎng)絡(luò)的可靠性問題。團(tuán)隊(duì)的研究論文《蜂窩網(wǎng)絡(luò)可靠性的全國(guó)性研究:測(cè)量、分析和增強(qiáng)》(A Nationwide Study on Cellular Reliability: Measurement, Analysis, and Enhancements)獲得了唯一的最佳學(xué)生論文獎(jiǎng)(Best Student Paper Award)。論文地址:http://www.greenorbs.org/people/lzh/papers/[SIGCOMM%2721]%20Cellular%20Reliability.pdf項(xiàng)目地址: https://CellularReliability.github.io/這是首次對(duì)蜂窩網(wǎng)絡(luò)可靠性進(jìn)行大規(guī)模長(zhǎng)時(shí)間的研究。隨著蜂窩網(wǎng)絡(luò)技術(shù)不斷進(jìn)步,手機(jī)網(wǎng)絡(luò)可不可靠,成為了蜂窩技術(shù)采用和部署的一個(gè)關(guān)鍵問題。但是,因?yàn)樵谝苿?dòng)設(shè)備上測(cè)量可靠性具有一定的難度,大規(guī)模測(cè)量的成本也很高,這個(gè)問題就一直沒有解決。因此,團(tuán)隊(duì)決定填補(bǔ)這個(gè)研究空白。對(duì)34種不同硬件型號(hào)的7000多萬部安卓手機(jī)進(jìn)行大規(guī)模的深入研究。研究發(fā)現(xiàn),蜂窩網(wǎng)絡(luò)生態(tài)系統(tǒng),尤其是5G技術(shù),存在多項(xiàng)不為人知的重要軟件設(shè)計(jì)缺陷。而這些正是損害蜂窩網(wǎng)絡(luò)可靠性,導(dǎo)致手機(jī)老是斷網(wǎng)的主要根源。由此,團(tuán)隊(duì)提出了基于「非齊次時(shí)變馬爾科夫過程」的最優(yōu)化方法,將蜂窩連接修復(fù)的剛性低時(shí)效等待革新為自適應(yīng)概率模型驅(qū)動(dòng)策略,從而讓手機(jī)斷網(wǎng)的持續(xù)時(shí)間降到最小。論文還首次引入穩(wěn)定性兼容的4G/5G雙連接機(jī)制,在不降低數(shù)據(jù)傳輸率的前提下,實(shí)現(xiàn)蜂窩連接的高可靠平滑切換。團(tuán)隊(duì)在這7000多萬部安卓手機(jī)部署應(yīng)用后,5G手機(jī)斷網(wǎng)次數(shù)減少40%,所有手機(jī)斷網(wǎng)持續(xù)時(shí)間縮短36%。從移動(dòng)設(shè)備的角度來看,蜂窩數(shù)據(jù)連接失敗主要有以下三種情況 :- Data_Setup_Error(連接建立錯(cuò)誤) : 移動(dòng)設(shè)備可以接收附近基站的信號(hào),但無法與基站建立數(shù)據(jù)連接。
- Out_of_Service(服務(wù)中斷):數(shù)據(jù)連接已經(jīng)建立,但移動(dòng)設(shè)備不能接收蜂窩數(shù)據(jù)。
- Data_Stall(數(shù)據(jù)阻塞):移動(dòng)設(shè)備可以接收蜂窩數(shù)據(jù),但數(shù)據(jù)連接異常停滯。
Android中移動(dòng)蜂窩網(wǎng)絡(luò)生命周期管理的狀態(tài)機(jī)模型。多種蜂窩數(shù)據(jù)失敗事件發(fā)生在不同狀態(tài)的相互遷移中團(tuán)隊(duì)在自定制安卓系統(tǒng)Android-MOD之上用所開發(fā)的實(shí)時(shí)監(jiān)控服務(wù)從關(guān)鍵系統(tǒng)服務(wù)中抓取詳細(xì)的設(shè)備和網(wǎng)絡(luò)狀態(tài)信息,并過濾掉誤報(bào)。最終有7000萬用戶加入研究,分享了8個(gè)月的數(shù)據(jù)(2020年1月至8月)。數(shù)據(jù)集中有34種不同型號(hào)的安卓手機(jī),移動(dòng)、電信、聯(lián)通3個(gè)移動(dòng)互聯(lián)網(wǎng)服務(wù)供應(yīng)商,以及530萬個(gè)基站。結(jié)果顯示,在所有34種型號(hào)的設(shè)備上,手機(jī)故障都很常見。對(duì)于每個(gè)型號(hào),0.15%-45%(平均為23%)的設(shè)備至少經(jīng)歷過一次蜂窩電話故障。在測(cè)量過程中,一個(gè)設(shè)備平均發(fā)生多達(dá)33次故障,而一次故障持續(xù)時(shí)間平均長(zhǎng)達(dá)3.1分鐘。實(shí)驗(yàn)告訴我們:手機(jī)硬件更好也于事無補(bǔ)。蜂窩故障主要是由軟件的可靠性缺陷造成的。例如,安卓10中盲目地優(yōu)先考慮5G連接的實(shí)現(xiàn),大大損害了蜂窩連接的穩(wěn)定性。此外,大部分(94%)故障持續(xù)時(shí)間是由于Data_Stall故障引起的。當(dāng)然,手機(jī)斷網(wǎng)跟運(yùn)營(yíng)商也有關(guān)系。由于電信的信號(hào)覆蓋率較低,電信用戶的手機(jī)故障發(fā)生率(27.1%)比移動(dòng)用戶(20.1%)和聯(lián)通用戶(14.7%)更高。但與此相反,雖然3G基站的數(shù)量和總體信號(hào)覆蓋范圍比不上2G或4G基站,但3G基站上的故障發(fā)生率卻低于2G或4G基站。基站方面,通常的觀點(diǎn)認(rèn)為,蜂窩的可靠性與接收信號(hào)強(qiáng)度(RSS)之間存在正相關(guān)關(guān)系。然而,當(dāng)RSS達(dá)到最高的5級(jí)時(shí),情況正好相反。此時(shí)比1-4級(jí)的RSS更容易發(fā)生故障。事實(shí)上,大多數(shù)5級(jí)RSS下的故障來自公共交通樞紐周圍密集部署的基站,雖然RSS高,但這些基站增加了LTE移動(dòng)性管理的控制信道開銷,導(dǎo)致經(jīng)常出現(xiàn)網(wǎng)絡(luò)故障。研究提出了可以大規(guī)模改善蜂窩可靠性的方案:- 讓手機(jī)供應(yīng)商推出5G模塊和新的操作系統(tǒng)版本之前謹(jǐn)慎處理、加強(qiáng)測(cè)試,特別是多場(chǎng)景覆蓋;
- 讓互聯(lián)網(wǎng)服務(wù)供應(yīng)商充分利用無線電資源,例如利用「空閑」的3G基站和規(guī)劃公共區(qū)域的基站部署密度;
- 促進(jìn)跨互聯(lián)網(wǎng)服務(wù)供應(yīng)商基礎(chǔ)設(shè)施建設(shè)。
對(duì)于上述改善方案,研究團(tuán)隊(duì)已經(jīng)進(jìn)行了力所能及的系統(tǒng)實(shí)現(xiàn),產(chǎn)生了可觀的實(shí)際影響。首先,考慮蜂窩故障的可能性,不盲目追求5G潛在的高數(shù)據(jù)率,同時(shí)利用最新的4G/5G雙連接機(jī)制,優(yōu)化Android 10中的無線接入技術(shù)(RAT)選擇策略。其次,優(yōu)化安卓系統(tǒng)中的三階段蜂窩連接恢復(fù)機(jī)制,將其固定時(shí)間觸發(fā)器替換為基于非齊次時(shí)變馬爾可夫過程(TIMP)的概率模型驅(qū)動(dòng)觸發(fā)器,從而使設(shè)備更快速地恢復(fù)網(wǎng)絡(luò)。團(tuán)隊(duì)向受測(cè)用戶發(fā)布雙重優(yōu)化的系統(tǒng)補(bǔ)丁后,在更新系統(tǒng)的用戶中5G手機(jī)故障情況減少40%,Data_Stall持續(xù)時(shí)間減少了38%。
獲獎(jiǎng)?wù)撐墓餐谝蛔髡邽榍迦A大學(xué)信息學(xué)院2021級(jí)博士生李洋和信息學(xué)院2020級(jí)博士生林灝。李洋,現(xiàn)于清華大學(xué)軟件學(xué)院可信網(wǎng)絡(luò)與系統(tǒng)研究所攻讀博士學(xué)位。
曾就讀于清華大學(xué)軟件學(xué)院,并在2018年獲得學(xué)士學(xué)位,2021年獲得工程碩士學(xué)位,入選清華大學(xué)優(yōu)秀碩士畢業(yè)論文。
曾以第一作者身份發(fā)表IEEE INFOCOM論文一篇、IEEE/ACM TON期刊論文一篇。合作發(fā)表過FAST、MobiSys、TPDS等會(huì)議/期刊論文。
研究方向?yàn)樵朴?jì)算、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、移動(dòng)互聯(lián)網(wǎng)等。
林灝,目前為清華大學(xué)軟件學(xué)院二年級(jí)博士生(直博)。
曾就讀于清華大學(xué)軟件學(xué)院,在2020年獲得學(xué)士學(xué)位。
在本科及博士就讀期間以共同一作身份在ACM MobiCom上發(fā)表論文兩篇,在IEEE TPDS上發(fā)表論文一篇。合作發(fā)表過EuroSys、TMC會(huì)議/期刊論文。
研究方向主要為移動(dòng)網(wǎng)絡(luò)與操作系統(tǒng)。
通訊作者為清華大學(xué)信息學(xué)院教授劉云浩和清華大學(xué)信息學(xué)院副教授李振華。https://www.thss.tsinghua.edu.cn/publish/soft/3641/2011/20110608151912005129309/20110608151912005129309_.html劉云浩,清華大學(xué)全球創(chuàng)新學(xué)院院長(zhǎng),自動(dòng)化系教授,ACM Fellow,IEEE Fellow,獲清華大學(xué)自動(dòng)化系工學(xué)學(xué)士學(xué)位,美國(guó)密西根州立大學(xué)計(jì)算機(jī)系工學(xué)碩士與工學(xué)博士學(xué)位。曾任美國(guó)密西根州立大學(xué)講席教授、計(jì)算機(jī)系主任;清華大學(xué)長(zhǎng)江學(xué)者教授、軟件學(xué)院院長(zhǎng)。ACM Transactions on Sensor Network 主編,CCCF主編。2010年獲得教育部自然科學(xué)一等獎(jiǎng),2011年獲國(guó)家自然科學(xué)二等獎(jiǎng),2013年獲得ACM主席獎(jiǎng),是該獎(jiǎng)1985年設(shè)立以來唯一獲獎(jiǎng)中國(guó)人。http://www.greenorbs.org/people/lzh李振華清華大學(xué)軟件學(xué)院副教授、博士生導(dǎo)師。2005年獲得南京大學(xué)計(jì)算機(jī)系學(xué)士學(xué)位,2008年獲得南京大學(xué)計(jì)算機(jī)系碩士學(xué)位,2013年獲得北京大學(xué)計(jì)算機(jī)系博士學(xué)位。主要研究領(lǐng)域?yàn)樵朴?jì)算/云存儲(chǔ)、網(wǎng)絡(luò)通信、移動(dòng)計(jì)算/移動(dòng)模擬器。其他共同作者還包括清華大學(xué)博士后宮良一、小米集團(tuán)移動(dòng)技術(shù)總監(jiān)辛顯龍、明尼蘇達(dá)大學(xué)副教授錢風(fēng)和伊利諾伊大學(xué)助理教授徐天音。
個(gè)人主頁:
https://gongliangyi.github.io/
宮良一,清華大學(xué)博士后。
2010年獲得哈爾濱工程大學(xué)計(jì)算機(jī)學(xué)院學(xué)士學(xué)位,2016年獲得哈爾濱工程大學(xué)計(jì)算機(jī)學(xué)院博士學(xué)位(直博),2016-2019年就職于天津理工大學(xué)信息安全系(高級(jí)講師),2019-2022年就職于清華大學(xué)軟件學(xué)院可信網(wǎng)絡(luò)與系統(tǒng)研究所。
2017年曾獲天津市131創(chuàng)新人才稱號(hào)。近五年來在國(guó)際學(xué)術(shù)會(huì)議及期刊(其中包括SIGCOMM,NDSI,MobiCom, EuroSys, TMC, TPDS等)上發(fā)表論文數(shù)篇,目前主持國(guó)家自然青年科學(xué)基金和天津市自然青年科學(xué)基金項(xiàng)目,曾參與多項(xiàng)國(guó)家級(jí)、省部級(jí)重大科研項(xiàng)目。
主要研究方向?yàn)榫W(wǎng)絡(luò)安全、移動(dòng)操作系統(tǒng)和移動(dòng)模擬器。
參考資料:
https://www.tsinghua.edu.cn/info/1181/86382.htm

