
2020年 5G 商用元年以來,各種邊緣場景開始火熱起來,邊緣計算又重回人們視野,這次的回歸還伴隨著云計算的普及與通信技術(shù)的顛覆式發(fā)展。邊緣云作為 5G 與中心云計算的中繼節(jié)點,處于云網(wǎng)融合、承上啟下的關(guān)鍵位置。而邊緣云 + 云原生將會像集裝箱改變世界那樣,基于云原生的標準化和深厚積累,更好的解決邊緣各種異構(gòu)、垂直、分布式等場景的各類問題賦能邊緣場景。基于這種思考,結(jié)合阿里巴巴集團豐富的邊緣生態(tài)業(yè)務,阿里云逐步構(gòu)建了邊緣云原生體系。在近期的CCF TF48期研討會上,阿里云邊緣云高級技術(shù)專家周晶為現(xiàn)場技術(shù)專家們分享了阿里云邊緣云原生體系構(gòu)建過程中的思考與沉淀。高性能 OpenResty 開發(fā)框架 Vanilla 作者,WeiboMesh 發(fā)起人與初創(chuàng)核心成員,推進完成微博核心服務 Mesh 化改造,開源愛好者,目前主要負責阿里云邊緣融合計算平臺的設(shè)計研發(fā)與邊緣云原生體系建設(shè),致力于 5G 邊緣計算基礎(chǔ)設(shè)施的設(shè)計建設(shè)與行業(yè)落地。
回顧整個移動通信的演進歷程,從1980s 1G到來且模擬移動電話誕生,到后來2G網(wǎng)絡下的數(shù)字移動電話、3G下的全球范圍兼容及網(wǎng)頁生成、4G移動寬帶加速視頻傳播,到5G時代移動物聯(lián)網(wǎng)與垂直行業(yè)的縱深融合,再到未來6G萬物深度智聯(lián)的行業(yè)展望,通信的主體從以人為中心,逐漸向以物為中心遷移。信息流轉(zhuǎn),數(shù)據(jù)的生產(chǎn)消費方式也正在發(fā)生巨變。在5G環(huán)境下,無線網(wǎng)絡的接入能力進一步躍升,數(shù)據(jù)的生產(chǎn)消費方式由集中生產(chǎn)、分散消費轉(zhuǎn)變?yōu)榉稚⑸a(chǎn)、泛在消費,這意味著技術(shù)上需要進行應用的重構(gòu)和產(chǎn)業(yè)的協(xié)同。5G 時代,80% 的數(shù)據(jù)和計算將發(fā)生在邊緣
隨著5G網(wǎng)絡對移動寬帶的增強,海量終端互聯(lián)以及對于高可靠低時延連接的需求,邊緣云的價值將日益凸顯。邊緣云通過流量在邊緣收斂,實現(xiàn)對5G大流量的本地化處理和分發(fā),避免海量流量對骨干網(wǎng)絡的沖擊,同時也有效降低海量流量的遠程傳輸成本。依托分布式架構(gòu),邊緣云計算實現(xiàn)對海量終端高并發(fā)的分布式處理、深入場景的本地化計算能力,有效提升計算效率。同時,邊緣云通過就近部署,滿足5G低延時處理的場景化需求。阿里云邊緣云 ?| ?一云多芯、一云多態(tài)今年 5 月以 “云上創(chuàng)新” 為主題的阿里云峰會上,阿里云發(fā)布了一云多芯、一云多態(tài)的一體化飛天架構(gòu),旨在通過飛天操作系統(tǒng)對 x86、ARM、RISC-V 等多種芯片架構(gòu)的全面兼容,以提供一套:云產(chǎn)品架構(gòu)統(tǒng)一、體驗一致的飛天彈性架構(gòu),從中心向邊緣輻射,讓算力無處不在。這 4 種形態(tài)的云在位置分布、機房規(guī)模、應對的場景和解決的問題等方面各不相同。中心 Region 位于一線核心區(qū)域,作為全產(chǎn)品大體量,超大規(guī)模的公共云形態(tài),應對各種通用的彈性、高密、大并發(fā)、高可用場景,比如大家熟悉的互聯(lián)網(wǎng)計算場景、大數(shù)據(jù)、AI 模型訓練、推理等場景。中心 Region 通常離終端用戶較遠,時延一般在 100 ms以內(nèi)。物聯(lián)網(wǎng)IoT 現(xiàn)場計算節(jié)點位于用戶機房及業(yè)務現(xiàn)場,離用戶最近,提供軟硬一體的計算方案,面向設(shè)備廠商提供云端一體的設(shè)備智能化服務,面向行業(yè)和政府提供企業(yè)數(shù)字化 IoT 基礎(chǔ)設(shè)施,以應對 IoT 設(shè)備智能化、垂直行業(yè)的物聯(lián)網(wǎng)平臺建設(shè)、IoT 設(shè)備分發(fā)與拓展等場景,時延在 5 ms 以內(nèi)。而在中心和現(xiàn)場之間的作為中繼節(jié)點的本地 Region 和邊緣云節(jié)點時延在 5 ms 到 20 ms 之間,本地 Region 位于數(shù)字經(jīng)濟活躍區(qū)域,以中心云小型化輸出的方式提供比邊緣云節(jié)點更大規(guī)模的計算服務,重點支持區(qū)域企業(yè)數(shù)字化轉(zhuǎn)型的場景。
而我們團隊負責的邊緣云由大規(guī)模地域分散的邊緣異構(gòu)多云融合節(jié)點組成,單節(jié)點規(guī)模在百數(shù)量級,節(jié)點廣泛覆蓋離用戶更近的熱點區(qū)域,且相互協(xié)同組成一朵分布式云;以應對邊緣設(shè)備管理、智能終端上云、視圖流化、渲染、CDN、以及終端算力上移、云端算力下沉、5G + 邊緣云網(wǎng)融合等邊緣場景,為用戶提供更近、更低時延且與中心體驗一致的云服務。阿里云邊緣云具有可遠程管控、安全可信、標準易用等特點。
隨著云計算的深度發(fā)展使得企業(yè)和組織可以更聚焦自己的業(yè)務,大量的中心用云需求在促進了云體系的標準化、云產(chǎn)業(yè)的日漸成熟以及相關(guān)技術(shù)水位不斷提升的同時,也教育和引導了用戶有更好的用云習慣和意愿。云原生理念基于集裝箱標準化改變世界的原理逐步的深入人心,可預見未來云原生必然會在邊緣發(fā)揮舉足輕重的標準化優(yōu)勢,因為沒有組織會不喜歡成本和效率的優(yōu)化?;谠圃姆椒ㄕ搧斫鉀Q邊緣分布式云服務的組織和全面云化的問題再合適不過。漫漫求索的過程中,阿里邊緣云原生體系建設(shè)的進程拉開帷幕。
那如何構(gòu)建邊緣云原生技術(shù)體系?過程中需要解決哪些問題?面對哪些挑戰(zhàn)呢?對云廠商來說,肯定是希望客戶都基于云原生的方式來用云,尤其在邊緣場景一方面由于環(huán)境和資源因素給管控和云化服務帶來了巨大的挑戰(zhàn)。另一方面從邊緣的各種垂直領(lǐng)域的場景需求輸入來說,我們所要面對的場景和需求極為復雜,難度極大。舉個資源異構(gòu)融合方面的例子,智能攝像頭、視圖設(shè)備可能需要用 GPU,而其他場景卻需要普通 CPU,可能同時還需要有存儲的支持,那如何面對幾十臺到上百臺的邊緣 IDC 提供超融合的算力服務,如何最大限度降低各種管控帶來的公攤,更多的出賣可靠的算力就是非常有挑戰(zhàn)的事情。這里的融合主要是超融合的邊緣基礎(chǔ) IaaS 服務以及云網(wǎng)雙側(cè)的服務融合,有以下核心問題要解決:- 如何通過超融合的 IaaS 技術(shù)完成邊緣基礎(chǔ)設(shè)施建設(shè);
- 如何通過統(tǒng)一的管控體系,將邊緣分布式、異構(gòu)的資源進行云化納管,對上基于云原生的方式提供全網(wǎng)、全域位置無感的 IPaaS(Infrastructure PaaS) 能力;
- 如何復用當前云原生技術(shù)體系,基于前面的 IPaaS 提供高效、可靠的服務管控和部署的 APaaS 能力;
- 如何將云網(wǎng)兩側(cè)的服務融合后為用戶提供更便捷、可靠的服務;
這里的協(xié)同,有通信、管控層面的協(xié)同,比如跨 IDC 協(xié)同,也有云和網(wǎng)的能力協(xié)同,比如網(wǎng)絡服務協(xié)同、云網(wǎng)資源協(xié)同等。下圖可以看到,中心云和邊緣云在資源屬性和節(jié)點屬性上的差異:邊緣機房往往單個規(guī)模相對較小,幾臺到上百臺不等,而且分布廣泛,天然分布式云架構(gòu);算力資源異構(gòu),通常針對不同場景有特定的硬件資源需求,邊緣 IDC 資源總量有限,往往多個云廠商此消彼長,所以多云資源的對接也是必由之路;網(wǎng)絡環(huán)境也不盡相同,有單線、多線,有經(jīng)典網(wǎng)絡有 VPC,還有些小運營商機房其網(wǎng)絡架構(gòu)往往完全定制化。單機房規(guī)模以及邊緣云總量的的限制就確定必須要在有限的資源條件提供融合的服務,比如計算和存儲往往也需要混池,就算是有獨立的存儲資源池,也需要同時提供塊、對象、NAS 等多種形態(tài)的存儲能力。所以在邊緣構(gòu)建超融合 IaaS 基礎(chǔ)設(shè)施是必然的選擇。
兩大問題域 ·融合 ?| ?計算、存儲、網(wǎng)絡、調(diào)度計算面的融合方面我們基于 Cloudlet 融合計算的方式實現(xiàn)在同一臺物流設(shè)備上同時提供裸金屬、虛機、安全容器等多種算力形態(tài)的服務。邊緣計算的產(chǎn)品和研發(fā)團隊,大部分都有CDN行業(yè)的經(jīng)驗,具備較強的緩存技術(shù)能力,但是對于邊緣計算來講,除了服務于應用互聯(lián)網(wǎng)和產(chǎn)業(yè)互聯(lián)網(wǎng),需要提供基于互聯(lián)網(wǎng)節(jié)點的低成本、分布式、多類型的存儲和緩存系統(tǒng),同時存儲數(shù)據(jù)的安全性也是要特別考慮的一點。當邊緣節(jié)點可以提供更多的計算能力的時候,如何讓用戶更容易使用邊緣計算服務,邊緣網(wǎng)絡能力是不可或缺的一部分,我們需要構(gòu)建一個云-邊-端協(xié)同邊緣計算網(wǎng)絡,支持多云協(xié)同(含與運營商MEC網(wǎng)絡協(xié)同)的能力,以透明的方式為用戶提供提供安全、可靠、加速、低成本的網(wǎng)絡服務。邊緣節(jié)點數(shù)量較多,分布較廣,如何做到算力的快速分發(fā)以及全網(wǎng)萬級節(jié)點鏡像秒級分發(fā)。
兩大問題域 ·融合 ?| ?云網(wǎng)融合 多云融合 MEC 與 5G 網(wǎng)絡對接5G 網(wǎng)絡在設(shè)計之處就考慮了對邊緣計算的支持,比如 MEC,用戶面、控制面分離與用戶面的靈活部署以及多種本地分流技術(shù)等等。開篇也提到 5G R17 新增獨立的邊緣計算相關(guān)協(xié)議規(guī)范的制定本身就從標準上確定了云網(wǎng)融合的大方向??深A見的未來云跟網(wǎng)必定是你中有我、我中有你的。當下隨著 5G 建設(shè)的推進,運營商也根據(jù) 5G 標準逐步開發(fā)了相關(guān)的 5G 開放能力 NEF。邊緣云側(cè)也在逐步開始嘗試與運營商的 MEC 資源對接。運營商也開始將 MEC 作為自身邊緣云服務的一部分對 B 端客戶提供相應計算服務。這其實是一個雙贏的局面,運營商通過與云的融合一來可以基于云計算集約、彈性、按需擴展等特性將過去依賴于硬件相對僵化的網(wǎng)絡資源盤活,同時將自身的資源優(yōu)勢與網(wǎng)的能力優(yōu)勢及價值基于云網(wǎng)融合發(fā)揮到最大化。云廠商通過對接運營商的資源和服務,為客戶提供了更低時延、更高保障的邊緣云服務。
兩大問題域 ·協(xié)同 ?| ?網(wǎng)絡協(xié)同邊緣云原生最基礎(chǔ)的分布式協(xié)同來自于天然的分布式環(huán)境,每個邊緣 IDC 都是一個邊緣的 Cloudlet 單元,管控過程中也可以將鄰近的多個獨立的 Cloudlet 整合為一個更大規(guī)模的 Cloudlet 統(tǒng)一管理。主要應對 Pod 跨 IDC 遷移;邊緣單節(jié)點脫網(wǎng),如何通過鄰近的節(jié)點回云或者與其它節(jié)點協(xié)同通信;阿里云邊緣云建設(shè)了較為豐富的網(wǎng)絡協(xié)同能力,從端邊、邊邊、邊云 全方位應對網(wǎng)絡協(xié)同帶來的各種問題和挑戰(zhàn)。從邊緣云原生生態(tài)的分布來看,我們希望邊緣云原生的管控是逐步去中心化的,盡管當前更多的實踐方式都是中心管控,邊緣自治。但從規(guī)模上看,長期的發(fā)展必然會導致邊緣巨大的規(guī)模足以輕松讓中心集中管控的模式不堪重負,所以起步階段就考慮去中心化的分布式云管控模式是明智之舉。而去中心化、單元化的分布式云管控將對分布式協(xié)同的提出更高要求。在不遠的未來,邊緣網(wǎng)格、分布式消息總線將是解決這一系列問題的核心技術(shù)。當邊緣計算節(jié)點越來越多,承載的用戶越來越多,不同的用戶在使用邊緣節(jié)點服務的時候也會提出更多的需求。除了提供的豐富算力之外,如何才能讓邊緣計算節(jié)點發(fā)揮更大的價值?云網(wǎng)一體化是邊緣云非常重要的技術(shù)點。云網(wǎng)的一體化主要表現(xiàn)在:一是對于位置的要求,本身邊緣云服務對位置是無感的,雖然客戶場景是位置強需求的,它一定是有位置屬性;二是對于節(jié)點間的協(xié)作是完全基于網(wǎng)絡。同時,邊緣云在層次上還承載了跟運營商的MEC節(jié)點,以及跟中心Region和本地Region之間的承接關(guān)系。這種承接關(guān)系、數(shù)據(jù)流向以及應用路徑的路由都是通過云網(wǎng)一體技術(shù)去實現(xiàn)的。網(wǎng)絡中單個節(jié)點都可以認為是不可信的或者是可以短時間下線的,這就需要云網(wǎng)一體化調(diào)度能力確保邊緣云節(jié)點服務的高可用性。阿里云擁有遍布全球2800+邊緣云節(jié)點,確??蛻魳I(yè)務能夠觸達全球用戶。通過對CDN做全面云化,CDN節(jié)點升級成邊緣云節(jié)點,客戶在使用原有CDN資源時可享受更多邊緣計算服務。在IaaS層面有標準的邊緣云節(jié)點服務ENS,它是一個小型的分布式云節(jié)點服務。邊緣云節(jié)點ENS底座提供了統(tǒng)一資源建設(shè)、統(tǒng)一資源庫存、統(tǒng)一對外資源交付能力,使各種應用場景能夠像使用統(tǒng)一操作系統(tǒng)一樣使用ENS資源。目前阿里云邊緣云節(jié)點服務上,已構(gòu)建了很多應用場景產(chǎn)品,包括CDN產(chǎn)品體系、云通信場景、視圖計算場景、云游戲以及跟合作伙伴共建的創(chuàng)新場景。
阿里云飛天強大的技術(shù)生態(tài)體系、云原生方向上多年的積累以及 CDN 十年磨一劍,更重要的是阿里云邊緣計算早早的行業(yè)布局與探索——CDN on ENS 以業(yè)務養(yǎng)平臺,以平臺養(yǎng)生態(tài)的戰(zhàn)略舉措,造就了這張飛天邊緣技術(shù)大圖。阿里云邊緣云構(gòu)建能力與行業(yè)解決方案
我們以邊緣云 IaaS 底座構(gòu)建的邊緣容器平臺作為底座,基于完全云原生的理念來構(gòu)建與中心云體驗無差別,滿足云原生標準的應用發(fā)布、管控 APaaS(Application PaaS) 體系?;谠圃?OAM 的應用管控模式,提供關(guān)注點分離,業(yè)務輕量的應用管理平臺服務,整體完成邊緣基礎(chǔ)設(shè)施的云化。為用戶提供了真正意義上的 EdgeNative 的邊緣應用托管服務。目前基于我們構(gòu)建的邊緣云原生技術(shù)體系已經(jīng)有許多內(nèi)部核心業(yè)務大規(guī)模驗證,這里跟大家分享幾個我認為比較有代表性的場景。
基于邊緣云 ENS 底座構(gòu)建的下一代云化 CDN。我們基于 CDN 云化的方式,為傳統(tǒng) CDN 場景補齊了隔離重保、資源復用的短板,同時也為業(yè)務創(chuàng)新打下堅實基礎(chǔ)。除此之外我們基于邊緣云原生體系拓寬了 CDN 的業(yè)務邊界,從最初的 Content 分發(fā),到如今定義為 Computing 計算分發(fā)網(wǎng)絡。為用戶提供了可編程 CDN 的核心服務能力,極大程度優(yōu)化了客戶用云成本,同時提升了業(yè)務創(chuàng)新的效率。行業(yè)解決方案 | 流量計算產(chǎn)品另一個比較有代表性的場景是流量計算新產(chǎn)品,我們基于 CDN 已有的全域統(tǒng)一接入調(diào)度能力,基于邊緣云原生底座構(gòu)建了強大的算力網(wǎng)絡。能夠做到秒級全網(wǎng)超大規(guī)模算力交付,算力按需使用,具備全網(wǎng)一致的體驗,且支持按量付費,極大程度提高了整體的資源利用效率,也降低了客戶的算力成本?;诎⒗镞吘壴茝V覆蓋、超大規(guī)模的邊緣基礎(chǔ)設(shè)施以及全域統(tǒng)一資源調(diào)度與接入調(diào)度能力,真正做到了算隨網(wǎng)動,以應對邊緣各種算力場景。
行業(yè)解決方案 | 數(shù)字孿生與智能終端上云對于具備播放能力而不具備算力的瘦客戶端,將原本需要在客戶端完成的渲染及強交互等功能移到云上,在邊緣云上完成渲染之后變成單視頻的播放和交互數(shù)據(jù)下發(fā)瘦終端即可。
在云游戲領(lǐng)域,邊緣云ENS解決云游戲落地的“最后1公里”,游戲應用上傳即完成全球邊緣云節(jié)點的部署,根據(jù)用戶分布就近處理數(shù)據(jù)請求。游戲分發(fā)時達到毫秒級指令生效,實現(xiàn)快速分發(fā)到邊緣。云游戲在邊緣進行計算、分析以及下發(fā)指令,真正做到業(yè)務的快速響應。
未來展望
邊緣云原生技術(shù)體系的構(gòu)建自下而上,從底層基礎(chǔ)設(shè)施,IaaS、IPaaS、APaaS 、邊緣服務能力層(EdgeMesh、邊緣應用托管、全域調(diào)度等)、邊緣能力開放層等,可以預見 5G 邊緣計算必然是共生共贏的關(guān)系,兩者不能割裂來看。尤其在邊緣場景越來越多,且往工業(yè)和產(chǎn)業(yè)縱深越來越深入的情況下,各種新的需求和場景在不斷涌現(xiàn)。大到元宇宙、具體到車路協(xié)同等垂直場景,都對邊緣計算提出了更高的要求。邊緣云原生技術(shù)體系下的安全性、穩(wěn)定性、全域性能調(diào)優(yōu)、云網(wǎng)融合、網(wǎng)隨云動等領(lǐng)域是重點突破的方向,基于云原生的理念真正高效解決好邊緣用云用網(wǎng)的問題將是我們接下來比較核心的工作。
