計算三大變化,帶來了哪些紅利?

11月11日,蘋果公司推出三款新的Mac電腦——MacBook Air、13英寸MacBook Pro和Mac Mini。這些新電腦首次采用了蘋果自己的處理器M1,而非已經(jīng)應(yīng)用了15年的英特爾處理器。
無獨有偶,英特爾在10月公布的第三季度財報顯示,在收入和每股收益方面表現(xiàn)平平。第三季度收入為183億美元,同比下降4.6%,最顯著的一個變化是云服務(wù)器芯片的訂單正在放緩。
因為在自己的智能手機iPhone上采用自己的芯片,蘋果實現(xiàn)了商業(yè)利益的最大化。而這次在MAC上棄用英特爾的處理器的最大一次變革,預示著ICT領(lǐng)域,一場涉及面甚廣的計算變革正在積極推進。

異構(gòu)計算,沒有一成不變
目前英特爾、AMD主導的企業(yè)計算,正在遭遇Arm、RISC-V和IBM POWER指令集所形成的巨大生態(tài)力量的挑戰(zhàn)。
在桌面電腦、服務(wù)器甚至云計算領(lǐng)域,英特爾和AMD苦戰(zhàn)幾十年。在2000年,英特爾和AMD占領(lǐng)了PC/服務(wù)器處理器的幾乎所有市場。
之后AMD通過其Opteron處理器體系結(jié)構(gòu),將64位指令引入x86指令集。英特爾隨后在其核心處理器體系結(jié)構(gòu)和至強產(chǎn)品中添加了AMD 64(現(xiàn)在為x86-64)指令。此后,AMD在2008-2018年期間將大部分服務(wù)器處理器市場份額拱手送給了英特爾。
目前,超過90%的云基礎(chǔ)架構(gòu)即服務(wù)(IaaS)實例類型都基于Intel Xeon處理器。
AMD和Intel目前是唯一獲得交叉許可以使用彼此的重要x86-64專利的服務(wù)器處理器供應(yīng)商。構(gòu)建現(xiàn)代的x86-64服務(wù)器處理器需要獲得AMD和Intel的專利。
幾年前,Arm認為,相比x86指令集,它將獲得重要的市場份額。Arm的業(yè)務(wù)模式是將Aarch64指令集許可給設(shè)計自己的服務(wù)器處理器的公司。
獲得許可的Arm服務(wù)器處理器越來越多,如Ampere的eMAG,AWS Graviton,華為的鯤鵬Kunpeng,以及Marvell的ThunderX。在萬物互聯(lián)時代,這些企業(yè)看中是ARM系統(tǒng)在性能和功耗方面具有獨特的優(yōu)勢
2019年1月華為發(fā)布Kunpeng 920新芯片組,旨在進入數(shù)據(jù)中心,并將為公司的泰山TaiShan服務(wù)器提供處理器。
華為的鯤鵬處理器由自己設(shè)計,基于由ARM創(chuàng)立的芯片組架構(gòu),ARM是總部設(shè)在英國,現(xiàn)在由軟銀控制。華為表示,配備有Kunpeng 920的新服務(wù)器旨在幫助處理和存儲大量數(shù)據(jù)。
ARM憑借其處理器 IP一直是移動設(shè)備處理器的主要供應(yīng)商,但最近幾年卻試圖進入服務(wù)器和云市場。當然,華為并不是唯一一家擁有用于服務(wù)器的7納米處理器的公司。在服務(wù)器領(lǐng)域,華為已經(jīng)成為了英特爾和NVIDIA等的競爭對手。
Kunpeng 920也不是華為首款7nm處理器。該公司擁有為自己的手機設(shè)計的麒麟Kirin 980和為處理在云中運行的人工智能應(yīng)用程序而創(chuàng)建的昇騰Ascend 910。Ascend 910還可用于數(shù)據(jù)中心,但其功能與新的鯤鵬Kunpeng 920不同。

為了獲得AMD和Arm都在嘗試的IaaS市場份額,RISC-V將必須展示企業(yè)級質(zhì)量和云工作負載性能價值。但是RISC-V目前仍處于早期的開發(fā)階段,相信目前還不會成為云數(shù)據(jù)中心部署的成熟競爭者。
為了生存,IBM將其POWER指令集免費提供給開源世界。顯然,IBM的POWER9是企業(yè)級服務(wù)器處理器。IBM出色地啟動了OpenPOWER Foundation,該基金會為POWER9創(chuàng)建了云服務(wù)器供應(yīng)鏈生態(tài)系統(tǒng)。
Google在過去幾年展示了基于OpenPOWER的POWER9云服務(wù)器。Google Cloud是否將POWER9部署到其公共IaaS中,其他云服務(wù)商會跟隨,目前在不得而知。
另外,創(chuàng)建可行的x86服務(wù)器處理器所需的許多專利已經(jīng)過期或即將過期。自從AMD設(shè)計出AMD 64和Opteron處理器以來已20年英特爾的Pentium 4和SSE指令集始于1998年,并于2000年末投入市場。
AMD于2003年春季使用Intel的Pentium 4 32位指令集,AMD的AMD 64 64位指令集擴展和Intel的SSE2多媒體指令集擴展,推出了其Opteron處理器體系結(jié)構(gòu)。利用今天即將到期的知識產(chǎn)權(quán)的組合,可使新進入市場的公司繞開Arm、RISC-V和POWER指令集所面臨的軟件生態(tài)系統(tǒng)挑戰(zhàn)。
要記住,專利的有效期是基于專利的申請日期,通常是在產(chǎn)品發(fā)布之前。
驗證是任何處理器指令集軟件生態(tài)系統(tǒng)增長的最大驅(qū)動力。從操作框架和應(yīng)用程序開發(fā)的角度來看,所有聲稱與指令集兼容的處理器實際上必須兼容。AMD和英特爾擁有令人印象深刻的x86-64驗證套件,但在數(shù)據(jù)中心領(lǐng)域,這主要是為了解決三十年來與傳統(tǒng)企業(yè)操作系統(tǒng)和應(yīng)用程序的兼容性問題。云部署可能會指定一個輕得多的驗證套件,從而降低了新的x86-64服務(wù)器處理器進入者的門檻。
盡管沒有公開的跡象表明,有公司會設(shè)計基于x86-64的新處理器內(nèi)核,但設(shè)計和驗證新的服務(wù)器處理器內(nèi)核體系結(jié)構(gòu)大約需要三到四年的時間。這意味著無論基于x86-64、Arm Aarch64、POWER9還是RISC-V,現(xiàn)在都應(yīng)該為2022年服務(wù)器處理器產(chǎn)品的發(fā)布進行開發(fā)。
計算多樣化,通用計算與AI計算共同發(fā)展
在通用計算CPU橫行天下多年之后,GPU(圖形處理單元)主導的并行計算因為AI應(yīng)用開始變得流行,讓通用計算與AI計算共同發(fā)展。
在AI計算方面,參與者越來越多,未來會有更多的好消息。
英偉達在并行處理方面已有24年歷史,其無處不在的CUDA平臺的發(fā)展使該公司具有獨特的優(yōu)勢。數(shù)以億計的自動駕駛汽車和數(shù)萬億個物聯(lián)網(wǎng)設(shè)備,為英偉達NVIDIA的GPU產(chǎn)品創(chuàng)造了巨大的市場機會。
我們已經(jīng)看到,使用NVIDIA的Volta AI平臺進行機器學習的所有主要云/超大規(guī)模OEM以及Oracle和SAP等主要企業(yè)供應(yīng)商,都普遍采用GPU。
人工智能是GPU的殺手級應(yīng)用。分析師統(tǒng)計,目前全球500強超級計算機中只有15個使用GPU芯片。在未來五年中,這些超級計算機中的100%將通過GPU加速。

在AI服務(wù)器上,中國服務(wù)器和云計算公司浪潮在性能和市場份額上都有上佳的表現(xiàn)。
最近公布結(jié)果顯示,在AI基準測試MLPerf中,浪潮的AI服務(wù)器NF5488A5創(chuàng)下18項性能記錄;在SPC-1基準評測報告中,浪潮存儲平均100美金可以購買到13198 個IOPS的性能,刷新了榜單全球最優(yōu)成績。
此外,在IDC公布的中國AI加速計算報告中,浪潮AI服務(wù)器2020年上半年的銷售額達6.88億美元,市場份額達53.5%,拿下中國AI服務(wù)器的半壁江山。
根據(jù)浪潮信息相關(guān)資料,在服務(wù)器的發(fā)展中,摩爾定律已經(jīng)出現(xiàn)衰退,增長從主頻增長變成核數(shù)增長,即將對超算領(lǐng)域的提升產(chǎn)生制約。浪潮判斷,異構(gòu)加速計算會成為未來進步的方向。
恰在此后,英偉達開發(fā)出NVLink,用來連接高速GPU形成性能更強的計算系統(tǒng)。當時所有服務(wù)器廠商都對此抱有質(zhì)疑的態(tài)度,認為這個技術(shù)沒什么用,并且因為要求高帶寬和低延遲,技術(shù)難度頗高。但浪潮看準方向,在全球第一個開始研發(fā)基于NVLink高速AI服務(wù)器,上市后獲得客戶市場認可。
2018年華為正式發(fā)布兩款AI芯片:采用7nm工藝制程的昇騰910,以及12nm工藝制程的昇騰310。
2019年,華為又推出了全場景AI計算框架MindSpore。這些AI基礎(chǔ)軟件平臺實現(xiàn)了極簡易用、極致性能。這讓小的傳統(tǒng)企業(yè)能夠基于華為的全棧平臺,能以少代碼,甚至不開發(fā)代碼也能充分利用AI能力。
2018年阿里巴巴達摩院發(fā)布了一種名為Ali-NPU的AI芯片,該芯片將通過其公共云供任何人使用。此舉旨在增強阿里云的AI實力,促進行業(yè)AI應(yīng)用的發(fā)展。
與阿里巴巴的做法類似,Google的母公司Alphabet自2015年以來,內(nèi)部的工程師一直在使用Google的定制張量處理單元(TPU)來加速自己的機器學習任務(wù)。2019年Google宣布了可以處理更具挑戰(zhàn)性的計算工作的第二代TPU,并于今年2月開始讓公眾可以通過云使用第二代TPU。
Google認為,第二代Google AI芯片可以代替Nvidia等公司的圖形處理單元使用,它不僅可以訓練AI模型,還可以完成更多工作。
至少與Nvidia在數(shù)據(jù)中心的GPU業(yè)務(wù)相比,阿里巴巴和Google AI芯片計劃目前仍處于起步階段。
實際上,Google和Nvidia仍然是合作伙伴,Nvidia的GPU與TPU一起仍可在Google云中使用。當然,阿里巴巴還通過其云提供了Nvidia GPU,并將在Ali-NPU推出后繼續(xù)這樣做。
很明顯Facebook也正在探索AI芯片開發(fā)。英特爾去年曾表示,正在與Facebook合作開發(fā)AI新芯片。
Facebook的AI芯片可能改善內(nèi)部研究人員的操作,并提高系統(tǒng)的效率,以供數(shù)十億使用該公司應(yīng)用的用戶提高效率。
同時,蘋果在高端iPhone X手機的芯片中內(nèi)置了“神經(jīng)引擎”元素。微軟正在為其下一個版本的HoloLens混合現(xiàn)實耳機開發(fā)AI芯片。特斯拉一直在為其車輛開發(fā)AI芯片。
計算生態(tài)正在悄悄變化
據(jù)中國軟件網(wǎng)觀察,在計算領(lǐng)域,傳統(tǒng)的WinTel聯(lián)盟體系,X86+linux聯(lián)盟體系,甚至蘋果和英特爾組成生態(tài)體系等,都正發(fā)生悄悄的變化。
在計算生態(tài)中,最大的變化當屬國產(chǎn)自主創(chuàng)新生態(tài)體系日益壯大。
華為在2019年宣布“硬件開放、軟件開源、使能合作伙伴”,意在創(chuàng)建基于鯤鵬、升騰的計算生態(tài)體系。
華為計算產(chǎn)品線總裁鄧泰華的話直截了當:“鯤鵬、昇騰提供多樣性算力、擁抱全棧創(chuàng)新、與合作伙伴、開發(fā)者朋友們一起,持續(xù)打造計算產(chǎn)業(yè)生態(tài),讓每一位開發(fā)者的智慧匯聚成全生態(tài)創(chuàng)新,共同點亮多樣性計算新時代”。
在今年HUAWEI CONNECT 2020期間,華為宣布向業(yè)界全面開放鯤鵬全棧、昇騰全棧、發(fā)布分布式多樣性計算軟件套件,加速產(chǎn)業(yè)創(chuàng)新,使能極簡開發(fā),與業(yè)界伙伴攜手,共贏計算新時代。
華為開放主板和部件,使能硬件伙伴打造自有品牌整機產(chǎn)品,全面共享能力,堅持伙伴優(yōu)先,在2020年6月,伙伴服務(wù)器出貨量已超過華為自有品牌;
華為如期開源openEuler、openGauss、openLooKeng和MindSpore,軟件伙伴基于開源版本陸續(xù)推出商用發(fā)行版并在關(guān)鍵行業(yè)和項目商用;
華為全方面使能合作伙伴,鯤鵬、昇騰開發(fā)者已超過30萬,合作伙伴超過1000家,完成兼容性認證的解決方案超過3000個。
萬物互聯(lián)的智能時代,算力需求爆炸式增長,單純依靠芯片工藝進步帶來的算力提升,已不能滿足需求,須進行計算體系的架構(gòu)創(chuàng)新。華為的創(chuàng)新就是從通用計算走向通用計算加異構(gòu)計算的多樣性算力創(chuàng)新,和從硬件到基礎(chǔ)軟件,到應(yīng)用使能的全棧協(xié)同創(chuàng)新。

在國產(chǎn)計算生態(tài)方面,PK體系進展神速?!癙K體系”是一個基礎(chǔ)的、先進的、開放的架構(gòu)組合。
飛騰“Phytium處理器”,是中國電子自主設(shè)計兼容ARM V8指令集的處理器芯片產(chǎn)品。麒麟Kylin操作系統(tǒng)也是中國電子自主開發(fā)的國產(chǎn)操作系統(tǒng)。它支持云計算、虛擬化、大數(shù)據(jù)等先進應(yīng)用并與飛騰CPU深度適配。
PK體系是兼容移動、云、(虛擬化)、大數(shù)據(jù)和物聯(lián)網(wǎng)、人工智能等各項新技術(shù)的產(chǎn)品組合生態(tài)。
“PK體系”聚合國內(nèi)產(chǎn)學研領(lǐng)域400多家核心企業(yè),共同開展關(guān)鍵技術(shù)攻關(guān)和公共技術(shù)服務(wù),形成豐富的辦公和事務(wù)處理類應(yīng)用生態(tài)體系,目前已在國家部委、中央企業(yè)、地方政府等重要行業(yè)領(lǐng)域信息化建設(shè)中實現(xiàn)數(shù)萬套規(guī)模應(yīng)用。
通過聯(lián)合兄弟央企,打造CPU和操作系統(tǒng)聯(lián)合創(chuàng)新實驗室,推動PK體系在國家重要行業(yè)領(lǐng)域廣泛應(yīng)用;通過聯(lián)合地方政府,建成了包括長沙中電軟件園在內(nèi)的35家產(chǎn)業(yè)園區(qū),構(gòu)建了年營業(yè)收入超過6000億元的大生態(tài)。
據(jù)介紹,“PK體系”對接國際ARM服務(wù)器標準與軟件領(lǐng)域企業(yè),與 Google、微軟、戴爾等在技術(shù)標準領(lǐng)域,與Linaro、紅帽等在ARM全球開源生態(tài)領(lǐng)域,與SAP、IBM等在企業(yè)級應(yīng)用領(lǐng)域展開全面合作。基于“PK體系”的生態(tài)建設(shè),已成為國際ARM生態(tài)體系的重要支撐。
國產(chǎn)自主計算生態(tài)的發(fā)展,讓計算自主可控落地,產(chǎn)生效益和價值。
