中國人工智能的發(fā)展為什么需要“根技術”?
點擊下方卡片,關注“新機器視覺”公眾號
重磅干貨,第一時間送達
當我們還是小學生的時候在暢想未來的作文中經(jīng)常會描寫到未來有會飛的汽車、幫助人們工作的機器人等等,在后來,文藝工作者將這種幻想具象化,并且搬上了大熒幕,就有了我們所熟知的科幻電影《終結者》、《機械姬》、《我,機器人》等等,無論在哪一個階段人工智能、機器人都是我們對未來暢想的關鍵詞。
至少自公元前一世紀開始,人類就對制造機器模擬人腦的可行性充滿興趣。到了現(xiàn)代,John McCarthy 在1955 年創(chuàng)造了“人工智能”這個詞語。1956 年,McCarthy等人組織了一場名為“達特茅斯學院夏季人工智能科研項目”的會議。以此為開端,機器學習、深度學習、預測性分析應運而生。在邁向現(xiàn)代的過程中人工智能幾經(jīng)沉浮,直到2016年一場人工智能與人類圍棋高手李世石的大戰(zhàn),人類方慘敗,將人工智能再度拉回人們的視線,并且迅速成為最炙手可熱的新興技術。
三大要素構筑人工智能基礎
中國、美國、日本、歐盟等主要經(jīng)濟體都不約而同將人工智能視為引領未來的戰(zhàn)略技術,是新一輪產(chǎn)業(yè)變革的核心驅(qū)動力。特別是隨著數(shù)字經(jīng)濟等新興產(chǎn)業(yè)蓬勃發(fā)展,將推動互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實體經(jīng)濟深度融合。毫無疑問,人工智能作為一種全新的技術形式,為平臺經(jīng)濟賦能、提高資源配置效率,暢通要素流通渠道具有重要意義,也將會對人類社會產(chǎn)生深遠的影響。
不過,我們現(xiàn)實中的人工智能技術當然不像影視作品里所表現(xiàn)的神乎其神,在當前的技術體系下,業(yè)內(nèi)普遍認為算力、算法、算據(jù)三大要素構筑了人工智能的基礎,這三個要素缺一不可,相互促進、相互支撐。

目前,人工智能技術已經(jīng)從最初的互聯(lián)網(wǎng)領域滲透到生活中的方方面面,例如智慧城市建設,工業(yè)智能化等等,更加廣泛的人工智能使用就需要更加厚實的人工智能基礎。從整個人工智能的發(fā)展趨勢來看,未來社會發(fā)展過程中的產(chǎn)生的文本、圖片、語音等非結構化數(shù)據(jù)是主要的算據(jù)來源;算法是對這些算據(jù)進行處理的策略機制;而對這些數(shù)據(jù)的處理主要依靠人工智能算力,算力就是生產(chǎn)力,人均算力水平?jīng)Q定了整個數(shù)字經(jīng)濟發(fā)展水平。如果說前幾次工業(yè)革命的核心在于蒸汽機、電力、互聯(lián)網(wǎng),那么在智能時代的工業(yè)革命主要就將依靠人工智能算力。
可以說,算據(jù)決定著數(shù)字經(jīng)濟發(fā)展的深度,算法決定了數(shù)字經(jīng)濟發(fā)展的質(zhì)量和高度,而算力決定著數(shù)字經(jīng)濟發(fā)展的廣度和速度。
人工智能發(fā)展“根技術”
大眾對于人工智能的熟知在于應用層面,比如AI的語言識別,各種數(shù)字人等等。但是在專業(yè)人士眼中,要想發(fā)展好人工智能可不能只盯著這些應用層面的繁榮,更需要著重發(fā)展好人工智能的“根技術”。
就像在計算機發(fā)展過程中需要有硬件層、系統(tǒng)軟件層、應用軟件層一樣,人工智能的發(fā)展也遵循了類似的層次結構。人工智能發(fā)展也需要芯片這樣的基礎硬件,同樣需要AI框架這樣的基礎軟件,最終才會有我們普通人看到的形形色色的人工智能應用。如果沒有這些基礎的支持,就沒有辦法完成整個應用的開發(fā),我們的人工智能發(fā)展就會成為無源之水。所以基礎軟硬件就是發(fā)展人工智能的“根技術”。
在基礎硬件層面,國內(nèi)不乏像華為昇騰這樣性能優(yōu)異的覆蓋全場景的系列AI處理器,隨即更多的AI企業(yè)如百度寒武紀、地平線、清微智能等也陸續(xù)推出創(chuàng)新型AI芯片。
而在軟件層面上,人工智能領域中的AI框架是基礎軟件,也被稱為“AI領域的操作系統(tǒng)”,定位和Windows、安卓等操作系統(tǒng)類似,是連接數(shù)據(jù)、算法和算力等人工智能要素的關鍵一環(huán),其下接芯片,上承應用,所有人工智能的算法及應用都要通過深度學習框架進行訓練與部署,其重要性不言而喻。
目前,業(yè)界以Google的TensorFlow,和Meta的PyTorch兩款AI框架起步早、發(fā)展快,占據(jù)了業(yè)界主導地位。如果我們不發(fā)展出自己的AI框架,并且在此基礎上培育產(chǎn)業(yè)生態(tài),在人工智能領域的核心競爭力就依舊會受制于人。
AI框架中的“深度學習框架”被列入“新一代人工智能”領域,成為國家重點支持的前沿創(chuàng)新技術。當前,中國人工智能企業(yè)開發(fā)的AI框架在社區(qū)繁榮度、開發(fā)者數(shù)量等方面還存在一定差距。但是中國的AI框架也更了解中國產(chǎn)業(yè)的發(fā)展特點。一方面,中國AI框架不斷扎根實際應用場景,牢牢抓住了開發(fā)者和企業(yè)智能化升級的需求,降低人工智能技術的應用門檻。另一方面,中國AI與更多芯片廠商深度適配并融合,形成了軟硬協(xié)同優(yōu)勢。
例如,作為昇騰AI基礎軟硬件的核心之一——全場景AI框架昇思MindSpore在初始架構設計時,就考慮了大模型和AI+科學計算的發(fā)展趨勢,因此原生支持大模型以及AI+科學計算。大模型方面,昇思通過業(yè)界領先的自動并行能力,加速大模型開發(fā),實現(xiàn)開發(fā)并行代碼量降低80%、系統(tǒng)調(diào)整時間下降60%。目前,已成功開發(fā)出全球首個中文NLP大模型鵬程.盤古、全球首個三模態(tài)大模型紫東.太初、全球首個遙感影像智能解譯深度學習專用框架武漢.LuojiaNet等;此外,昇思MindSpore聯(lián)合伙伴成立了“多模態(tài)人工智能產(chǎn)業(yè)聯(lián)盟”和“智能遙感開源生態(tài)聯(lián)盟”,積極孵化行業(yè)應用,開創(chuàng)了科研創(chuàng)新到產(chǎn)業(yè)落地的新模式。
AI+科學計算方面,昇思完成了AI計算框架向AI融合框架的演進,通過神經(jīng)網(wǎng)絡的降維擬合,讓科學家無需再解高維方程,提升科技創(chuàng)新效率。布局制造、制藥、航天等8大領域AI+科學計算應用,加速產(chǎn)業(yè)落地效率?;诖?,昇思已成功發(fā)布AI電磁仿真套件MindSpore Elec、AI生物計算套件MindSpore SPONGE。
目前國內(nèi)AI框架發(fā)展,除了昇思(MindSpore)之外,還有百度的飛槳平臺、曠視的工業(yè)級深度學習框架天元(MegEngine),一流科技的OneFlow。這些國產(chǎn)AI 框架正在讓AI應用變得更簡單?;贏I框架,企業(yè)可以根據(jù)自身行業(yè)的特點和場景需要,更快更便捷地開發(fā)AI應用,不再需要從0到1地搭建地基,極大提升了產(chǎn)業(yè)智能化的效率和水平。
特別是對于中小企業(yè)來說,企業(yè)進行數(shù)字化變革有著人工智能能力使用的需求,但是又不具備芯片和框架的研發(fā)能力。如果依靠傳統(tǒng)的人工智能發(fā)展模式,顯然壁壘極高。因而,面對數(shù)字經(jīng)濟發(fā)展的新形勢,我國主要采用政府主導的人工智能計算中心,通過提供普惠AI算力,牽引區(qū)域人工智能產(chǎn)業(yè)落地,發(fā)展本土人工智能生態(tài)。本著高質(zhì)量和集約化建設的原則,全國多個城市規(guī)劃建設人工智能計算中心,深圳、武漢、成都、西安、中原、南京等人工智能計算中心已建成使用中。
2021年9月,深圳、武漢、西安、成都、北京、上海等21個城市共同點亮了“人工智能算力網(wǎng)絡”,通過“算力網(wǎng)絡”實現(xiàn)“算力、數(shù)據(jù)、生態(tài)”三匯聚,使AI算力與水、電一樣成為城市基礎設施的一部分,在大算力與大數(shù)據(jù)的結合下,進一步通過使能AI算法、模型和工具創(chuàng)新,來達到孵化新型AI應用、推動AI產(chǎn)業(yè)發(fā)展的目的,為東數(shù)西算工程的實施奠定了良好基礎。
人工智能生態(tài)培育
此外,影響人工智能發(fā)展的一大核心要素就是人才。從中小學生到高校到社會開發(fā)者的“全學段”,和重構各行各業(yè)的“全面覆蓋”的人工智能人才培養(yǎng)體系,已經(jīng)成為各國AI人才培養(yǎng)戰(zhàn)略競爭的焦點。與此同時,更精準、更細分的AI人才培養(yǎng)‘分化’模式也成為當前主流趨勢。
在人才培養(yǎng)方面,華為聯(lián)合各高校和出版社在教材教輔書籍、算子、模型眾籌等領域同步開展合作,已完成《昇騰AI處理器架構與編程》和《深度學習與MindSpore實踐》等數(shù)本合作教輔的編寫及出版,同時與相關出版社進行人工智能系列教材合作,相關課程已經(jīng)覆蓋72所高校的超過10萬名學生,百度等企業(yè)也在開展類似高校合作。
隨著當前中國產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的不斷深入,中國深度學習框架的生態(tài)布局正在工業(yè)、交通、能源、城市等千行百業(yè)“開花結果”。公開數(shù)據(jù)顯示,僅是昇騰AI的技術和商業(yè)生態(tài)就已初具規(guī)模,截至目前,昇騰AI合作伙伴已經(jīng)超過500家,共同孵化聯(lián)合解決方案900多個。
隨著東數(shù)西算工程的實施,人工智能算力網(wǎng)絡讓各區(qū)域共享資源、促進AI技術生態(tài)和商業(yè)生態(tài)發(fā)展,加速科學新發(fā)現(xiàn)、推動應用新場景、發(fā)現(xiàn)產(chǎn)業(yè)新方向、孵化發(fā)展新理念,為數(shù)字經(jīng)濟發(fā)展提供源源不竭的動力。
本文僅做學術分享,如有侵權,請聯(lián)系刪文。
