史上首次,強(qiáng)化學(xué)習(xí)算法控制核聚變登上Nature:DeepMind讓人造太陽(yáng)向前一大步
來(lái)源:機(jī)器之心
過(guò)去三年,DeepMind 和瑞士洛桑聯(lián)邦理工學(xué)院 EPFL 一直在進(jìn)行一個(gè)神秘的項(xiàng)目:用強(qiáng)化學(xué)習(xí)控制核聚變反應(yīng)堆內(nèi)過(guò)熱的等離子體,如今它已宣告成功。

第一階段:設(shè)計(jì)者為實(shí)驗(yàn)指定目標(biāo),可能伴隨著隨時(shí)間變化的控制目標(biāo);
第二階段:深度 RL 算法與托卡馬克模擬器交互,以找到接近最優(yōu)的控制策略來(lái)滿足指定目標(biāo);
第三階段:以神經(jīng)網(wǎng)絡(luò)表示的控制策略直接在托卡馬克硬件上實(shí)時(shí)運(yùn)行(零樣本)。
圣地亞哥能源研究中心的副研究科學(xué)家 Dmitri Orlov 表示,「托卡馬克裝置越復(fù)雜,性能越高,就越需要通過(guò)越來(lái)越高的可靠性和準(zhǔn)確性來(lái)控制更多數(shù)量?!笰I 控制的托卡馬克裝置可以通過(guò)優(yōu)化,以控制熱量從反應(yīng)中轉(zhuǎn)移到容器壁上,并防止破壞性的「等離子體不穩(wěn)定性」。反應(yīng)堆本身可以重新設(shè)計(jì),以利用強(qiáng)化學(xué)習(xí)所提供的更嚴(yán)格控制。
最終,Ambrogio Fasoli 認(rèn)為,與 DeepMind 的合作可以讓研究人員突破界限,加速通往聚變能量的漫長(zhǎng)旅程。人工智能將賦能我們探索人類無(wú)法探索的東西,因?yàn)槲覀兛梢允褂米约翰桓颐半U(xiǎn)的控制系統(tǒng)來(lái)達(dá)到目標(biāo)?!溉绻覀兇_定自己有一個(gè)控制系統(tǒng),讓我們接近極限但不會(huì)超出極限,則實(shí)際上可以用來(lái)探索那些不存在的可能性?!?/span>
參考鏈接:
https://www.wired.com/story/deepmind-ai-nuclear-fusion/
