史上首次,強(qiáng)化學(xué)習(xí)算法控制核聚變登上Nature:DeepMind讓人造太陽向前一大步
過去三年,DeepMind 和瑞士洛桑聯(lián)邦理工學(xué)院 EPFL 一直在進(jìn)行一個神秘的項目:用強(qiáng)化學(xué)習(xí)控制核聚變反應(yīng)堆內(nèi)過熱的等離子體,如今它已宣告成功。




第一階段:設(shè)計者為實驗指定目標(biāo),可能伴隨著隨時間變化的控制目標(biāo);
第二階段:深度 RL 算法與托卡馬克模擬器交互,以找到接近最優(yōu)的控制策略來滿足指定目標(biāo);
第三階段:以神經(jīng)網(wǎng)絡(luò)表示的控制策略直接在托卡馬克硬件上實時運(yùn)行(零樣本)。




推薦閱讀
[深度文]YoloX部署、優(yōu)化、訓(xùn)練相關(guān)
寫的書太受歡迎怎么辦?北大《深度強(qiáng)化學(xué)習(xí)》作者:那就開放下載吧

評論
圖片
表情
