豆包:視頻生成模型“VideoWorld”可僅靠視覺認知世界,現(xiàn)已開源
2025-02-10 13:13
2月10日消息,視頻生成實驗?zāi)P汀癡ideoWorld”由豆包大模型團隊與北京交通大學(xué)、中國科學(xué)技術(shù)大學(xué)聯(lián)合提出。不同于Sora 、DALL-E 、Midjourney等主流多模態(tài)模型,VideoWorld在業(yè)界首次實現(xiàn)無需依賴語言模型,即可認知世界。 目前,該項目代碼與模型已開源。
瀏覽
7評論
圖片
表情
視頻
全部評論
