豆包：視頻生成模型“VideoWorld”可僅靠視覺認知世界，現(xiàn)已開源

2025-02-10 13:13

2月10日消息，視頻生成實驗?zāi)Ｐ汀癡ideoWorld”由豆包大模型團隊與北京交通大學(xué)、中國科學(xué)技術(shù)大學(xué)聯(lián)合提出。不同于Sora 、DALL-E 、Midjourney等主流多模態(tài)模型，VideoWorld在業(yè)界首次實現(xiàn)無需依賴語言模型，即可認知世界。目前，該項目代碼與模型已開源。

瀏覽 7

點贊

收藏

分享

舉報

評論

圖片

表情

阿里云通義開源視覺模型Qwen2.5-VL

1月28日，阿里云通義開源視覺模型Qwen2.5-VL，共推出3B、7B和72B三個尺寸版本。據(jù)介紹，Qwen2.5-VL不僅擅長識別常見物體，如花、鳥、魚和昆蟲，還能夠分析圖像中的文本、圖表、圖標、圖形和布局。旗艦版Qwen2.5-VL-72B在13項權(quán)威評測中奪得視覺理解冠軍，全面超越GPT-4o與Claude3.5。

豆包實時語音大模型上線

1月20日，豆包實時語音大模型于正式推出，并在豆包APP全量開放。據(jù)介紹，豆包實時語音大模型，是一款語音理解和生成一體化的模型，實現(xiàn)了端到端語音對話。相比傳統(tǒng)級聯(lián)模式，在語音表現(xiàn)力、控制力、情緒承接方面表現(xiàn)驚艷，并具備低時延、對話中可隨時打斷等特性。

豆包大模型1.5正式發(fā)布

1月22日，火山引擎宣布，豆包大模型1.5正式發(fā)布，目前已全面上線火山方舟。

字節(jié)豆包大模型團隊提出稀疏模型架構(gòu)UltraMem

2月12日，據(jù)豆包大模型團隊消息，字節(jié)跳動豆包大模型Foundation團隊近期提出UltraMem，一種同樣將計算和參數(shù)解耦的稀疏模型架構(gòu)，在保證模型效果的前提下解決了推理的訪存問題。據(jù)介紹，該架構(gòu)有效解決了MoE推理時高額的訪存問題，推理速度較MoE架構(gòu)提升2-6倍，推理成本最高可降低83%。

聯(lián)想AI桌面助手接入豆包大模型

12月27日，在2024聯(lián)想天禧生態(tài)伙伴大會上，聯(lián)想宣布與火山引擎正式合作，其AI桌面助手如意（AI Stick），植入豆包大模型，可提供AI搜索、AI寫作、AI聊天三大AI新功能。

字節(jié)跳動豆包大模型團隊正式開源首個多語言類SWE數(shù)據(jù)集

4月10日，字節(jié)跳動豆包大模型團隊正式開源首個多語言類SWE數(shù)據(jù)集——Multi-SWE-bench，可用于評估和提升大模型“自動修Bug”能力。在SWE-bench基礎(chǔ)上，Multi-SWE-bench首次覆蓋Python之外的7種主流編程語言，是真正面向“全棧工程”的評測基準。其數(shù)據(jù)均來自GitHub issue，歷時近一年構(gòu)建，以盡可能準確測評和提高大模型高階編程智能水平。

視覺中國完成DeepSeek開源大模型接入與本地化部署

近日，視覺中國完成深度求索公司開源大模型DeepSeek-R1的接入與本地化部署，并在多個產(chǎn)品中深度應(yīng)用其能力，此舉標志著視覺內(nèi)容服務(wù)領(lǐng)域在AI技術(shù)應(yīng)用上的進一步升級。通過充分發(fā)揮“視覺數(shù)據(jù)和應(yīng)用場景”的核心優(yōu)勢，視覺中國正全面推進“視覺數(shù)據(jù)+AI技術(shù)+應(yīng)用場景”的戰(zhàn)略落地，推動其在圖片及音視頻數(shù)字版權(quán)交易、以及創(chuàng)作社區(qū)等多個領(lǐng)域的創(chuàng)新發(fā)展。

豆包正小范圍測試深度思考模型，但接入模型非DeepSeek

2月25日消息，字節(jié)跳動旗下AI助手豆包正在小范圍測試深度思考模型，但接入的不是DeepSeek模型。據(jù)豆包相關(guān)負責(zé)人表示，當前測試的是自己深度思考模型的不同實驗版本。據(jù)了解，在豆包對話頁面暫未顯示“深度思考”功能的入口，但被灰度到的用戶在詢問不同問題后，豆包生成的答復(fù)中會顯示思維鏈。

北京視覺世界科技有限公司

360兒童機器人是一款定位于親子互動的家庭智能陪伴機器人，有利于孩子心智成長、父母與孩子間的親子互動。它配備了智能語音助手，還具有人臉跟蹤識別、多方視頻通話、K故事、益智早教等多元化功能。

通義萬相升級：解決視頻生成模型復(fù)雜運動、物理定律遵循難題

1月9日消息，阿里云通義萬相推出萬相2.1視頻生成模型，在大幅度復(fù)雜運動、物理規(guī)律遵循、藝術(shù)表現(xiàn)等方面全面提升。根據(jù)權(quán)威評測榜單VBench的信息顯示，新版通義萬相登上榜首位置。

點贊

收藏

分享

舉報

波多野结衣一区二区三区国产精品 | 青青草人人操 | 青青草大香蕉在线 | 黑丝一区二区三区 | 欧美V亚洲V日韩v |