4 月 16 日,騰訊正式發(fā)布并開源混元 3D 世界模型 2.0( HY-World 2.0)。HY-World 2.0 是一個多模態(tài)世界模型,能夠理解文字、圖片、視頻等不同類型輸入,自動生成、重建和模擬 3D 世界,同時支持多格式 3D 資產(Mesh/3DGS/ 點云等)導出,可以與現(xiàn)有的游戲工作流無縫對接,用于快速生成游戲地圖和關卡原型。

混元世界模型 2.0 讓 AI 從 " 對話 "、" 畫圖 "、" 捏物體 ",進化到了 " 造世界 " ——包含人、物、景的完整世界。不同于谷歌的 Genie 3 和混元世界模型 1.5 僅能生成視頻文件,世界模型 2.0 的實用性更進一步:它可以直接生成可二次編輯的 3D 資產文件,這些生成的 3D 資產可以直接導入到游戲制作或者具身仿真引擎,實現(xiàn)真正可玩、可用。
目前,世界模型 2.0 已經上線至騰訊混元 3D 創(chuàng)作引擎官網,用戶可以申請使用。(申請使用地址:https://3d.hunyuan.tencent.com/sceneTo3D)

實機演示:輸入 " 生成一個日式 RPG 風格的中世紀地牢 ",即可生成一個 3D 空間資產

實機演示:輸入 " 生成一個溫馨的繪本風格小木屋 ",游戲角色可以自由穿行在生成的 3D 場景中
所有內容均為 3D 文件,且全部由 HY-World 2.0 大模型一鍵生成
混元世界模型 2.0 支持文、圖、視頻多種輸入。輸入一段文字或一張圖片,模型即可精準解析復雜語義,一鍵生成風格多樣的可漫游世界。相比較混元世界模型 1.0,2.0 的模型架構全面升級,畫面精細度和真實感大幅提升。用戶還可以自定義風格,按需生成真實風、漫畫風、游戲風的 3D 空間。生成完成后,用戶可以將資產導入到 Unity、UE 等引擎、進行二次編輯,顯著降低了游戲地圖的創(chuàng)作門檻。

模型還支持角色模式,用戶可以操作角色在街道、建筑、場景中自由探索,不限時間,具有物理碰撞,就像在游戲里一樣。

同時,世界模型 2.0 支持復刻真實 3D 場景,用戶輸入一段真實空間的視頻或者多視角圖片,模型就能構建出高精度的數(shù)字孿生空間。基于升級后的 WorldMirror 2.0 架構,模型支持任意尺寸圖像與視頻輸入,一次性預測密集點云、多視角深度圖、表面法線及相機參數(shù) ,一次生成永久可復用。未來,室內裝修預覽、城市規(guī)劃、文化遺產保護等場景,都可以基于這一能力實現(xiàn)快速構建和還原。

混元世界模型 2.0 以 3D 為主軸,通過統(tǒng)一空間理解、生成、重建的架構,實現(xiàn)了 SOTA 級的生成效果。與其他世界模型相比,混元世界模型 2.0 在場景完整度(物體側面和背面)以及對輸入圖片的遵循程度表現(xiàn)更優(yōu)?;煸傻?3DGS 與 Mesh 的混合表征,也讓用戶能夠開啟角色模式進行有真實物體碰撞的交互。
混元世界模型(HY-World 系列)自發(fā)布以來就在持續(xù)進化:從首個開源的 3D 世界模型 HY-World 1.0 ,到可實時在線交互的 HY-World 1.5 ,再到一鍵生成 3D 空間資產的 HY-World 2.0,騰訊混元的 3D 世界模型正在一步步將 "AI 造世界 " 從概念變?yōu)楝F(xiàn)實。
2025 年下半年以來,騰訊引入多位高級人才、加快研發(fā)架構升級、持續(xù)加大混元大模型研發(fā)效率,并取得了顯著成果。2025 年 12 月,混元發(fā)布大語言模型 2.0 版本,推理能力與效率居國內頂尖行列;智能水平更高的新模型 HY3 也在內部業(yè)務測試中,在元寶 App 測試中獲得明顯正向收益。此次混元世界模型 2.0 發(fā)布,是混元在多模態(tài)領域的又一突破。
雷峰網