昆仑万维发布并开源 Matrix-Game 2.0 与 Matrix-3D 模型,深耕交互式世界模型领域
2025-08-12 10:07:30
来源:IT之家
8 月 12 日消息,昆仑万维 SkyWork AI 技术发布周于 8 月 11 日正式启动,活动将连续五天每天发布一款模型,覆盖多模态 AI 核心场景。
在首日,昆仑万维带来了自研世界模型 Matrix 系列中 Matrix-Game 交互世界模型的升级版本 ——「Matrix-Game 2.0」,该模型号称实现了通用场景下的交互式实时长序列生成。为促进交互式世界模型领域的发展,「Matrix-Game 2.0」全面开源,堪称业内首个在通用场景上实现实时长序列交互式生成的世界模型开源方案。
「Matrix-Game 2.0」在实时生成和长序列能力上实现了 “质的飞跃”。相较于上一版本,2.0 版本更侧重低延迟、高帧率的长序列交互性能,能够以 25 FPS 的速度,在多种复杂场景中稳定生成连续视频内容,且生成时长可扩展至分钟级,大幅提升了内容的连贯性与实用性。
值得一提的是,在推理速度显著提升的同时,模型依然保持了对物理规律与场景语义的 “精准理解”,支持用户通过简单指令,自由探索、操控并实时构建结构清晰、细节丰富、规则合理的虚拟环境。
除了 Matrix-Game 2.0.昆仑万维还开源了 Matrix-3D 大模型。该模型能从单图像出发,生成高质量、轨迹一致的全景视频,并直接还原可漫游的三维空间,对标李飞飞 WorldLabs 的生成效果,可实现更大范围的探索空间。
Matrix-3D 由以下核心部分组成:
轨迹引导的全景视频生成模块:利用场景 Mesh 渲染图作为条件输入,训练视频扩散模型生成符合给定相机轨迹的全景视频。这一模块能提升生成视频在空间结构上的一致性,缓解遮挡错误与图像伪影问题。
双路径可选择的全景 3D 重建模块:包含优化路径和前馈网络路径。优化路径会对生成的视频进行超分与 3DGS 优化,以获取高质量 3D 结构;前馈网络路径则基于 Transformer 直接回归,从生成视频 Latent 特征快速预测 3D 几何属性,实现高效重建。
Matrix-Pano 数据集:这是一个大规模高质量合成数据集,包含 116K 条带有相机轨迹、深度图和文本注释的静态全景视频序列。
此次两款模型的发布与开源,不仅展现了昆仑万维在 AI 多模态领域的技术实力,也为相关领域的开发者提供了有力的工具支持,有望推动交互式世界模型技术的进一步发展与应用落地。
【版权提示】间距离倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至 1069823586@qq.com,我们将及时沟通与处理。
猜你喜欢
听见爱,听见美好 | 听力关爱公益行动
声音,是世界赠与我们的温柔拥抱。由上海耀中外籍人员子女学校发起、安湃声全程提供专业的助听器验配服务支持的公益捐赠活动,于上海LiLiTime巷子店圆满落地。校方领导及师生代表、LiLiTime受赠代表
1天前
2026全域电动化产业生态大会在新疆塔城盛大开幕
6月24日上午,2026全域电动化产业生态大会开幕式在新疆塔城地区中亚文化交流中心隆重举行。本次大会为期3天,以"丝路塔城连欧亚产能融合创新篇"为主题,由赛迪工业和信息化研究院(集团)有限公司、新疆塔
1天前
【荣耀佛照】582.72亿元!佛山照明蝉联“中国500最具价值品牌”,品牌价值、排名双增长
6月24日,2026年世界品牌大会在北京隆重举办,主办方世界品牌实验室(WorldBrandLab)发布了2026年《中国500最具价值品牌》榜单。在这份基于财务数据、品牌强度和消费者行为分析的权威榜
170国全球媒体网络如何助力中国品牌出海传播?
2026年,中国企业全球化布局正式迈入提质增效的“深水区”。海外媒体传播不再是简单的信息曝光、内容铺陈,已然升级为企业构建全球化品牌、撬动海外市场增量的核心战略抓手。面对日趋复杂的国际舆论环境、差异化
1天前
传播易全域媒体资源覆盖范围有多大?
全域数字化时代,网络空间已然成为企业品牌建设、口碑传播与流量增长的核心阵地。传统单一的新闻发稿、广告投放模式早已无法适配当下的传播需求,取而代之的是集媒体分发、内容优化、精准触达、数据复盘、AI流量占
1天前
以设计跨越国界,2026“融·镜”国际眼镜设计先锋对话落幕
6月17日,一场聚焦设计、科技与产业未来的国际盛会——2026“融·镜”国际眼镜设计先锋对话在深圳会展中心拉开帷幕。本次对话汇聚了来自意大利、法国、日本、巴西等国家和地区的顶尖设计师与行业精英,围绕“
2天前





