牌桌未定,AI大模型的战火又烧向空间智能

21世纪经济报道 3小时前

2026年开春,由OpenClaw带火的“龙虾热”,在喧嚣过后悄然“潜入日常”,完成了从破圈奇观到基础设施的软着陆。

而当智能体的能力与价值被广泛接受,AI竞赛的主线也自然向前延伸——在“动口+动手”的智能体基础之上,行业集体开卷“空间智能”,把AI的理解与交互能力从二维屏幕推向三维物理世界。

4月以来,AI大模型的战火从云端全面烧向现实场景。不到一个月内,腾讯与阿里同日亮剑“世界模型”,直指空间智能核心赛道;字节跳动在视频生成与3D建模双线发力,抢占物理世界数字化入口;阿里更是四天内两度上新,加速技术落地节奏。

这场密集的模型发布,标志着AI大模型的竞赛焦点,已从虚拟的语言、数据领域,转向能够链接物理世界、实现场景化应用的空间智能与多模态落地。

空间智能加速跑

4月16日,腾讯与阿里巴巴同日发布各自的世界模型产品,标志着行业竞争重心正式从大语言模型的参数内卷,转向空间智能这一全新赛道,成为AI战火烧向物理世界的核心标志。

腾讯当日正式发布并开源混元3D世界模型2.0(HY-World2.0),精准切入物理世界的3D数字化需求。该模型可高效理解文本、图片、视频等多模态输入,实现3D世界的自动生成、重建与模拟,支持Mesh、3DGS及点云等多格式3D资产导出,能无缝对接Unity、UE等主流游戏引擎,可快速生成游戏地图与关卡原型,让虚拟场景搭建更贴近物理世界的真实逻辑。相较1.0版本,该模型在画面精细度与真实感上实现显著提升,可支持用户自定义生成写实、漫画、游戏等不同风格的3D空间,进一步降低物理世界数字化的门槛。

世界模型的技术突破,正持续拓展物理世界内容生产的新空间。万联证券分析指出,腾讯混元世界模型2.0可将生成资产直接导入主流游戏引擎,阿里Happy Oyster则适用于高保真、长时序动态场景生成,两者均有望加速游戏与影视领域的内容生产迭代,推动虚拟内容与物理场景的深度融合。同时,随着AI大模型处理复杂物理问题的能力不断提升,智能体功能正向复杂处理、端侧应用等方向升级,Token(词元)调用量有望保持高速增长。

同日,阿里同步发布世界模型Happy Oyster(快乐生蚝)。该模型基于原生多模态架构,核心优势是能够实时构建可交互、可演绎、可探索的AI数字世界,完美契合影视制作、游戏开发等需要还原物理场景的核心需求。

字节跳动则在4月23日跟进发力,由Seed团队发布新一代3D生成大模型Seed3D2.0,API同步上线火山引擎,进一步丰富了空间智能的技术布局。该模型在几何生成与纹理材质生成两大核心指标上达到当前行业领先水平,采用由粗到精的两阶段生成策略,将整体结构与几何细节解耦优化,成功突破了锐利边缘、薄壁结构、复杂拓扑等3D生成领域的核心难点;同时借助MoE架构,大幅提升了高分辨率材质细节与边界精度。值得注意的是,该模型支持部件级分割与补全、铰接资产生成,以及基于文本、图像、视频的场景组合生成,生成内容可直接对接IsaacSim等物理仿真引擎,推动3D生成从单一单体模型,向可交互、具身智能的场景级构建演进。

Seed3D2.0在几何精度、PBR材质质量以及下游可用性方面取得了显著进展。不过,字节跳动Seed团队称:“3D生成仍然面临一系列长期挑战:几何生成的精细度与泛化性尚有提升空间;纹理生成还存在遮挡与贴图误差问题;3D生成模型的大规模应用受限于推理效率;3D生成模型的落地场景还存在未知与探索空间。未来,我们会在这些方向上继续攻坚,推动3D生成技术在更多场景中规模化应用。”

中信证券判断,2026年以来,国产大模型厂商已逐步跳出参数比拼的误区,聚焦智能体及代码能力升级,密集发布新模型;而AI与现有互联网平台的协同关系日益凸显,具备物理世界链接能力的相关方向,已成为行业布局的核心重点。

多模态快速迭代

如果说世界模型是AI链接物理世界的“入口”,那么多模态能力的迭代,则是筑牢这一入口的“根基”。当前,多模态能力仍是国内厂商竞争的核心领域,而所有技术升级,均围绕更好地适配物理世界的复杂场景、实现更精准的人机交互展开。

阿里在多模态领域的布局尤为密集。4月23日,其发布270亿参数稠密多模态模型Qwen3.6-27B并同步开源,以“小参数实现强性能”的突破,进一步提升了多模态模型的落地可行性。该模型在SWE-benchVerified测试中取得77.2分的优异成绩,编程能力超越前代参数量更大的模型,彰显了架构优化的核心价值。短短四天内,阿里完成了旗舰预览版与开源中型模型的密集发布,实现了模型能力与开源生态的同步布局,为多模态技术在物理世界的规模化应用奠定了基础。

字节跳动则在多模态的视频与端侧落地领域持续突破。4月14日,火山引擎宣布上线Seedance2.0系列API服务,全面开放视频生成能力,该模型支持文本、图片、音频、视频多模态输入,重点提升了复杂交互与运动场景下的物理合理性与画面逼真度,让视频生成更贴合现实世界的运动规律。同时,火山引擎为Seedance2.0建立了完善的肖像与版权安全规范,覆盖视频生成全流程,为技术落地扫清合规障碍。

多模态技术的快速迭代,正推动大模型规模化商用进程加速,进一步拉近AI与物理世界的距离。4月22日,据行业知情人士消息及特斯拉车机语音使用条款显示,特斯拉车型车机语音系统将接入字节跳动豆包大模型与DeepSeekChat,两款模型均通过火山引擎接入,标志着多模态大模型正式落地汽车端,实现了AI与物理出行场景的深度融合。

截至2026年3月,豆包大模型日均Token(词元)使用量已突破120万亿,保持高速增长。中信建投指出,视频模型Seedance2.0的落地推广,叠加AI智能助理在各类物理场景的应用普及,将持续推动Token使用量增长,带动行业商业化升级。

行业数据与机构观点也印证了这一趋势。据全球最大的API聚合平台OpenRouter统计,2026年4月其平台周度累计Token消耗量相较去年同期提升约7—8倍,其中国产大模型贡献了主要增量;受算力相关产能约束影响,供给端短期增量有限,全球算力价格出现上行趋势。上海证券则认为,算力成本的持续优化与模型效率的不断提升,正推动全球AI产业从技术研发阶段,迈向商业化落地的关键时期,而多模态能力的突破,正是这一转型的核心驱动力

国内模型厂商DeepSeek近期也迎来产品与资本层面的双重进展。4月22日,行业消息显示,多家互联网大厂对DeepSeek新一轮融资存在布局意向,其市场估值受到行业广泛关注。同时,DeepSeek计划于4月下旬发布新一代旗舰大模型DeepSeek V4,该模型原生支持图片、视频与文本生成功能,将进一步完善全模态处理能力,助力AI在更多物理场景的落地。中信证券认为,DeepSeek下一代模型或延续高性价比开源路线,在记忆能力、超长上下文处理、代码与智能体能力上进一步优化,并补齐多模态能力,有望带来相关产业链的投资机会。

AI大模型战火从云端烧向物理世界,并非国内厂商的独角戏,海外厂商也同步参与了本轮集中发布。北京时间4月22日凌晨,OpenAI发布新一代图像生成模型ChatGPT Images2,重点强化了模型对物理世界场景的理解与还原能力。

该模型在理解与执行复杂指令、内容生成质量上实现明显升级,重点提升了复杂指令遵循、目标布局、文本渲染等核心能力,同时优化了中文、日文、韩文等非拉丁语系文字的呈现效果,可更好适配海报、图表等贴近现实生活的设计场景。在Arena.ai评测中,该模型在文生图领域表现领先,其底层模型gpt-image-2已通过API向开发者开放。

商业拐点已至

国内外AI厂商密集发布新品的背后,行业竞争的共识逐步清晰:中美大模型竞争已彻底从参数规模比拼,转向架构效率、推理能力、生态落地的全方位竞争,而2026年,正是这场竞争中技术突破与商业化落地的重要观察节点,模型核心突破集中在智能体AI与物理世界相关AI方向。

国盛证券认为,当前市场环境下,看好AI智能体在金融领域的高价值落地,以及多模态应用集中落地带来的投资机会,而这些落地场景,均离不开对物理世界的理解与适配。

与此同时,Token(词元)经济的快速发展,正在重塑AI产业链逻辑。数据显示,国内Token调用规模较此前大幅增长,背后正是AI与物理世界场景结合带来的需求爆发。上海证券指出,AI智能体正从通用对话工具,逐步融入金融风控、智能客服、代码审查、数据分析等企业业务流程,成为真正的生产力工具,2026年有望成为AI智能体商业化落地的重要年份;与之相伴的是,算力需求结构正从训练主导,逐步转向推理与智能体应用主导,进一步适配物理世界的多样化应用场景。

中泰证券表示,国产AI有望依托成本优势构建核心竞争力,叠加AI智能体、多模态等ToB/ToC应用需求的持续增长,具备大模型技术能力与丰富应用场景的相关主体,将在行业竞争中占据优势。有计算机行业分析师对记者表示,2026年AI智能体应用加速落地,正从单纯的技术演示阶段,走向实用化、商业化的数字员工场景,成为连接AI与物理世界的重要纽带。

从世界模型的开源竞争,到小参数语言模型的性能突破,再到图像模型的能力升级,AI厂商的技术路线正持续分化。但无论路线如何差异,行业竞争的核心方向已高度一致——围绕多模态能力、端侧落地、商业生态展开全方位较量,而这一切的核心,都是让AI真正走出云端,融入物理世界,成为推动产业升级、改变生活方式的核心力量。

(文章来源:21世纪经济报道)

文章来源:21世纪经济报道
原标题:牌桌未定,AI大模型的战火又烧向空间智能
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
中办、国办印发《碳达峰碳中和综合评价考核办法》
中办、国办印发《碳达峰碳中和综合评价考核办法》
新华社 3345评论
伊朗消息人士:伊美谈判准备工作“今晚或明天”或取得突破
伊朗消息人士:伊美谈判准备工作“今晚或明天”或取得突破
新华社 970评论
新易盛:第一季度净利润为27.8亿元 同比增长76.8%
新易盛:第一季度净利润为27.8亿元 同比增长76.8%
财联社 777评论
美股三大指数震荡整理 德州仪器大涨逾16%
美股三大指数震荡整理 德州仪器大涨逾16%
东方财富Choice数据 66评论
打开东方财富APP查看更多内容
24小时点击排行
一文图解读懂CPO光模块
4100烈震四日,国际乱局没完,主力借机洗盘,你要成长起来
A股高开低走,散户还能买吗?
操作丨该来的终于还是来了!A股冲高回落,跌幅扩大,划重点了!
磷化铟:光模块上游核心材料(附股)
点击查看更多内容
写评论 ...