阿里千问、DeepSeek齐出手 国产大模型“升级”Agent能力

每日经济新闻 昨天 21:39

近期国产大模型动作频频。4月2日,阿里发布千问新一代大语言模型Qwen3.6-Plus。4月8日,DeepSeek(深度求索)上线专家模式,这是DeepSeek走红以来首次在产品端引入模式分层设计。此前3月份,DeepSeek释放了和Agent(智能体)相关的多个岗位招聘需求。

《每日经济新闻》记者注意到,无论是阿里千问还是DeepSeek大模型,都在强化基础大模型Agent的能力。2026年初,以OpenClaw(一款开源人工智能体框架,俗称“龙虾”)为代表的“龙虾热”火爆国内外。如果说2025年还是“千模混战”,2026年AI(人工智能)主战场已全面转向智能体,Agent对Token(词元)的消耗正以百倍、千倍速度加快。

IDC(国际数据公司)中国研究总监卢言霞向《每日经济新闻》记者表示,强化Agent能力是基础大模型2026年的重要发展方向,可能包括深度研究、智能办公、AI代码助手等通用场景。

中国科学院计算所客座博士生导师、中国计算机学会数字金融分会常务执委白硕在接受《每日经济新闻》记者采访时表示,随着AI应用爆发,对基础大模型Agent能力,未来将更重视在Harness Engineering(直译为驾驭工程)领域的提升。据了解,Harness Engineering是一个不强调模型性能,更强调工程环境,通过让“驾驭模型的系统环境”更专业而提升使用效果的范式。

下一代OpenClaw将支持视频生成

OpenClaw创始人近日在社交平台宣称,下一代OpenClaw智能体产品将迎来两大核心升级——全新融入AI视频生成能力,并成为全球首个官方适配阿里千问大模型的智能体框架。

4月2日,阿里发布千问新一代大语言模型Qwen3.6-Plus,其中最引人注目的是,新模型显著增强了智能体编程能力。在代码智能体领域以及通用智能体与工具使用方面,新模型表现突出。

4月4日,OpenRouter(一个AI模型聚合平台)官方数据显示,Qwen3.6-Plus的日调用量突破1.4万亿Tokens。

Agent对Token的消耗正以前所未有的速度激增。国家数据局局长刘烈宏披露了一组数据,到今年3月,我国日均词元调用量已超过140万亿,相比2024年初的1000亿增长1000多倍,相比2025年底的100万亿,3个月时间又增长40%多。

英伟达GTC 开发者大会上,黄仁勋给出了一个极具冲击力的定义:Token是AI时代的新大宗商品,是新“货币”,也是衡量企业竞争力的核心标尺。

而OpenClaw这类Agent产品彻底改变了AI交互形态,使其能落地完成复杂任务,也让Token需求迎来爆发式增长。

不只是阿里千问基础大模型强化了Agent能力,DeepSeek通用大模型自2025年以来也强化了Agent能力。

《每日经济新闻》记者注意到,在DeepSeek官网上,3月24日发布的一系列招聘岗位中,有不少和Agent相关的岗位。譬如Agent全栈开发工程师、Agent深度学习算法研究员、Agent数据策略工程师等。

2025年12月,DeepSeek更新V3.2正式版,就强调其新模型强化Agent能力,融入思考推理。在这个版本的模型中,DeepSeek提出了一种大规模Agent训练数据合成方法,构造了大量“难解答,易验证”的强化学习任务,大幅提高了模型的泛化能力。

DeepSeek专家模式具备领域深度增强等特点

当前,AI Agent(人工智能体)能力很大程度上依赖于基础大模型能力的提升,基础大模型提供核心能力,而Agent通过系统化设计将这些能力转化为实际应用价值,国产基础大模型正在强化Agent能力。

横向对比来看,无论是千问大模型还是DeepSeek,均支持高达100万个词元上下文长度,大模型在长文档、多轮对话信息提取上更精准。

卢言霞认为,当前基础大模型竞争的关键是编程能力、智能体能力等。

AI应用端,浙江华通云数据科技有限公司副总裁林建龙在接受《每日经济新闻》记者采访时坦言,当前AI Agent仍面临一些问题。譬如大多数AI系统仍然停留在工具、技能层面,无法真正成为企业的“数字化员工”。传统工作流编排和简单对话系统虽然能够完成一些预定义的任务,但缺乏深度理解业务场景、独立思考和持续学习的能力,难以满足企业复杂多变的业务需求。

林建龙表示,未来的AI Agent不是简单的工具,而是一个基于大模型之上的各个行业领域专家。这种专家Agent具备以下核心特征:第一,具备深厚的行业专业知识,能够理解并处理复杂的业务问题;第二,能够深度融入企业业务流程,与现有系统无缝对接;第三,具备持续学习和自我优化能力,能够在实践中不断提升;第四,能够独立完成特定任务,而不仅仅是提供建议或答案。

4月8日,DeepSeek上线的专家模式就提到,专家模式具备领域深度增强、多步推理可视化、引用溯源强化、自定义专家组合、长上下文压缩优化等特点。专家模式沿用了R1的长思维链推理能力,但针对专业领域做了定向蒸馏和微调,使“快思考”与“慢思考”在领域内更平衡。

林建龙也强调了未来“专家Agent”理念的实现,需要系统化和工程化的方法。他表示,当前华通云正围绕底座模型、数据管理、提示词工程、长期记忆等核心技术要素,构建了一套完整的AI Agent开发框架。

其中底座模型提供基础的认知和推理能力,数据管理完成对企业数据的链接和交互,提示词工程负责将业务需求转化为模型可理解的任务指令,MCP Tools(用于与外部系统进行交互的工具集或协议)提供与外部系统交互的能力,Skills(技能)封装了特定领域的专业技能,长期记忆机制则使Agent能够在多轮交互中积累经验、实现智能的个性化服务。

(文章来源:每日经济新闻)

文章来源:每日经济新闻
原标题:阿里千问、DeepSeek齐出手 国产大模型“升级”Agent能力
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
业绩亮眼、估值筑底 券商板块修复行情可期?
业绩亮眼、估值筑底 券商板块修复行情可期?
东方财富研究中心 254评论
供应端再生扰动 锂矿概念表现活跃 融资客提前“埋伏”这8股
供应端再生扰动 锂矿概念表现活跃 融资客提前“埋伏”这8股
东方财富研究中心 51评论
海内外催化共振!人形机器人集体拉升 最新业绩预测高增股来了
海内外催化共振!人形机器人集体拉升 最新业绩预测高增股来了
东方财富研究中心 57评论
香港首批稳定币牌照今天下午公布
香港首批稳定币牌照今天下午公布
每日经济新闻 85评论
打开东方财富APP查看更多内容
24小时点击排行
抄作业时间!内部员工重仓的红利基金,我从年报全扒出来了
今天会是黑色星期五吗,指数面临方向选择,重要支撑参考如下……
坐看云起时。
晚间放利好 美股拉升 原油跳水
中科仪网上发行数量
点击查看更多内容
写评论 ...