停更近五个月,这次梁文锋携DeepSeek V4绝地反击?黄仁勋都觉得“可怕”

时代财经 3小时前

蛰伏近5个月,DeepSeek终于迎来新一轮重磅迭代。

4月24日,DeepSeek-V4 Preview正式上线并开源,该版本分为Pro和Flash两款,分别对应官方网页端、App界面的专家模式与快速模式。

从技术迭代方向来看,DeepSeek-V4 在模型参数体量与实际能力上实现不小突破。

DeepSeek官方测评显示,V4-Pro在Agentic Coding、世界知识、数学、STEM和竞赛级代码等测评中,达到当前开源模型领先水平,并在部分指标上比肩顶尖闭源模型。

此次备受关注的V4版本发布,较市场此前预期的"春节前后"节点晚了数月。而在这段时间里,大模型行业竞争空前激烈,部分大模型甚至以"月更"为节奏高频持续上新,DeepSeek却一直悄无声息。

这家凭借低成本、高性能和开源打出辨识度的明星大模型企业,则一边因新模型"停更""跳票"身陷舆论讨论,一边又被卷入人才流动和融资传闻。

时代财经注意到,深度求索官方在DeepSeek-V4官宣文稿末尾,特意援引了《荀子·非十二子》的名句"不诱于誉,不恐于诽,率道而行,端然正己。"这十六个字表述,似乎是其对近期外界种种声音作出的间接回应。

V4姗姗来迟,在华为昇腾平台首发

"从现在开始,1M上下文将是DeepSeek所有官方服务的标配。"深度求索方面介绍,DeepSeek-V4模型按大小分为DeepSeek-V4-Pro、DeepSeek-V4-Flash两个版本,上下文长度均为1M(一百万)。

长上下文能力已非大模型行业的新鲜事。过去一年,国内外头部模型厂商几乎都在持续拉长上下文窗口。V4更受关注的,是其通过结构创新实现推理成本大幅降低。

DeepSeek在官方文章中表示,V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),既实现全球领先的长上下文能力,又相较于传统方法大幅降低了对计算和显存的需求。

而V4更大的亮点在于Agent能力的显著提高。

在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平。"目前DeepSeek-V4已成为公司内部员工使用的Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式,但仍与其思考模式存在一定差距。"

在世界知识测评中,V4-Pro大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。此外,在数学、STEM、竞赛型代码的测评中,V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的成绩。

不过,DeepSeek也坦言,在推理能力上,V4-Pro-Max与最先进的前沿模型仍存在3至6个月的差距。

图源:DeepSeek-V4技术报告

时代财经注意到,DeepSeek-V4在海内外全网更新后,迅速在海外开发者社区和技术圈引起热议。

不少网友对于DeepSeek此次更新给出积极反馈,有评价称其几乎是"这个领域里相当彻底的开源",开发者文档完善、价格"低得惊人",同时却具备接近前沿模型的能力;也有用户直言,模型质量与价格相比是一笔"疯狂划算的交易"。

实际上,DeepSeek V4的登场比市场预期晚了许多。

早在今年初,就有消息传出DeepSeek-V4将在春节前后发布,一时间业内讨论度升温。但之后,市场几番猜测又频频落空。直至4月24日正式亮相,较上一轮模型更新(DeepSeek-V3.2)已间隔近5个月。

值得注意的是,对于此前外界猜测的延迟发布与底层代码重写、适配国产芯片有关的传闻,本次DeepSeek-V4技术报告给出了侧面印证。

时代财经注意到,深度求索罕见地将华为昇腾英伟达写进DeepSeek-V4技术报告:"我们在英伟达GPU和华为昇腾NPU平台上验证了细粒度EP(专家并行)方案。"

华为官方也发布信息称,DeepSeek-V4在昇腾首发,昇腾超节点全系列产品支持DeepSeek V4系列模型。

这一算力适配的选择,或将引来全球科技行业的震动。长期以来,全球AI算力的技术体系与产业生态,基本围绕英伟达的技术路线构建,其CUDA生态不仅为模型开发提供了成熟的工具支撑,更已成为行业内通用的AI计算标准接口。

如今,DeepSeek-V4选择在华为昇腾平台首发,无疑打破了这一长期固化的算力生态格局。近日,英伟达创始人黄仁勋在一场访谈中就提到:"DeepSeek绝非一个无关紧要的进步,如果DeepSeek率先在华为上发布,那对美国来说将是一个可怕的结果。"

与此同时,这一生态成本未来或能够进一步降低。DeepSeek表示,受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。

目前,按DeepSeek官方价格折算,V4-Pro每百万tokens输入是1元,输出是12元;V4-Flash每百万tokens的输入和输出分别是0.2元和2元。

图源:DeepSeek-V4技术报告

融资传闻升温,DeepSeek走到十字路口

在DeepSeek-V4"姗姗来迟"的这段空窗期里,大模型行业的竞争格局已悄然剧变,火药味渐浓——这与当年DeepSeek R1横空出世时的环境已然不同。

今年2月,字节跳动、腾讯、阿里等多家科技巨头纷纷加大AI应用投入,它们旗下的豆包、元宝和千问等产品的月活跃用户(MAU)迎来爆发式增长,在AI原生App榜单中强势崛起,一度撼动DeepSeek占据的"江湖地位"。几乎在同一时间,Kimi K2.5、GLM-5、MiniMax M2.5等国产大模型也密集登场。

随着4月上旬DeepSeek创始人梁文锋在内部沟通中透露,新一代旗舰大模型将于当月下旬发布的消息传开,一场围绕大模型的卡位战加速打响。

戏剧性的是,就在DeepSeek-V4上线的前一天,互联网巨头上演了一场集体"伏击",4月23日,小米MiMo-V2.5和腾讯混元Hy3 preview同日开启公测,而阿里则在更早前的4月2日便发布了Qwen3.6-Plus。

外部强敌环伺之下,DeepSeek的内部组织稳定性与服务保障能力正在经受考验。

一方面,核心技术人才的接连出走,引发市场对这家基座大模型公司研发能力的担忧。公开信息显示,自2025年下半年以来,DeepSeek的研发团队出现明显人员流动,DeepSeek第一代大语言模型核心作者王炳宣转投腾讯、V3版本核心贡献者罗福莉入职小米。

甚至在4月中旬V4版本呼之欲出之时,据晚点报道,当年R1核心研究员郭达雅选择加入字节跳动Seed团队。

另一方面,随着用户规模的扩张,DeepSeek服务稳定性问题也日益凸显。2026年开年以来,DeepSeek多次出现大规模服务中断,其中3月29日晚至次日上午的宕机波及网页端与APP端,持续时间长达约12小时。

进入4月,关于DeepSeek启动首次外部融资的消息持续发酵。

就在DeepSeek-V4上线前一周,证券时报等多家媒体报道称,DeepSeek正与投资者洽谈首轮外部股权融资,计划以不低于100亿美元的估值,募集不少于3亿美元资金。随后又有报道称,腾讯、阿里正洽谈以超过200亿美元估值投资DeepSeek,两家投资方预计共计投资18亿美元。不过上述消息均未得到DeepSeek及相关方的确认。

这场融资传闻之所以引发如此大的反响,核心在于它与DeepSeek此前留给外界的"技术纯粹派"印象形成强烈反差。

梁文锋曾在公开表态中表现出对融资的明确排斥。其在采访中曾表示,幻方作为出资人之一为其充足研发预算;更核心的顾虑在于外部投资者或干预公司决策,梁文锋称很多VC对做研究有顾虑,存在退出需求,希望尽快做出产品商业化,而这与DeepSeek优先做研究的思路并不完全匹配。

彼时,独立于融资叙事之外、专注于技术研究,正是DeepSeek最吸引人的故事之一。一定程度上,当年R1横空出世,正是凭借这份纯粹的技术追求,在众多模型中脱颖而出,成为AI行业的"黑马"。

但如今,大模型竞争已告别单点突破的时代,进入算力、人才、生态、产品和商业化的综合战。仅依靠技术声望和内部资金,或许已难以覆盖下一阶段的综合竞争成本。

而引入外部资本,不仅能补充弹药,还意味着企业的估值将得到市场定价,员工手中的股权激励也将有更清晰的价值参照。这对于过去一年频频被卷入人才流动讨论的DeepSeek来说,或许也是稳定团队、留住核心研发人员的一种更为现实的方式。

实际上,在DeepSeek尚未迈出融资这一步时,昔日同为大模型独角兽的竞争对手们,早已在资本市场上加速奔跑。

今年1月,智谱(02513.HK)与MiniMax(00100.HK)先后登陆港交所,截至4月24日,两者最新市值分别达到4169亿港元和2439亿港元。

月之暗面虽尚未启动上市,但据财联社3月份报道,其今年以来已完成三轮融资,估值在3个月内翻了4倍,最新一轮融资估值上升至180亿美元。

对于站在十字路口的DeepSeek而言,一边是愈发残酷的算力与人才军备竞赛,另一边是向其抛出橄榄枝的资本市场。一边是坚守技术理想的初心,一边是应对商业竞争的现实压力。

这家曾给中国AI行业带来巨大惊喜的公司,能否在技术理想与现实之间找到可持续的平衡,将决定它下一阶段的生存与发展走向。

(文章来源:时代财经)

文章来源:时代财经
原标题:停更近五个月,这次梁文锋携DeepSeek V4绝地反击?黄仁勋都觉得“可怕”
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
全球市场:纳指、标普再创新高 英特尔涨超23% 英伟达市值重返5万亿美元之上
全球市场:纳指、标普再创新高 英特尔涨超23% 英伟达市值重返5万亿美元之上
东方财富Choice数据 656评论
首批17家券商季报出炉 业绩温差加大 中信百亿净利是12家中小券商总和3倍
首批17家券商季报出炉 业绩温差加大 中信百亿净利是12家中小券商总和3倍
财联社 304评论
全球主力买家抛售超22吨黄金!土耳其、俄罗斯等国央行也在卖 摩根士丹利大幅下调金价预期
全球主力买家抛售超22吨黄金!土耳其、俄罗斯等国央行也在卖 摩根士丹利大幅下调金价预期
每日经济新闻 97评论
5次“抢跑” 35亿美元“砸盘”!起底中东冲突背后的美国“原油内幕交易”疑云
5次“抢跑” 35亿美元“砸盘”!起底中东冲突背后的美国“原油内幕交易”疑云
每日经济新闻 37评论
打开东方财富APP查看更多内容
24小时点击排行
科技放大招 雷声滚滚 周末消息解读
光模块下周还会上涨
浙江富豪,245亿“豪赌”算力!
认知是投资的基础,修心是投资的灵魂!
A股第一梯队,专精特新唯一低估真龙,社保,北向联手重仓杀入
点击查看更多内容
写评论 ...