2月15日消息,微信搜一搜目前正在灰度测试“AI搜索”功能,部分用户进入微信搜索页面后,可点击由DeepSeek-R1提供的“深度思考”选项。
头部科技企业加速接入DeepSeek
凭借低成本、高性能在全球范围内“出圈”的DeepSeek持续火爆。据《中国经营报》记者粗略统计梳理,截至2月14日,已有数十家企业宣布接入DeepSeek R1模型,涵盖云服务商、应用服务商、手机厂商、芯片厂商等,且覆盖不同行业领域。值得注意的是,同样作为AI大模型赛道重要“玩家”的科技大厂也纷纷加入其中,例如:科大讯飞开放平台上线DeepSeek全系大模型;百度文小言(原文心一言)的最新版本接入DeepSeek R1模型,而且自4月1日起全面免费开放;腾讯元宝同步支持自家的混元模型,以及DeepSeek R1模型,字节跳动旗下飞书的相关功能也接入了DeepSeek R1模型等。
需要指出的是,相比科技大厂的灵活多元选择,在DeepSeek的冲击波下,以AI“六小龙”为代表的大模型明星独角兽们却略显尴尬。市场格局正在重塑,AI“六小龙”亟须向资本、市场和用户回答“如何保持竞争优势”这一考题。
桃战“六小龙”
AI“六小龙”或“六小虎”,是业界对于近几年里基于AI大模型、生成式AI技术浪潮兴起的六家“明星级”初创公司的统称,包括智谱AI、月之暗面(Kimi)、百川智能、阶跃星辰、MiniMax、零一万物。这些明星公司均有着出身或履历光鲜的创始团队,受到资本机构的青睐与追捧,同时已在市场中获得了大型客户的关注。尤其在2024年里完成一轮或多轮融资后,智谱AI、月之暗面、百川智能、阶跃星辰的市值估值均已超过200亿元人民币。
DeepSeek由私募量化公司幻方量化于2023年7月所创立,该公司在2024年12月、2025年1月分别推出了开源模型DeepSeek V3、DeepSeek R1模型。DeepSeek R1模型,在数学、代码、自然语言推理等重要任务方面性能比肩OpenAI o1模型,与GPT-4系列模型相比,训练成本效率提升近20倍。在DeepSeek爆火之前,业界对它的认知大多停留在投资量化工具上,得益于幻方量化的资金积累,DeepSeek时至今日并没有进行外部融资,这意味着与“六小龙”相比,DeepSeek并不依赖外部投资“输血”。
“DeepSeek的市场估值可能要比AI‘六小虎’的估值总和还要高。”谦询科技智库创始合伙人龚斌观察指出。据彭博亿万富翁指数调研的数据,DeepSeek的市场估值从10亿美元到1500亿美元不等,多家投行给出的估值超出1000亿美元,最高达到1500亿美元,大约相当于OpenAI最新估值的一半。数据机构Xsignal平台显示,DeepSeek的全球日活跃用户数截至2月8日已达到1.19亿。
“江山代有才人出。这对于大模型‘六小龙’来说,可能并不是个个好消息。”知名经济学者、工业和信息化部通信经济专家委员会委员盘和林认为,DeepSeek免费开源,效果比肩OpenAI o1,因此DeepSeek的出圈爆火实际上打破了大模型原有的商业模式,简单来说,很多AI模型公司原本希望通过用户订阅付费来发展,在DeepSeek效应冲击下只能转向免费这条路;而在B端,更多的企业通过开源模型的本地部署来自我发展AI,这从很多应用厂商、云厂商开放接入DeepSeek也可见一斑。总之,DeepSeek极大地降低了AI赋能的门槛,“更加残酷的AI竞争可能已经到来”。
AI竞争的新格局正在重塑。关于DeepSeek对我国人工智能市场格局产生的影响,上海人工智能研究院数字经济研究中心资深咨询顾问于清扬发文解释,DeepSeek首次验证了纯强化学习用于模型训练的可行性。与目前常见的监督微调方式相比,强化学习通过设定奖励机制而非依赖人工标注数据,使模型在不断试错中自我进化,逐渐发展反思、决策、长链推理等关键能力。与此同时,DeepSeek通过强化学习机制将模型的无效训练降低60%,对并行计算的需求较传统架构降低40%,使国产芯片在特定计算任务中的能效比可以达到英伟达GPU的75%。尽管仍面临算力依赖和泛化能力的挑战,但DeepSeek的创新模式已初步证明算法创新可突破算力瓶颈,伴随国产芯片在性能和能效方面的持续优化,未来或将大幅降低国内企业对进口芯片的依赖。
200亿估值“光环”下
曾在2024年获资本青睐的AI“六小龙”将如何应对DeepSeek冲击波?
当记者联系百川智能、智谱AI、阶跃星辰、月之暗面等AI大模型明星公司询问这段时间的产品数据变化以及如何应对DeepSeek引发的行业变化时,多家企业的负责人婉拒了采访,表示不方便回应。其中,月之暗面强调了DeepSeek对于AI行业所带来的整体带动。该公司联合创始人张予彤通过社交媒体披露,Kimi新版本在春节期间的用户规模创下新高,呈现陡增状态,并感慨AI行业“每逢春节发展速度远超想象”。不过,对于Kimi具体的用户规模及增长数据,月之暗面方面则并未透露。
一位投资界人士向记者指出,AI“六小龙”在过去两年多时间里获得了资本与市场的高度关注,通过持续的融资估值,大多已挺进200亿元大关,但因为大模型投入成本高,盈利前景不明朗,要达到资本预期的投资回报率还有很大的距离,更为重要的是,AI“六小龙”对外部融资的依赖性较高。而DeepSeek凭借高性价比、免费开源迅速打开了市场,AI“六小龙”真的要好好思考下一步的技术、市场及融资策略。
记者使用DeepSeek统计梳理并进行人工比对核实时注意到,AI“六小龙”在2024年均有融资事件发生,其中智谱AI分别在6月、9月、12月完成了三次融资,最新一轮是30亿元人民币融资;月之暗面则分别在2月、8月各完成一轮融资;2024年12月,阶跃星辰完成B轮数亿美元融资,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人含腾讯投资、五源资本、启明创投等。需要注意的是,零一万物研发的海外AI应用PopAi已开始接入测试DeepSeek R1模型。近日,百川智能在招聘平台上发布信息,公开招聘岗位涉及投资经理、投融资总监,被业界视为继商汤、智谱AI之后也加入下场做投资、布局生态的行列中。
“DeepSeek的出现,对于大模型初创公司来说既有压力,也是动力。”快思慢想研究院院长、《田丰说》策划人田丰指出,以DeepSeek为代表的开源模型阶段性领先时,会启发、加速闭源模型的研发速度,包括MoE创新性架构、RL自强化学习训练方法、算力网络成本节约思路等。当前DeepSeek具有很强的复杂任务推理能力,又具备联网搜索能力,搜索深度能达到50个相关网页,所以免费版DeepSeek不仅在抢其他to C大模型App的用户,还在抢搜索引擎的用户与广告流量。DeepSeek开源模型的领先性,改变了全球领先模型都是闭源甚至不公开状态,所以类似DeepSeek R1蒸馏数据给V3模型(或其他模型)会越来越普遍,推动全球大模型水平的快速提升,部分缓解数据瓶颈问题。据田丰了解,春节期间AI公司、互联网大厂都在加班研发,他预测今年三四月份里或将有一大批国产基础模型发布,性能会与DeepSeek对标,但背后的成本还有待观察。
顶着明星光环的AI“六小龙”,谁能在DeepSeek冲击波中率先实现突围,稳住市场地位、吸引更多用户,尚有待时间的验证,本报记者将持续关注报道。
(文章来源:界面新闻)