当前,“接入DeepSeek”的行业热潮仍在持续。在绝大多数产品仍停留在直接输出DeepSeek能力时,腾讯向前迈出一步。
2月21日,腾讯AI助手“腾讯元宝”完成了产品更新,让DeepSeek具备了理解图片的能力。
据21世纪经济报道记者了解,在官方版本中,DeepSeek只支持扫描图片中的文字,如果是不带有文字的图片,DeepSeek将无法完成解析。

DeepSeek官方版本仅能识别图片文字
但现在在腾讯元宝,用户关闭联网搜索后,可以发送任意图片让DeepSeek进行分析和理解。

元宝中的DeepSeek 可以读懂图片
记者从腾讯内部了解到,腾讯元宝中的DeepSeek之所以能读懂图片,是因为腾讯将其与混元的多模态能力进行了融合。
DeepSeek的V3和R1模型均为大语言模型,不具备识图能力。在DeepSeek的官方版本中,是通过OCR的方式先实现图片的文本识别,然后在进行模型处理。
但OCR实现的,仅仅是文本的抓取,它无法真正理解图片内容。所以此次,腾讯是在DeepSeek处理用户输入内容阶段,加入了混元的多模态理解能力,让其具备了更强的图像理解能力。
目前,腾讯元宝已经接入DeepSeek-R1满血版、DeepSeek-V3以及推理模型混元T1和混元Turbo等四个模型,且都已支持理解图片、解析文件、联网搜公众号、从微信上传文件等功能。
一位行业分析人士向记者表示,腾讯元宝的这次更新,并不是基于底层模型能力上的迭代,而是通过产品创新来实现的,说明基于现有技术架构的模块化创新同样能创造差异化价值。
该分析人士还指出,这种“轻量级改造”模式尤其适合需要快速迭代的C端场景,其关键在于企业对技术组件的解构与重组能力。
实际上,随着DeepSeek实现AI平权,整个行业在通用大模型能力上基本站在了同一起跑线上。未来,或许部分大厂还能够在大语言模型能力的迭代或者多模态模型方面有所突破,但对绝大多数企业而言,未来的竞争核心将是如何实现大模型能力的产品化落地。
腾讯早早意识到这一趋势,因此在过去半个月中,一改常态,十分敏捷地作出战略调整开始拥抱DeepSeek。
如今,腾讯几乎是“全员出击”。除了此前已经接入的微信、腾讯元宝、腾讯文档、QQ浏览器、QQ音乐、腾讯地图等十余款产品,其他各个产品线也在陆续接入DeepSeek。
据记者了解,腾讯最新接入DeepSeek的产品是理财通和企业微信,他们已经将DeepSeek融入进自己的产品场景中。
比如腾讯理财通接入DeepSeek后,整合专业金融数据、微信公众号等资源,提升了金融服务专业性和时效性。
而企业微信是在"智能机器人"、"智能表格-客户跟进总结"等 AI新功能中接入了DeepSeek。
现在,企业可一键创建专属智能机器人,不仅能准确回答公司内部员工的问题,还能帮一线员工更好地应对有难度的客户咨询。同时,智能表格中的AI能力,也可一键自动总结客户跟进情况。
对腾讯而言,DeepSeek为大模型的演进按下了加速键,使其迅速进入应用落地阶段。而这也是腾讯最熟悉的舞台。
业内普遍认为,腾讯拥有规模最庞大的C端用户以及最丰富的C端产品矩阵,这些产品,将加速大模型的场景试验,并有望在问答形式之外,开拓出更多新的AI应用体验。
(文章来源:21世纪经济报道)