最新一期权威大模型榜单出炉：豆包1.5、商汤日日新V6并列国内第一

5月28日，权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》全新出炉！

豆包1.5·深度思考模型（Doubao-1.5-thinking-pro）和商汤日日新V6多模态模型（SenseNova-V6 Reasoner）共同摘得金牌，超越Gemini 2.5Flash Preview，在国内大模型第一梯队领跑。

位居第二梯队的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。

报告指出，国内外第一梯队大模型在中文领域的通用能力差距正在缩小。在国产大模型中，Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner表现最为亮眼。国内推理模型竞争格局初露端倪。

SuperCLUE是行业权威的通用大模型的综合性测评基准。本次2025年5月报告聚焦通用能力测评，涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本理解与创作六大任务，总量为1579道多轮简答题。

同时，根据Hugging Face——全球最大的AI开源社区上的数据，在Open Compass本月的多模态大模型评测榜单中，商汤日日新V6（SenseNova-V6 Pro）以80.4的总分，超越Gemini 2.5 Pro，位居第一。

新民晚报记者了解到，凭借多模态长思维链训练、全局记忆、强化学习等技术创新，商汤日日新V6以单一模型即可完成文本、多模态等多种任务，在推理、数理、代码等方面拥有显著优势，能够深度理解人类意图，处理各类复杂信息和复杂问题，为真实的业务应用提供强大助力。同时，商汤日日新V6的多模态训练整体效率对齐语言训练，实现业内最优水平，推理成本亦实现业界最低。

得益于高效能与低成本的完美结合，商汤日日新V6自今年4月发布以来，获得了行业各界的广泛支持，已在具身智能、智慧教育、智慧文旅等领域携手多家合作伙伴，将共同推动多行业、多场景落地。

（文章来源：上观新闻）

文章来源：上观新闻

原标题：最新一期权威大模型榜单出炉：豆包1.5、商汤日日新V6并列国内第一

最新一期权威大模型榜单出炉：豆包1.5、商汤日日新V6并列国内第一

分享成功

热门推荐