最新一期权威大模型榜单出炉:豆包1.5、商汤日日新V6并列国内第一

上观新闻 05-30 18:13


5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》全新出炉!

豆包1.5·深度思考模型(Doubao-1.5-thinking-pro)和商汤日日新V6多模态模型(SenseNova-V6 Reasoner)共同摘得金牌,超越Gemini 2.5Flash Preview,在国内大模型第一梯队领跑。

位居第二梯队的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。

报告指出,国内外第一梯队大模型在中文领域的通用能力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner表现最为亮眼。国内推理模型竞争格局初露端倪。

SuperCLUE是行业权威的通用大模型的综合性测评基准。本次2025年5月报告聚焦通用能力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本理解与创作六大任务,总量为1579道多轮简答题。

同时,根据Hugging Face——全球最大的AI开源社区上的数据,在Open Compass本月的多模态大模型评测榜单中,商汤日日新V6(SenseNova-V6 Pro)以80.4的总分,超越Gemini 2.5 Pro,位居第一。

新民晚报记者了解到,凭借多模态长思维链训练、全局记忆、强化学习等技术创新,商汤日日新V6以单一模型即可完成文本、多模态等多种任务,在推理、数理、代码等方面拥有显著优势,能够深度理解人类意图,处理各类复杂信息和复杂问题,为真实的业务应用提供强大助力。同时,商汤日日新V6的多模态训练整体效率对齐语言训练,实现业内最优水平,推理成本亦实现业界最低。

得益于高效能与低成本的完美结合,商汤日日新V6自今年4月发布以来,获得了行业各界的广泛支持,已在具身智能、智慧教育、智慧文旅等领域携手多家合作伙伴,将共同推动多行业、多场景落地。

(文章来源:上观新闻)

文章来源:上观新闻
原标题:最新一期权威大模型榜单出炉:豆包1.5、商汤日日新V6并列国内第一
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
假期要闻汇总:商务部新闻发言人就美方有关言论答记者问
假期要闻汇总:商务部新闻发言人就美方有关言论答记者问
东方财富Choice数据 182评论
十大机构论市:新一轮“东升西落”交易可能很快来临
十大机构论市:新一轮“东升西落”交易可能很快来临
东方财富研究中心 952评论
港股突变!尾盘跌幅收窄 黄金、加密货币概念股大爆发!
港股突变!尾盘跌幅收窄 黄金、加密货币概念股大爆发!
e公司 150评论
俄乌第二轮会谈前夕 飞出数只“黑天鹅”
俄乌第二轮会谈前夕 飞出数只“黑天鹅”
央视新闻客户端 377评论
打开东方财富APP查看更多内容
24小时点击排行
市值低于50亿,连续3年ROE大于20%,顶级商业模式的7个小公司
庄股惠城,3年18倍,究竟是黑科技,还是财务造假?
利空、数据、暴跌之我见(附6月方向)
突发两大利空 外围下跌 明天A股?
再评常山药业:百倍长牛,永续成长!奔牛不息,长牛不止!买定常山,财富如山!阿贝那肽诞生于中国,问鼎于世界
点击查看更多内容
写评论 ...