阿里通义千问3登顶全球权威开源模型测评榜

上海证券报·中国证券网 05-06 15:20

记者5月6日获悉,国际权威大模型测评榜LiveBench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称“千问3”)斩获全球开源模型冠军,并在指令遵循(Instruction Following)这一关键能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等顶级闭源模型,位列全球第一。

据了解,LiveBench榜单由图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun)联合纽约大学等机构推出,从数学、推理、编程、语言理解等多个复杂维度全面评估大模型。因其采用动态更新的题库,被誉为“全球首个无法作弊的模型基准测试”。

在最新一期的LiveBench榜单上,千问3的表现与o4-mini、Claude3.7等顶尖闭源模型相当,并超越DeepSeek-R1取得了全球开源模型冠军。同时,千问3还斩获指令遵循这一细分领域的全球冠军,说明千问3具备全球顶级的语言理解和生成能力。

4月29日凌晨,千问3宣布开源。作为国内首个“混合推理模型”,其参数量仅为DeepSeek-R1的三分之一,性能全面提升的同时成本还大幅下降,引发大模型产业链连夜适配和接入浪潮。目前,英伟达英特尔高通、联发科、AMD、ARM、华为昇腾、壁仞科技等芯片平台都已完成了千问3的适配,北上津杭等十余地算力平台也已接入千问3。截至目前,阿里通义已开源200多个模型,全球下载量超过3亿次,千问的衍生模型数量超10万,远超美国Llama,成为全球第一开源模型。

(文章来源:上海证券报·中国证券网)

文章来源:上海证券报·中国证券网
文章作者:杨翔菲 温婷
原标题:阿里通义千问3登顶全球权威开源模型测评榜
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
美联储如期按兵不动 强调不确定性和滞胀风险上升
美联储如期按兵不动 强调不确定性和滞胀风险上升
财联社 144评论
重磅!央行公布10项政策!降准、降息、降个人住房公积金贷款利率
重磅!央行公布10项政策!降准、降息、降个人住房公积金贷款利率
新华社 1268评论
中国证监会印发《推动公募基金高质量发展行动方案》
中国证监会印发《推动公募基金高质量发展行动方案》
证监会网站 730评论
美股三大指数涨跌不一 迪士尼股价大涨超10% 谷歌跌超8%
美股三大指数涨跌不一 迪士尼股价大涨超10% 谷歌跌超8%
东方财富Choice数据 21评论
打开东方财富APP查看更多内容
24小时点击排行
午后大盘风云走向(周三)
消息刺激下市场高开回落尾盘再拉升,对于普通投资者在操作上要注意哪些事项?当前应该
突发利好 晚间四大消息
利好兑现 行情结束了吗
重磅利好,大A为何不温不火?
点击查看更多内容
写评论 ...