小米,开源!

每日经济新闻 04-30 23:07

4月30日,小米宣布开源首个为推理而生的大模型Xiaomi MiMo。据称,其在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

图片来源:Xiaomi MiMo微信公众号

受此消息影响,今日小米股价涨5.27%,金山云金山软件更是分别大涨14.20%和7.07%。业内人士认为,小米作为国产头部的手机品牌厂商,此次开源的小参数规模模型展现了较强的性能,为AI在手机端侧的应用和运行提供了更坚实的模型基础。

图片来源:Wind

随着MiMo模型的开源,小米刚刚成立不久的小米大模型Core团队也终于浮出水面。小米创始人雷军曾在2023年表示,自2016年组建AI团队以来,到2023年4月第一时间成立专职大模型团队,经过多次扩展,小米AI团队相关人员规模已达3000多人,逐步建立了视觉、语音、声学、知识图谱、NLP、机器学习、多模态等AI技术能力。

小米大力“押宝”大模型早在去年底便已有消息传出。DeepSeek-V3爆火之后,背后的AI“天才少女”罗福莉引发了大众的关注,彼时就有媒体报道称,雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队。

值得一提的是,DeepSeek同日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。据悉,DeepSeek-Prover-V2-671B使用了更高效的safetensors文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达16.38万,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

中信建投研报表示,大模型能力不断迭代增长,但模型之间差异在缩小。这些技术需要在终端设备上应用落地,最终通过这些应用/终端实现商业价值的转化,从而形成一个从投资到变现的完整闭环。目前,Meta、字节、小米等巨头已经开始大力布局端侧AI,抢夺AI Agent入口。除了手机、PC、眼镜、耳机外,潜在的端侧AI基数巨大,家电、机器人、智能车、教育办公设备、玩具等都受益于端侧AI的趋势,AI嵌入将带来广泛的硬件升级。重点关注算力、存储、连接、电力等硬件环节。

(文章来源:每日经济新闻)

文章来源:每日经济新闻
原标题:小米,开源!
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
美方主动向中方传递信息希望谈起来 中方回应:正在评估
美方主动向中方传递信息希望谈起来 中方回应:正在评估
商务部网站 443评论
巴菲特的20句名言!听进去的都赚钱了
巴菲特的20句名言!听进去的都赚钱了
东方财富研究中心 495评论
累计金额超430亿!逾800家A股上市公司今年以来实施回购 个股回购金额排行榜出炉
累计金额超430亿!逾800家A股上市公司今年以来实施回购 个股回购金额排行榜出炉
财联社 33评论
美国证实加拿大及墨西哥汽车零部件免关税
美国证实加拿大及墨西哥汽车零部件免关税
央视新闻 223评论
打开东方财富APP查看更多内容
24小时点击排行
果然出事了
创纪录抛售黄金头寸|等待信号做二次波段
【人形机器人】概念板块十大核心公司一、双林股份:市值317亿,人形机器人、PEE
前海大唐英加基金进驻恒星科技,或对该股后续走势产生积极影响!
巴菲特60年55000倍不可复制
点击查看更多内容
写评论 ...