DeepSeek发布Prover-V2模型 参数量达6710亿

科创板日报 04-30 18:41

DeepSeek今日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。据悉,DeepSeek-Prover-V2-671B使用了更高效的safetensors文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达16.38万,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

(文章来源:科创板日报)

文章来源:科创板日报
原标题:DeepSeek发布Prover-V2模型,参数量达6710亿
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
美方主动向中方传递信息希望谈起来 中方回应:正在评估
美方主动向中方传递信息希望谈起来 中方回应:正在评估
商务部网站 451评论
巴菲特的20句名言!听进去的都赚钱了
巴菲特的20句名言!听进去的都赚钱了
东方财富研究中心 500评论
累计金额超430亿!逾800家A股上市公司今年以来实施回购 个股回购金额排行榜出炉
累计金额超430亿!逾800家A股上市公司今年以来实施回购 个股回购金额排行榜出炉
财联社 33评论
美国证实加拿大及墨西哥汽车零部件免关税
美国证实加拿大及墨西哥汽车零部件免关税
央视新闻 224评论
打开东方财富APP查看更多内容
24小时点击排行
果然出事了
创纪录抛售黄金头寸|等待信号做二次波段
【人形机器人】概念板块十大核心公司一、双林股份:市值317亿,人形机器人、PEE
前海大唐英加基金进驻恒星科技,或对该股后续走势产生积极影响!
巴菲特60年55000倍不可复制
点击查看更多内容
写评论 ...