Meta发布最强开源大模型Llama 3 多模态版本随后将上线

财联社 04-19 02:33

当地时间周四,美国科技巨头Meta推出了其最强大的开源人工智能(AI)模型Llama 3,以追赶行业领导者OpenAI。美股盘中,Meta股价上涨逾2%,今年迄今涨近43%。

Meta首席执行官扎克伯格声称,Llama 3有8B和70B两个版本,大版本的Llama 3将有超过4000亿参数。由于预训练和指令微调,Llama 3相比Llama 2有了极大的改进。

Llama 3在多种行业基准测试上展现了最先进的性能,并提供了包括改进的推理能力在内的新功能。Meta认为Llama 3是市场上最好的开源大模型。开源意味着这些模型的代码和数据对公众开放,任何人都可以查看、修改和使用。

开发人员抱怨之前的Llama 2模型无法理解基本的上下文,在处理查询时经常出现混淆。谷歌的Gemini AI图像生成工具也遇到了类似问题,它在生成历史人物的图像时产生了不准确的描述,这引起了广泛批评。

现在,Meta在训练Llama 3时使用了更高质量的数据,这些数据帮助AI模型更好地识别语言中的细微差别,从而提高其对上下文的理解能力。

Meta提到,他们为Llama 3模型输入的数据量是Llama 2的七倍,这可能有助于提高模型的性能和准确性。还利用了由AI生成的“合成”数据来加强模型在编码和推理等特定领域的能力。

据Meta介绍,Llama 3将被整合到其虚拟助手Meta AI中,这是免费使用的同类产品中最先进的AI应用程序。Meta AI助手已经在Facebook、Instagram、WhatsApp和Messenger等应用中上线,随后也将迎来更新。

Meta首席产品官Chris Cox在接受采访时说,这家社交媒体巨头为Llama 3配备了新的计算机编码能力,这次除了可以输入文本外,还可以输入了图像,不过目前该模型只能输出文本内容。因此,Llama 3目前还不是多模态大模型。

但他补充说,更高级的推理能力,比如制定更长的多步骤计划的能力,将在随后的版本中出现。并计划在未来几个月发布多模态版本,这意味着它们可以同时生成文本和图像。

Cox表示,最终的目标是帮助用户从繁杂的工作中解脱出来,让生活更轻松快乐,无论是与企业互动,还是写作,或者是计划旅行。

此外,Llama 3很快将在亚马逊AWS、Databricks、谷歌云、Hugging Face、Kaggle、IBM的云平台WatsonX、微软云Azure、英伟达的NIM和Snowflake上推出,并得到AMD、AWS、戴尔、英特尔英伟达提供的硬件平台支持。

(文章来源:财联社)

文章来源:财联社
原标题:Meta发布最强开源大模型Llama 3 多模态版本随后将上线
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
美联储宣布维持联邦基金利率目标区间不变
美联储宣布维持联邦基金利率目标区间不变
央视新闻客户端 139评论
中央定调下一步经济工作 消化存量房产和优化增量住房
中央定调下一步经济工作 消化存量房产和优化增量住房
中国新闻网 648评论
美股三大指数收盘涨跌不一 AMD股价跌近9%
美股三大指数收盘涨跌不一 AMD股价跌近9%
东方财富Choice数据 78评论
鲍威尔:我也不知道还要多久才能降息 但下一步不太可能是加息
鲍威尔:我也不知道还要多久才能降息 但下一步不太可能是加息
财联社 3评论
打开东方财富APP查看更多内容
24小时点击排行
节前最后一个交易日,近40家上市公司停牌,即将ST!青海春天、爱康科技、天创时尚
五一特供:读懂会议,锚定方向!
祝大家五一快乐
300765,A股最强小而美,市占率50%全球第一,下一个华东医药!
林园:A股有望随时爆发,甚至突破6124历史最高点
点击查看更多内容
写评论 ...