OpenAI反击谷歌:ChatGPT图像功能大升级 敲打Photoshop“饭碗”

财联社 昨天 17:34
权威精选

①OpenAI推出新版ChatGPT图像功能,生成更快、编辑更准,支持精细地添加、删除、合并等操作,速度最高提升4倍,正面挑战谷歌Nano Banana和传统修图软件;②新模型成本也较上一代下降20%;③在中文、阿拉伯语等语言的图像生成领域,谷歌依然大幅领先OpenAI。

OpenAI与谷歌的世界顶级AI应用之战,又展开新一轮攻防。

北京时间周三凌晨,OpenAI宣布推出新版ChatGPT图像功能,除了图像生成质量更好、生成速度更快外,新版Images 模型在图像编辑的精确性方面也迎来重要进步。可以说,OpenAI不仅向谷歌备受赞誉的Nano Banana系列模型发起反击,还顺势踢了一脚Photoshop的“饭碗”。

OpenAI介绍称,基于最新旗舰图像生成模型的“ChatGPT图像”功能,能够在保持细节完整的同时进行精确编辑,更有可能呈现出用户希望看到的效果。在保持细节完整的同时进行精确编辑,生成速度提升至多4倍

当然,图像生成模型的效果,得用图像来说明。

作为此次升级的最关键提升,OpenAI介绍称,新模型擅长多种类型的精确编辑,包括添加、删除、合并、混合和转置,在获取修图效果的同时,保留图片本身的特点

举例而言,以下是ChatGPT新图像模型生成的90年代末的洛杉矶街头摄影(演示版)。

→把人物的衬衫改成红色帽子改成黄色,限速改为15卡车改成消防车

→在左侧加一群观看的人,右侧人行道上栖着一只鹰,远处有一只飞船在天空中飞过;

→带有该图像全包印花的T恤挂在晾衣绳上;

→将那件T恤给穿到滑板手身上。

作为AI生成图像的重要应用,ChatGPT图像在创造性改造现有图片方面也有进步。例如将公司CEO奥尔特曼的个人照,转换成美国80年代的健美操教练,或是把他的脸放进世界名画《戴珍珠耳环的少女》中。

另外,ChatGPT也向谷歌的传统优势项目——生成富含文字信息的示意图,发起了挑战。OpenAI表示,该模型在文本呈现上更进一步,能够处理更密集、更小的文字

需要说明的是,虽然ChatGPT在生成英文字体时已经能够“以假乱真”,但官方也承认,这个新模型在生成中文、阿拉伯语、希伯来语方面仍存在局限性

因此,至少在中文文字图像生成方面, Nano Banana依然是彻底碾压ChatGPT的存在

值得一提的是,新图像生成模型更强、也更便宜了。与GPT Image 1相比,升级后的GPT Image 1.5图像输入和输出成本均降低20%。

(文章来源:财联社)

文章来源:财联社
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
中一签36万!沐曦股份科创板上市 成近十年最赚钱新股
中一签36万!沐曦股份科创板上市 成近十年最赚钱新股
东方财富研究中心 2762评论
中金公司吸收合并东兴证券、信达证券预案出炉 明日复牌
中金公司吸收合并东兴证券、信达证券预案出炉 明日复牌
证券时报 1554评论
美股三大指数下跌 纳指跌超1% 英伟达跌超3% 纽约期银涨超6%
美股三大指数下跌 纳指跌超1% 英伟达跌超3% 纽约期银涨超6%
东方财富Choice数据 135评论
高端产品涨价70%!近500亿杀入光模块(附股)
高端产品涨价70%!近500亿杀入光模块(附股)
东方财富研究中心 250评论
打开东方财富APP查看更多内容
24小时点击排行
操作:半导体起飞!不等了,乘胜追击,速速发车!
操作:CPO狂飙吃大肉!不等了,乘胜追击,重仓月月兴等,发车
别慌!4000家下跌只是烟雾弹,主力悄悄抄底,A股大反攻来了!
深夜利好!9个龙头回购全部注销,这个中字头回购10亿注销
首个150岁人类已出生?科学家10亿美元押注新兴技术,对赌寿命极限
点击查看更多内容
写评论 ...