OpenAI发布ChatGPT Images 2.0:支持多语言文本、信息图、幻灯片、地图甚至漫画

距离OpenAI上次对ChatGPT AI图像生成重大更新仅过去几个月,当时通过应用编程接口(API)推出了GPT-Image-1.5模型(2025年12月发布),提升了指令遵循能力、色彩和光照效果。如今,经过数周测试,这家开启生成式AI热潮的公司发布了更重大的更新:ChatGPT Images 2.0。该模型此前已在OpenAI和其他主要AI模型供应商使用的第三方测试平台LM Arena AI上以“duct tape”为代号非秘密测试数周。

在此期间,其能力已让早期用户惊叹:可在同一图像中生成长文本块或不同文本面板,极其逼真地生成流行网站和平台的用户界面及截图,复制真实人物(如OpenAI联合创始人兼CEO萨姆·奥特曼),并能进行网络研究并将结果融入图像。今天,该功能正式向ChatGPT所有层级用户推出,OpenAI确认其还可生成平面图、图像网格和多张小图像集,以及多角度角色模型,且几乎所有这些功能都能应用于用户上传的图像。

此次更新包含API用户的新gpt-image-2模型,以及ChatGPT订阅者的“Thinking”功能套件,标志着公司视觉媒体处理方式的根本转变。正如官方发布说明所述:“图像是语言,而非装饰。好的图像像好句子一样,选择、排列和揭示。”OpenAI未提前提供ChatGPT Images 2.0的基准测试,但根据所有输出,可以肯定该模型性能已达“先进水平”。

原文链接:https://venturebeat.com/technology/openais-chatgpt-images-2-0-is-here-and-it-does-multilingual-text-full-infographics-slides-maps-even-manga-seemingly-flawlessly


关注微信号:智享开源 关注微博:IMCN开源资讯网 ,可及时获取信息

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章251篇


[blog_mailer_subscribe]

关注微信

分类