跳到主要内容
收听文章00:00 / 00:00

GPT-Image-2:一张海报打破固有认知

· 阅读需 7 分钟
DingZhiyu
Southwest Petroleum University

事情是这样的。

2026-04-21,OpenAI 发了 Introducing ChatGPT Images 2.0

我一开始其实没太当回事。

不是说不期待,而是这两年 AI 生图的惊艳时刻太多了,大家已经被训练得有点麻木。你给它一句话,它给你一张漂亮图。光影很好,氛围很好,细节也挺满。然后呢。

然后很多时候就没有然后了。

尤其是一到真正要干活的场景,问题就来了。你想让它做一张能用的海报,它开始胡写字。你想让它组织一堆信息,它开始把版面塞成一个五颜六色的 PPT 封面。你想让它兼顾人物、履历、技术方向和视觉风格,它经常会非常努力,然后非常露馅。

所以刚发布那两天,我先在网上翻了翻别人用 ChatGPT Images 2.0 做的图,确实觉得很厉害,但还停留在隔着屏幕围观的层面。

直到今天我自己上手试了一下。

我把自己的信息丢进去,让它做一张个人简历海报。

成图弹出来那一下,我真的愣了几秒。

说实话,我以前对 AI 生图的预期是很固定的。

它可以做氛围,可以做概念,可以做那种一眼看过去很爽的情绪图。比如赛博城市,未来实验室,雨夜霓虹,孤独背影,穿着风衣的人站在巨大的屏幕前。

这种图当然好看。

但它离真正的设计交付,中间隔着一条很宽的河。

真正麻烦的不是画得像不像,而是它能不能把信息安放好。名字要在哪里,技术方向怎么呈现,项目经历怎么分层,奖项和技能怎么不打架,整张图看上去是不是一个统一的视觉系统,而不是一堆素材被强行按在画布上。

简历海报刚好是这类场景的压力测试。

它不能只好看。

它还得讲清楚。

它不能只是很有科技感。

它还得像一张真的能拿出去给人看的设计初稿。

这就很要命了。因为 AI 生图以前最容易翻车的,恰恰就是这些地方。文字会错,排版会乱,信息层级会塌,人物会像从另一个模型里临时借来的,背景会变成那种蓝光电路线大杂烩。

我跟你说,那个味儿太熟了。

就是所有东西看起来都很 AI,但没有一处真的像人在做设计。

但这张图给我的感觉不太一样。

最让我意外的不是人像有多像。

真的不是。

人像这件事当然重要,但我看到这张图的时候,第一反应反而是,它居然在认真处理信息。

它没有只盯着脸,也没有只往画面上贴蓝光、电路、HUD、六边形网格这些科技感老三样。它把名字、HPC、项目经历、奖项、技术方向这些东西放到了一个相对统一的版式里,而且整个画面有主次,有留白,有视觉重心。

不是完美。

小字肯定还要人工校对,有些细节也不能直接拿来当最终版。比如某些描述是否准确,某些排版是否符合真实简历的严肃程度,这些还是要人来收口。

但问题是,它已经不是那种只能拿来发朋友圈说一句好酷的图了。

它像一个可以被讨论的初稿。

这个变化其实挺大的。

因为很多创作任务最折磨人的地方,不是最后那 20% 的精修,而是最开始那一片空白。你脑子里知道自己要一个东西,但说不清它具体长什么样。你打开设计软件,画布白得发亮,鼠标在那儿晃半天,最后去找参考图,一找就是一个小时。

说到这里你应该能懂我为什么兴奋了。

gpt-image-2 这次让我感兴趣的点,不是它替你做完了设计,而是它把第一张能看的东西推到了你面前。

你可以说这个字要改。

你可以说这里太满了。

你可以说项目经历应该更突出,奖项不要压过名字,HPC 的技术感可以再克制一点。

但你终于不是对着空气说话了。

你是在对着一张已经存在的图说话。

坦率地说,这才是 AI 工具真正开始有用的地方。不是替你一键生成一个完美成品,而是把你的想法从一团雾里拽出来,变成一个可以被看见、被指出问题、被继续修改的对象。

我有时候觉得,很多人讨论 AI 创作时太爱走极端。

一边说设计师要完蛋了。

一边说 AI 永远不可能理解真正的审美。

这两个判断我都不太想站。

因为真正发生的事情,可能没有那么戏剧化。它更像是工作流里某个很烦人的环节突然被削薄了。不是从此没有设计师了,而是从此那个从零开始憋第一稿的痛苦,可能会少很多。

你还是需要判断力。

你还是需要审美。

你还是需要知道什么信息该突出,什么细节必须删掉,什么地方看着高级但其实是廉价的套路。

只是以前这些能力要先穿过一大片空白画布才能发挥作用,现在它可能先给你一个靶子。

这就很不一样。

回到这次的 gpt-image-2

官方帮助中心里说,ChatGPT Images 2.0 已经覆盖所有订阅层级,开发者文档里 gpt-image-2 也是最新的 GPT Image 模型,快照能锁到 gpt-image-2-2026-04-21。这些信息本身当然重要,但如果只是复述参数和发布节奏,其实没什么意思。

真正有意思的是,它在把图像生成从漂亮图片往复杂视觉任务推进。

海报、信息图、讲义、简历、活动物料、产品图、课程封面,这些东西以前不是不能用 AI 做,而是经常做到一半就让人想叹气。因为它太会生成,但不太会组织。

而这次,我第一次比较强烈地感觉到,它开始会组织了。

当然,我现在说这些也还早。

一张图不能代表全部,尤其是这种刚发布不久的模型,兴奋很容易,冷静下来做十几轮测试才有资格下结论。我后面应该还会继续试别的图,尤其是多语言文字、复杂信息图、项目展示页这些更难的场景。

但今天这张简历海报,确实值得单独记一笔。

它让我意识到一件事。

AI 生图最有价值的方向,可能不只是让普通人做出一张漂亮图。

更重要的是,它让普通人更快拥有一个可以开始修改的东西。

从空白到初稿。

就这一步,已经很大了。

评论