GPT-Image-2：一张海报打破固有认知

2026年4月23日 · 阅读需 7 分钟

DingZhiyu

Southwest Petroleum University

2026-04-21，OpenAI 发了 Introducing ChatGPT Images 2.0。

我一开始没太当回事。这两年 AI 生图的惊艳时刻太多了，已经有点麻木。你给它一句话，它给你一张漂亮图。光影很好，氛围很好，细节也挺满。然后呢。

然后很多时候就没有然后了。

尤其是一到真正要干活的场景，问题就来了。你想让它做一张能用的海报，它开始胡写字。你想让它组织一堆信息，它开始把版面塞成一个五颜六色的 PPT 封面。你想让它兼顾人物、履历、技术方向和视觉风格，它经常会非常努力，然后非常露馅。

所以刚发布那两天，我先在网上翻了翻别人做的图，确实觉得厉害，但还停留在隔着屏幕围观的层面。

直到今天我自己上手试了一下。

我把自己的信息丢进去，让它做一张个人简历海报。

成图弹出来那一下，我真的愣了几秒。

说实话，我以前对 AI 生图的预期是很固定的。

它可以做氛围，可以做概念，可以做那种一眼看过去很爽的情绪图。比如赛博城市，未来实验室，雨夜霓虹，孤独背影，穿着风衣的人站在巨大的屏幕前。

这种图当然好看。

但它离真正的设计交付，中间隔着一条很宽的河。

真正麻烦的不是画得像不像，而是它能不能把信息安放好。名字要在哪里，技术方向怎么呈现，项目经历怎么分层，奖项和技能怎么不打架，整张图看上去是不是一个统一的视觉系统，而不是一堆素材被强行按在画布上。

简历海报刚好是这类场景的压力测试。

它不能只好看。

它还得讲清楚。

它不能只是很有科技感。

它还得像一张真的能拿出去给人看的设计初稿。

这就很要命了。因为 AI 生图以前最容易翻车的，恰恰就是这些地方。文字会错，排版会乱，信息层级会塌，人物会像从另一个模型里临时借来的，背景会变成那种蓝光电路线大杂烩。

我跟你说，那个味儿太熟了。

就是所有东西看起来都很 AI，但没有一处真的像人在做设计。

gpt-image-2 生成的 Ding Zhiyu HPC 简历海报 — 最让我意外的不是人像有多像，而是它真的把技术方向、履历信息和版式放到了一张像样的海报里。

但这张图给我的感觉不太一样。

最让我意外的不是人像有多像。

真的不是。

人像这件事当然重要，但我看到这张图的时候，第一反应反而是，它居然在认真处理信息。

它没有只盯着脸，也没有只往画面上贴蓝光、电路、HUD、六边形网格这些科技感老三样。它把名字、HPC、项目经历、奖项、技术方向这些东西放到了一个相对统一的版式里，而且整个画面有主次，有留白，有视觉重心。

不是完美。

小字肯定还要人工校对，有些细节也不能直接拿来当最终版。比如某些描述是否准确，某些排版是否符合真实简历的严肃程度，这些还是要人来收口。

但问题是，它已经不是那种只能拿来发朋友圈说一句好酷的图了。

它像一个可以被讨论的初稿。

这个变化其实挺大的。

因为很多创作任务最折磨人的地方，不是最后那 20% 的精修，而是最开始那一片空白。你脑子里知道自己要一个东西，但说不清它具体长什么样。你打开设计软件，画布白得发亮，鼠标在那儿晃半天，最后去找参考图，一找就是一个小时。

说到这里你应该能懂我为什么兴奋了。

gpt-image-2 这次让我感兴趣的点，不是它替你做完了设计，而是它把第一张能看的东西推到了你面前。

你可以说这个字要改。

你可以说这里太满了。

你可以说项目经历应该更突出，奖项不要压过名字，HPC 的技术感可以再克制一点。

但你终于不是对着空气说话了。

你是在对着一张已经存在的图说话。

这才是 AI 工具真正开始有用的地方。不是替你一键生成一个完美成品，而是把你的想法从一团雾里拽出来，变成一个可以被看见、被指出问题、被继续修改的对象。

很多人讨论 AI 创作时太爱走极端。一边说设计师要完蛋了，一边说 AI 永远不可能理解真正的审美。

这两个判断我都不太想站。

因为真正发生的事情，可能没有那么戏剧化。它更像是工作流里某个很烦人的环节突然被削薄了。不是从此没有设计师了，而是从此那个从零开始憋第一稿的痛苦，可能会少很多。

你还是需要判断力。你还是需要审美。你还是需要知道什么信息该突出，什么细节必须删掉，什么地方看着高级但其实是廉价的套路。

只是以前这些能力要先穿过一大片空白画布才能发挥作用，现在它可能先给你一个靶子。

这就很不一样。

回到这次的 gpt-image-2。

官方帮助中心里说，ChatGPT Images 2.0 已经覆盖所有订阅层级，开发者文档里 gpt-image-2 也是最新的 GPT Image 模型，快照能锁到 gpt-image-2-2026-04-21。这些信息本身当然重要，但如果只是复述参数和发布节奏，其实没什么意思。

真正有意思的是，它在把图像生成从漂亮图片往复杂视觉任务推进。

海报、信息图、讲义、简历、活动物料、产品图、课程封面，这些东西以前不是不能用 AI 做，而是经常做到一半就让人想叹气。因为它太会生成，但不太会组织。

而这次，我第一次比较强烈地感觉到，它开始会组织了。

当然，我现在说这些也还早。

一张图不能代表全部，尤其是这种刚发布不久的模型，兴奋很容易，冷静下来做十几轮测试才有资格下结论。我后面应该还会继续试别的图，尤其是多语言文字、复杂信息图、项目展示页这些更难的场景。

但今天这张简历海报，确实值得单独记一笔。

它让我意识到一件事。

AI 生图最有价值的方向，可能不只是让普通人做出一张漂亮图。

更重要的是，它让普通人更快拥有一个可以开始修改的东西。

从空白到初稿。

就这一步，已经很大了。

评论