很多 AI 设计产品会从文生图开始,这很容易理解:图片模型的 demo 很惊艳,第一张图出来也很快。
但真正的视觉设计产品,不能停在一张好看的 bitmap。海报、传单、名片、菜单、社媒图,最后往往死在那些“不性感”的细节上:文字渲染、信息层级、可打印、准确文案、本地化字体,以及生成之后还能不能改。
这也是我为什么长期看 HTML Design。
代码是 Agent 更直接的输出面
大模型擅长输出指令和代码。当输出是代码时,模型可以把布局、约束、字体、层级和可修改性写进一个可以渲染、检查、迭代和版本化的结构里。
这不是说用户应该写代码,而是 Agent 可以写。
用户不应该关心背后是模型、渲染器、工具调用,还是代码编辑器。用户带来的是一个设计需求,产品应该对结果负责。
画布不一定是普通用户的母语
画布很强大,但它默认用户已经像设计师一样思考。普通用户更多是在描述需求:
- 我要做一个咖啡店招聘海报。
- 这段文字必须完全保留。
- 这个 logo 和二维码要放进去。
- 要能打印。
- 改一下气质,但不要破坏排版。
AI Design Agent 应该从这种自然表达开始,在用户需要的时候再暴露更细的控制能力。
产品责任感比模型表演更重要
我一直坚持的一点是:默认不要让用户选模型。
模型选择很容易变成产品逃避责任的方式。结果不好,就说是用户模型选错了。那就不是产品了,只是套壳。
产品应该尽可能隐藏内部路由,然后对结果质量、成本和稳定性负责。
HTML Design 不是全部答案
HTML Design 不是宗教。有些任务需要图片模型,有些需要矢量操作,有些需要抠图、读图、参考图和特定工具。
我的判断更简单:对于可编辑、文字密集、对打印和排版有要求的视觉设计,代码和指令往往是 Agent 最直接的结构化输出。
这是我正在构建的方向。