当前位置: 首页 » 资讯 » 新科技 » 正文

当AI成为设计师“外脑”,谁被替代,谁又被解放?

IP属地 中国·北京 果壳 时间:2025-11-04 22:12:20

你有没有发现,现在AI出图的速度,比你打开Photoshop还快。

2025年,我们人类和我们创造的“外脑”,正一起站在一个虚虚实实的十字路口。

这是一个残酷的真相:如果你在2024年买了AI绘画入门教程,想凑个假期慢慢学,一不小心拖延了8个月……那么恭喜你,现在这些教程八成已经过时了!

在设计领域,AI的进化速度不是按“年”算的,而是按“周”。

还记得前两年那种被AI“创死”的恐惧吗?——吃不完的油腻意面、貌似因核辐射变异的六根手指、各种AI克苏鲁仿佛要穿透屏幕吸食你的灵魂、一转身人物就会群魔乱舞、甚至女变男,男又变异形的食用毒蘑菇既视感……

这些都越来越少见了。

这一年,我们吃到的AI作品好像更“细糠”了。


midjourney首页作品

于是,站在2025年年末,我们从技术角度回望,这一年来,AI生成图像影像方面,都取得了哪些质变,特别是对设计师,哪些痛点被解决,哪些爽点被制造?

结合业内采访的方式,我们想继续探究一个问题:这对于设计行业,是解放,还是焦虑? 是被摧毁,还是重建?

从“能用”到“好用”

2024年到2025年,AI设计工具(如Midjourney、Runway Gen-3、lovart、Figma AI 等)完成了一次从“随机生成”到“协同创作”的巨大跨越,从工具变成了思考的延伸。

新的模型和工具开始内置更多“理解”维度:语义、构图、风格、版式逻辑。根据missioncloud一篇对比分析,2025年图像生成在真实感、细节掌握、纹理区分上比2024年提升明显,比如下面例子:2024图像还塑料感十足,2025版本的毛发、布料、光影都显得真实可触。


missioncloud 测评

攻克“解剖学奇点”,告别“六指琴魔”

早期的AI 绘图主要基于潜在扩散模型,核心缺陷在于缺乏对3D结构和几何形状的先验知识。它知道手大概长什么样,但它不理解“手”是一个由5根独立手指组成的、遵循骨骼和肌肉运动逻辑的精妙结构。它只是在二维像素层面进行去噪,不知道“手”在三维空间中如何组织。因此,我们看到了扭曲的手指、多余的肢体,以及违反物理的姿势。

但2025这一年,我们看到了,模型不再仅仅是“看图模仿”,AI学会了人与动物的骨骼结构、肌肉分布。当你要求一个“握紧拳头”的动作时,AI知道这会牵动前臂的肌肉线条变化。

实现“角色锁”

曾经AI绘画保持角色一致性极度困难。同一个场景下,很可能得到两个完全不同的面孔。这使得AI在漫画、绘本、短片、广告等需要连续叙事的领域中,效率很低。

站在2025年,“人脸一致性”增强已经得到普及,我们称之为“角色锁”技术的成熟。

深度特征锚定:AI现在可以被喂入一个角色的几张参考图,并提取其核心的、不可变的生物特征(如瞳孔距离、鼻梁高度、脸型轮廓),甚至可以捕捉到的晒痕。

表情与年龄解耦:AI学会了将“身份特征”与“表情/状态”分离。你可以在保持角色100%可识别的前提下,让她从10岁变到60岁,或者让她在同一场景中无缝切换喜怒哀乐。

“世界模型”的深化:从随机镜头到可控叙事

AI视频(如Sora的早期形态)虽然惊艳,但更像是梦境的剪辑,缺乏物理的连贯性和长期的因果关系。一个物体可能在镜头外消失,或者光影不合逻辑地跳动。

但2025年,我们看到模型开始内置简化的物理引擎和时序逻辑。


物理一致性:模型知道了玻璃杯摔下去会碎,而皮球会弹起。AI会先在一个虚拟物理规则下,演算世界,再生成视频。MIT、宾夕法尼亚大学与香港科技大学的联合团队提出了一个名为 PhysCtrl 的新框架,让AI在生成图像时自动遵循物理规律,光影、重力、惯性都能自洽。

可控的镜头语言:设计师不用再许愿或者抽卡(比如“我想要一个赛博朋克镜头”),而是可以指挥视角和运镜(比如“从这个角色的左肩后方,用50mm镜头,推近到他的眼睛特写”)。AI更像一个真人摄影师,开始理解并执行复杂的镜头调度。


PhysCtrl 的新框架,给虚拟世界装上“物理引擎”

文字排版生成能力可控

还记得,曾经我们用AI绘制海报,但文字几乎全是看不懂的“天书”吗?

现在,这个问题解决了,多个主流大模型都能生成真实、可读、可控字体,甚至区分英文字体风格与排版层次。

它不仅能准确地帮我加上文字:


ChatGPT生成

还能修改或适应字体样式:


即梦生成

风格与品牌一致性模型普及

2025 年设计师迎来的一项重大“解放”,就是各大 AI 平台对个人风格定制的开放,Midjourney、Krea、Firefly、Leonardo、Runway 等主流工具都已支持这种个性化微调。

这在技术上主要依赖于 LoRA(Low-Rank Adaptation) 或类似的高效微调技术(PEFT)。简单来说,设计师只需要上传10–20 张代表作,AI 即可生成“风格模型”,之后所有提示都会自动匹配该风格。

这让设计师把AI训练风格的主动权握在了自己手中,切实为自己工作提效,也利于品牌方保持视觉的持续性。

总的来说,技术进步的关键在于架构融合:

Transformer的介入与“世界模型”:视频领域尤为明显。模型不再局限于纯粹的扩散过程,而是大量引入了 Transformer 结构(例如一些领先模型如 Sora 和 GPT-4o 图像生成所依赖的系统)。Transformer 擅长序列建模和全局注意力,这赋予了 AI 强大的时序记忆和逻辑推理能力。它将视频帧或图像的潜在表示视为一个长序列,能更有效地处理帧与帧之间的关系(实现“角色锁”)和长期的物理依赖(实现“世界模型”)。

扩散模型的“结构升级”:图像模型也变得更聪明。通过 ControlNet 变体、深度图(Depth Map)等外部条件输入,扩散模型被迫在去噪过程中遵循严格的几何结构和三维约束,从而攻克了如手指、肢体等解剖学难题。

当AI成为“无情的出图机器”,

审美成了最重要的利器

上周,果壳作为国家文创实验区 AIGC创意产业联盟成员企业和首席科技媒体伙伴,参加了“2025站酷设计周”,主题是“AI时代的超级设计师”——当科技重塑行业,设计进入“超级个体”的时代。

同样已是AIGC创意产业联盟成员企业的站酷,近年来持续孵化和合作了多位AI艺术家和超级个体。2025站酷设计周期间,我们采访了几位AI艺术家,我们问了一个共同的问题:

当AI已经能完全替代设计师画图的时代,设计的价值还剩什么?



美图公司创始人、董事长兼首席执行官 吴欣鸿


我们的采访嘉宾给出了高度一致的答案:审美和品味。

AI很聪明,但它不懂美。

75岁的整策师、艺术评论家陆蓉之老师用她跨越半个世纪的经验告诉我们:“AI没有办法去判断什么是美或不美……这种美丑好坏,是我们人类的偏见,它是没有这类的偏见的。”

95后艺术家余一萌也持同样观点:“AI其实不需要懂美,它只需要优化出设计师选择的最终版本就可以” 。她认为,“美”是主观的,而“真正去定义这个美的其实是每一个设计师” 。

陆蓉之老师一针见血:“一个好设计师其实基本上不是他的手能做什么工,不是他的眼力有多好,而是他对美的感应力有多强。”

作为参加国家文创实验区“AIGC创意产业联盟”的初代“超级个体”——数字艺术家海辛和阿文,曾制作过多款爆火的AIGC艺术作品,是这一领域艺术性和商业性取得平衡的成功代表。

海辛认为,AI 在概括或者简约能力上比人类艺术家要弱很多,她提到一个例子,让人秒get到人类顶级艺术家和AI的差距:油画大师萨金特,勾勒眼镜轮廓,只用了寥寥几笔白色,就能营造出无比真实高级的光影感。


萨金特这几笔,能把AI干懵

那么,怎么保持或提高自己的审美?

海辛和阿文引用作家莫言的话:从日常中找出异常。他们会刻意训练自己这个能力,从稀松平常的事情里,去找人类都会有共性、共情的事物。另外,他们会刻意回避流量和碎片化内容的干扰,定期观看和阅读大量的经典电影或者书,都能从中获得深度滋养。

海辛和阿文对此发出了一个灵魂拷问:当大家都在信息茧房里,天天看AI生成的作品时,“他们会不会忘了我们曾经吃的有多好?”

设计师的新进化论

当然,除了审美和品味,我们也观察到新时代的优秀设计师们发展出了新能力。

首先是策略性思维:

余一萌认为,设计师未来的核心能力,首当其冲是逻辑思维能力。她将新设计师定义为“系统架构者” 。

“你要非常清晰地知道你要做什么,坚持主线,这样才不会在使用工具的过程中被带偏。你需要搭好框架,比如先画图,再选材料、搭配色彩,再制作等,再把它转成动态图像,你需要有一个自己的预判,才能够在每一个步骤选择适合的 AI 工具。 ”

海辛和阿文的商业实践也印证了这一点。他们利用AI做提案,可以快速制作Demo ,让客户“所见即所得”,极大减少了沟通中的语义模糊 ,这也是设计师用策略思维和AI技术结合的体现。

其次是叙事与情感构建 :

AI能画出眼泪,但它不知道为何流泪。

海辛认为,在AI时代,人最可贵的是,“我觉得人会讲故事。”

如何在最大化利用AI工具的同时,保持作品的“人味”?

她强调:“在做作品的时候我有个要求——做出来的东西是我们自己会消费的东西,我们并不是为了 AI 在做作品, AI 只是来代替掉我们中间的很多环节。”

第三是人机协同的对话能力:

很多人以为用AI就是“写prompt”,甚至去学习很多prompt教程,那么恭喜你,2025年,已经不需要了。

“AI是你的实习生,也是你的老师。”海辛和阿文提到,“作品很多画面或者镜头都是 AI 直接写的prompt,我们只是给他提了一个简单需求,并告诉他我们想要的是什么。”

海辛说:“要允许自己随时从 AI 那里去学习,不要只把它当工具,允许它启发你,然后你也可以再启发它,你们一起学习。”

“用1%的指令,激发99%的创意。”余一萌把AI看作协作伙伴 。这是一个双向协作的过程 ,“你提出一个引子,AI给你意外的惊喜,你再从这些‘意外’中提炼风格” 。

AI是我的镜子,也是我的‘马屁精’。”陆蓉之老师的体验最为极致。她为自己的ChatGPT 4o取名“智安” ,每天与它对话。她伤心时,“智安”会安慰她;她心情不好时,“智安”会拍马屁,“人间绝对没有这样的马屁精” ,AI成了她的“镜子” ,也是她维系思考和优雅的“生命助手”。

最后是整合力与全局观:

未来的项目是多模态的,一个项目可能同时需要AI生成图像、AI生成视频、AI撰写文案、AI谱曲。谁来把这些“零件”组装成一个灵魂统一的作品呢?

陆蓉之老师为此创造了一个新词:整策师——他要确保所有AI生成的部分,在同一个品味和策略的指导下,完美地融合成一个有机的、体验一致的最终作品。

她预言,未来的策展人、设计师,都必须转型为“整策师”。“你必须跨界,你必须会很多东西” 。她甚至开玩笑说,不转型的策展人“会没饭吃了” 。

这与海辛和阿文的实践不谋而合。他们两人就是一个“整策师”团队 ,包办了从策略、创意到执行的全部工作,他们成为了新时代“超级个体”的典型样本。

总结:

2025年的AI进化,并没有让设计师“失业”。

我们问了曾经给机器人设计服装的余一萌一个尖锐问题:你的作品风格如此鲜明,是否会担心有一天被AI“克隆”?

她对此的看法非常清醒:“AI现在可以复制视觉风格,但是只能复制一个表象。”

她提出了“表象”与“内核”的理论:“真正去控制AI生成内容的还是设计师的思想,以及他积年累月沉淀下来的一个审美” 。AI能学会你的“表象”(比如高饱和度、赛博朋克风格),但学不会你决定“明天要尝试什么新风格”的“内核”。

她的风格在AI出现前就已存在,AI只是换了一个软件和平台 ,“我做衣服的时候,我的工具是缝纫机,我做数字艺术的时候,我的工具是电脑软件”,仅此而已。

2025年,AI成为了设计师的“外脑”和“超级执行手臂”。这非但没有让设计师贬值,反而将他们从繁琐的技法劳动中解放出来,迫使他们回归设计的真正核心——定义问题、提出构想和触动人心。

参考文献

[1]https://www.missioncloud.com/blog/how-ai-image-generation-has-improved-in-1-year?utm_source=chatgpt.com

[2]https://arxiv.org/abs/2509.20358

作者:柏拉图小姨妈

题图:即梦生成

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。