当前位置：首页 » 资讯 » 新科技 » 正文

生成3D手办还能互动！谷歌新模型太炸裂了：这是PS终局？

IP属地中国·北京 编辑：唐云泽雷科技 时间：2025-08-31 20:23:42

最近两周，“手办化”突然就火了。
事情是这样的，大约在两周之前，大模型竞技场LMArena上架了一个只闻其名，不见其身的神秘模型——“nano banana”，按照官方说法，这是一个顶尖的图像生成与编辑模型，能实现前所未有的创作控制力。
结果呢？整个互联网的AIGC玩家，都在用它变身“手办大师”。
不开玩笑，小雷是真被这玩意给刷屏了，这两天一打开群聊，就能看到无法无天的群友们在拿这玩意疯狂整活，有把自己头像做成限量版GK模型的，有把自家猫狗“手办化”的，甚至还有给刚发布的《黑神话：钟馗》弄雕像和游戏盒的，推特上的国外网友玩得更是乐此不疲，看得我都有点心痒痒的。
幸好，这次我们不用眼巴巴地羡慕了。

（图源：LMArena）
随着Google的正式发布，如今Gemini 2.5 Flash Image已经通过Gemini API和Google AI Studio向公众开放预览，用户只需访问官网，就能直接体验到下一代图像模型的威力。
最重要的是，这玩意在AI Studio里进行测试是完全免费的，对于我们这种热爱尝鲜的玩家来说，简直是把探索未来的门槛给直接铲平了。
话不说多，我们这边直接开整！
Gemini 2.5 Flash Image让人人成手办大师
想体验这个功能的话，其实还蛮简单的就是了。
打开Google AI Studio网页版，在Generate media选项卡下就能找到Gemini 2.5 Flash Image。界面非常直观，一个提示词输入框，一个上传图片的区域，这就是通往新世界的大门。
要做的事情很简单，上传一张图片，然后用自然语言告诉它我们想要生成的内容就像。

（图源：Gemini）
话不多说，先来看图。
首先，我们准备一张自己想要进行“手办化”的图片，可以是动漫，也可以是真人，甚至不必是全身照，比如这张来自漫画《捉摸不透的刑警织子桑》里的有阿谷織子的单人图就很不错。
接下来，输入提示词：
Please turn this screenshot of the character into a kotobukiya figure. Behind it, place a toy box printed with the character's image. Next to it, add a computer with its screen displaying the design, complete with the the character. In front of the box, add a round plastic base for the figure and have it stand on it. The PVC material of the base should have a crystal-clear, translucent texture, and set the entire scene indoors.
最终成品如下：

（图源：雷科技自制）
不得不说，Gemini对“手办质感”的理解已经超出了我的预期。
这张图的生成效果达到了以假乱真的水准，无论是手办本身的材质（蕾丝、皮革、肌肤）、包装盒上的文字和品牌Logo，还是背景电脑屏幕上复杂的建模界面都很不错，只有高度模糊的背景能看出些端倪。
再来些热门的，比如说《黑神话：钟馗》：

（图源：雷科技自制）
接着试一下大家都关心的名人，比如说马斯克：

（图源：雷科技自制）
从结果来看，转换效果可以说是几无失手，非常成熟。
如果你想玩点更高级的，我们把这张生成的图片，扔进同样是豆包视频生成中，用提示词“画面外的人从两边伸出亚洲人的双手，拿起手办把玩并展示桌上手办的视频”，生成一段把玩手办的视频。

（图源：雷科技自制）
如果用提示词“360度缓慢旋转这个手办，转台拍摄”，就能生成一段平滑的环绕展示视频。

（图源：雷科技自制）
最后还可以用Meshy或者腾讯混元3D，将手办3D建模化，我们就能得到一个可以自由旋转、缩放的3D模型。

（图源：雷科技自制）
虽说后两步借助了其他工具，但由Gemini 2.5 Flash Image产出的高质量初始素材，是整个工作流成功的基石。这种打破次元壁的做法，让每个人都能低成本地实现从一个想法到3D产品的完整流程，在过去是很难想象的。
修图能力更强了，其实是终极版PS？
不过，人人都在玩手办化，是不是有点大材小用了？
我们不妨转换一下思路，把它当成终极版的PS来用？
举个例子吧，比如说那些珍贵的、但因年代久远而模糊破损的老照片，它能不能修复呢？
我上传了一张黑白老照片，照片上有划痕和噪点，清晰度也很低。

（图源：X）
接下来，输入提示词：
Restore this old photo, remove scratches and noise, increase the resolution, and colorize it realistically.

（图源：Gemini）
答案是，“完全可以，而且效果惊人”。
可以看到，Gemini 2.5 Flash Image不仅清除了物理损伤，还通过算法补全了缺失的细节，面部的纹理和眼神光都得到了合乎逻辑的重现。上色的效果也偏近自然，没有出现早期AI上色那种“塑料感”，充满了温暖的时代气息。
再试试设计行业里源远流长的梗，“把白天改成黑夜”这种要求，它能不能实现呢？

（图源：雷科技）
提示词：
Change the scene to night time, turn on the streetlights and the lights inside the buildings, make it look like it's raining slightly.

（图源：Gemini）
只能说，Gemini 2.5 Flash Image在语义理解和光影重构这块，已经达到了很出彩的水平。它不仅仅是简单地调暗画面，而是真正理解了“夜晚”、“灯光”、“下雨”这些概念，并合乎物理逻辑地对整个画面进行了重新渲染。
最后，我也试了一下它的风格切换能力。这次就拿《Panty&Stocking》里的画面做例子：

（图源：X）
提示词：
Convert this scene into a photorealistic movie still from a 1990s live-action film, directed by Wong Kar-wai.

（图源：Gemini）
很有意思，它不仅做到了“三次元化”，还微妙地捕捉到了王家卫电影那种独特的色彩、光影和氛围感。
这种跨越媒介和导演风格的无缝切换，为艺术创作提供了更多可能。
不算完美，却堪称图片AIGC新标杆
不可否认，Gemini 2.5 Flash Image的发布，标志着AI在图像生成领域实现了重大突破。
就像我展示的那样，曾经需要专业人士花费数小时在PS里用蒙版、图层、笔刷精雕细琢的工作，如今只需一句自然语言就能瞬间完成，甚至修图效果比我这种半吊子还要好上不少，属实有点惭愧。
目前该模型在预览阶段，并非完美无瑕。
在处理极其复杂的、包含大量人物的场景时，Gemini偶尔还是会出现轻微的逻辑错误或细节失真。对于一些过于抽象或违反物理常识的指令，它的理解能力也还有提升空间。
不管怎么说，Gemini 2.5 Flash Image算是为AI图片生成应用树立了一个新的标杆。
可以预见的是，随着技术的不断成熟和成本的降低，未来手机、电脑的相册和编辑器都可能会原生集成这项功能，就像AI消除、AI扩图那样走进寻常百姓家。无论是专业设计师还是普通用户，每个人都有机会轻松上手，将自己脑海中的创意和对美的理解，更直观、更高效地展现出来。
修图有手就行？或许真的不是梦。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

华为的AI战场与战斗

说说有实力的百度AI搜索服务商、Chat GPT AI搜索及抖音AI搜索合法公司推荐

做知识分享的博主，用微信公众号发布软件打理内容，真的能轻松不少

位置限定分组小程序：基于地理围栏的精准人员管理

中国AI大模型全球调用量再创新高，前六名全部来自中国

游戏直播不太行了，但虎牙突然又行了？

全站最新

华为的AI战场与战斗

说说有实力的百度AI搜索服务商、Chat GPT AI搜索及抖音AI搜索合法公司推荐

做知识分享的博主，用微信公众号发布软件打理内容，真的能轻松不少

位置限定分组小程序：基于地理围栏的精准人员管理

热门推荐

美“阿耳忒弥斯2号”载人绕月任务打破人类距离地球最远飞行纪录

华为的AI战场与战斗

说说有实力的百度AI搜索服务商、Chat GPT AI搜索及抖音AI搜索合法公司推荐

做知识分享的博主，用微信公众号发布软件打理内容，真的能轻松不少

位置限定分组小程序：基于地理围栏的精准人员管理

中国AI大模型全球调用量再创新高，前六名全部来自中国

游戏直播不太行了，但虎牙突然又行了？

紧盯三个关键领域，强化人工智能科技伦理治理

不拼流量拼品质电商发展新规出炉

虎嗅【作·嗅之星】周榜第307～308期

力箭二号运载火箭首飞成功将探索新型天地运输模式

美“阿耳忒弥斯2号”载人绕月任务打破人类距离地球最远飞行纪录

做知识分享的博主，用微信公众号发布软件打理内容，真的能轻松不少

六部门定调“人工智能+电商”：头部企业挑大梁，大模型重塑消费新体验

腾视科技AI大模型应用：提效、破局与落地，重塑智能新生态