当前位置: 首页 » 资讯 » 新科技 » 正文

讲睡前故事的,未必是亲妈......

IP属地 中国·北京 编辑:唐云泽 果壳 时间:2025-08-30 22:20:40

期待 AI 创作儿童绘本的点子由来已久,但一直难觅成功的案例——那种孩子喜欢并接受,父母信任又安心的。

去年,Google I/O 期间推出了一个比较小众的实验性项目(Infinite Wonderland)。

Google 跟几位艺术家合作,将图片生成模型(当时是 Imagen 2)训练成各自独特的风格。成果以一本《爱丽丝漫游奇境记》在线绘本呈现。

当你随机点击书中的一段文字,这段文字则会作为提示词实时生成一张配图。为了看起来不像“预制菜”,开发者在生成过程中加入了随机种子(Seed),这样即便反复点击同一段文本,生成的也是为同一段内容搭配的不同图片。


Infinite Wonderland

这个项目在创意性和艺术性上都很有特色,但当时,他们只做了爱丽丝那一个故事。

也算是没让人等待太久。最近,我发现 Gemini 上新了一个 AI 故事书的新模块“Storybook”,(https://gemini.google/overview/storybook/)

比 Infinite Wonderland 厉害的是,Storybook 不仅能“绘”,还能“讲”,它根据你输入的灵感,讲出来一个完整的故事。加上还有朗读功能,语速适中,发音标准。

这不但能解救睡前被缠住讲故事的父母,甚至还能当作完美的英语启蒙教学。

轮到 AI 讲睡前故事了

我请教了几位有孩子的家长朋友,并总结了他们挑选儿童绘本的大致逻辑:图像和文本质量要过关;分“年龄段”;故事有逻辑,线索丰富最好。我们一起看看 Storybook 能不能满足这些需求?

prompt:For two-year-old; caterpillar’s adventure story; picture book。看到 AI 给我的绘本之后,我倍感羞愧。相比之下,人类会敷衍多了。












右滑查看完整绘本

它讲述了一个毛毛虫不断长大、啃食,进入蛹期形成茧,再破茧成蝶的故事。

首先,AI 生成的插画质量不错,清晰度高,色彩丰富,甚至将毛毛虫长大的面部神情展现了出来。总的来说,是一个情节简单、欢快的科普小故事。

接着我让它生成“一本适合五岁小孩的侦探故事,背景发生在图书馆,插图《玩具总动员》风格。”












右滑查看完整绘本

角色有穿风衣的熊侦探、戴眼镜很显睿智的猫头鹰教授、骑士、偷了故事书的公主玩偶。但是公主在几张图上都不一样,说明角色一致性还有待提高。

先不说插图风格,玩具在晚上活过来还挺“玩总”的。

然而我不太理解一个情节,就是保护童话书的骑士为熊侦探提供线索(后来我反应过来,既然熊能当侦探,为什么骑士不能去图书馆值夜班保安,果然大人的想象力还是太局限。)

你可以直接在 Gemini 的对话框里输入希望对绘本进行的调整。比如我当时要求调整一下“骑士”角色,换一个找寻失窃图书的线索。

然后 Gemini 将骑士换成了一个在懒人沙发上睡觉的熊,说得几乎同样的台词。只能说,Gemini 理解了我的需求,但没有执行得很好。



右滑查看完整绘本

父母希望小孩在成长过程中逐渐理解“友情”、“勇气”等“抽象概念”,但是有时候苦于找不到一个合适的机会。如果这些从一本小孩经常阅读的绘本中演绎出来,会是一个很好的教育方式。

比如你跟 Gemini 说,“我7岁的孩子不愿意在奶奶家过夜,创作一个故事让他们打开心结。”












右滑查看完整绘本

Storybook 很有想象力的一点是,还支持上传文件。比如孩子刚画了一张画,满心期待地给你看,你除了夸夸,还可以让 AI 基于这张画生成一个故事(母慈子孝这不就来了)。













首图来自小红书网友,右滑查看基于这张图片生成的完整绘本

或者孩子总是缠着你,让你解释啥是黑洞、人工智能能做什么、你做啥工作的?为什么总是那么忙……你都不必再用一句,“你还小,现在还理解不了,长大了自会知道”敷衍了事。

如果小孩已经认得了全部的单词,你可以要求 AI 重新遣词造句,逐步提升阅读难度。建议后面加上“点读”功能就更好了。

目前该功能支持中文、英文、意大利语等在内的45种语言。建议你用来生成架空的故事,比如有一次我尝试让它做一本“荆轲刺秦王”绘本,不出意外的,AI 又胡说八道了。

但会讲故事的 AI

也无法代替父母的陪伴

随着我和 Gemini 聊得越来越投入,它告诉我,Storybook 这个功能始于一位开发者(还是个奶爸)使用 Gemini API 参加 Google AI Developer Challenge 的一个项目。

背后大概的技术链条是,利用 Gemini 创作一个10页的故事——Gemini 再为每一页故事创建图片提示,发送给 Imagen——再由模型微调技术保证画面风格迁移和人物角色的一致性,类似基于 Stable Diffusion 做的 LoRA 和 Dreambooth,你可以将它理解成生图模型上打的一个“补丁”。

就在最近,Google 推出了Gemini 2.5 Flash Image。目前不清楚 Storybook 是不是更新到这个最新的图片生成模型,但可以看出角色一致性、完全基于提示的图像生成和编辑一直是图像模型追求的能力提升,也是图像模型产生实用价值的关键。












prompt:Using a Claymation art style, create a storybook about friendly bees and how useful they really are to the earth, to help my kids lose their fear of them.右滑查看完整故事书












第一次调整,用自然语言跟 Gemimi 对话,让它将黏土风格换成水彩,右滑查看完整故事书












第二次调整,让 Gemini 将男孩换成一个名叫 Alice 的女孩,并将水彩风格换成漫画风,右滑查看完成故事书

应该是为了保证一致性效果最佳,Storybook 目前至多生成十页绘本,限制了它没法展现复杂逻辑或宏大主题的故事,总是看得我意犹未尽的。

不好的反馈声有两种,一是,担心小孩过早接收到 AI 的“陈词滥调”、担心生成的内容没有经过人工检验,不适合阅读;

二是,这样 AI 将进一步淹没出版、作家、插画师等行业的努力——目前有第三方做了一个在线绘本库,上面已经上传了三百多个经挑选过的用 Storybook 生成的绘本,并根据年龄段、情绪基调、语言、类型、故事背景做了区分(https://geministorybook.gallery/)。


网站截图












从网站截图的一本,右滑查看完整故事书

不过我想说,甄别不出上述问题的家长,或许此前也不会花多少心思挑选绘本。

技术中立太老生常谈了。Storybook 可以作为低龄儿童的辅助阅读材料,如果你用承担认字和阅读分级教育作用的正规出版图书作为标尺,那么 AI 绘本显然不够如此严谨。

能让小孩时常回味一些和家庭、朋友之间的美好瞬间,父母为孩子讲解就在当下他所感兴趣,或困扰着他的话题,也许是比起传统绘本,AI 绘本更有价值的地方。

作者:TY

编辑:沈知涵

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新