当前位置: 首页 » 资讯 » 新科技 » 正文

谷歌Gemini接入 Veo 3 AI模型:照片进去,带音频的视频出来

IP属地 中国·北京 编辑:刘敏 IT之家 时间:2025-07-11 08:04:54

7 月 10 日消息,谷歌今天在 Gemini 应用中上线了基于 Veo 3 模型的图像转视频功能,用户可以将照片变成带有背景音效、环境声、语音的 8 秒钟短视频。

谷歌表示,这项视频功能现已在部分地区向 AI Ultra 和 AI Pro 用户开放,今起先在网页版推出,移动端将在本周逐步上线。

使用时,Gemini 用户只需点击提示栏的“工具”,选择“视频”,上传照片并添加提示词,描述希望照片如何动起来。用户还可以加入对白、音效或环境声等音频描述,谷歌表示音频和画面会实现“完美同步”。最终视频为 720p、16:9 横屏的 MP4 格式。

谷歌表示,用户可以为日常物品赋予动画效果,让绘画作品“活”起来,或为自然景象添加动态,尽情发挥创意。据了解,所有生成视频均带有明显的 AI 水印和隐形的 SynthID 数字水印。

标签: 视频 谷歌 音频 照片 效果 功能 环境 用户 景象 隐形 动态 水印 绘画 模型 动画 音效 物品 部分 背景 作品 图像 地区 画面 秒钟 语音 消息 格式

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。