当前位置：首页 » 资讯 » 新科技 » 正文

谷歌Gemini接入 Veo 3 AI模型：照片进去，带音频的视频出来

IP属地中国·北京 编辑：刘敏 IT之家 时间：2025-07-11 08:04:54

7 月 10 日消息，谷歌今天在 Gemini 应用中上线了基于 Veo 3 模型的图像转视频功能，用户可以将照片变成带有背景音效、环境声、语音的 8 秒钟短视频。
谷歌表示，这项视频功能现已在部分地区向 AI Ultra 和 AI Pro 用户开放，今起先在网页版推出，移动端将在本周逐步上线。
使用时，Gemini 用户只需点击提示栏的“工具”，选择“视频”，上传照片并添加提示词，描述希望照片如何动起来。用户还可以加入对白、音效或环境声等音频描述，谷歌表示音频和画面会实现“完美同步”。最终视频为 720p、16:9 横屏的 MP4 格式。
谷歌表示，用户可以为日常物品赋予动画效果，让绘画作品“活”起来，或为自然景象添加动态，尽情发挥创意。据了解，所有生成视频均带有明显的 AI 水印和隐形的 SynthID 数字水印。

标签：视频谷歌音频照片效果功能环境用户景象隐形动态水印绘画模型动画音效物品部分背景作品图像地区画面秒钟语音消息格式

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

字节、阿里齐变阵，大厂“集中兵力”开打AI办公下半场

第一到第六，全是中国大模型

Anthropic回应开源争议，文字游戏还是商业霸权？

具身智能走到哪了：缺数据是共识，大模型“根基不稳”

一个模型控制机器人从头到脚所有运动，谷歌发布新一代机器人基础模型

见证创新力量！第二届“数龙杯”各项大奖依次揭晓

全站最新

字节、阿里齐变阵，大厂“集中兵力”开打AI办公下半场

第一到第六，全是中国大模型

Anthropic回应开源争议，文字游戏还是商业霸权？

荣耀官宣韩寒出任“荣耀影像创想家”

热门推荐

青岛芯聚产业投资基金登记成立出资额5.01亿

字节、阿里齐变阵，大厂“集中兵力”开打AI办公下半场

第一到第六，全是中国大模型

Anthropic回应开源争议，文字游戏还是商业霸权？

青岛芯聚产业投资基金登记成立出资额5.01亿

DeepSeek今年已增资65%

中信金石、青岛啤酒等成立文化科技投资基金出资额10亿

演员寇占文已被限消

马斯克辟谣特斯拉考虑出售中国业务：假消息

雷军再发英文回应澎程装载能力：只有澎程能做到

广汽本田公布辅助驾驶系统专利

长鑫科技上市首周股价飙涨5倍

张小龙再退出三家粉笔关联公司

工信部：截至6月末5G基站总数达510.2万个，比上年末净增26.3万个

具身智能走到哪了：缺数据是共识，大模型“根基不稳”