当前位置: 首页 » 资讯 » 新科技 » 正文

谷歌发布图像生成模型Gemini 2.5 Flash Image:多方面优于GPT-4o

IP属地 中国·北京 编辑:孙雅 凤凰网科技 时间:2025-08-27 12:06:50

8月27日,科技媒体The Decoder昨日(8月26日)发布博文,报道称谷歌DeepMind正式推出其最先进的图像生成与编辑模型Gemini 2.5 Flash Image,在Gemini应用中可根据文字指令,在保持人物与动物的外观一致的情况下,提高修改图片的精度。

据介绍,与此前的原生图像生成工具相比,它在根据文字进行图像修改时的准确率更高,谷歌表示,Gemini 2.5 Flash Image在多项任务中优于ChatGPT所用的GPT-4o,特别是在编辑图像时,它可以根据文字提示进行编辑。

该模型还支持通过文本提示进行精确的局部编辑。用户可以通过模糊背景、去除瑕疵、添加颜色或擦除整个物体,无需进行手动选择。同时该模型支持一次融合最多三张图像。

目前用户可通过Gemini App、API等方式访问,其API定价为每百万输出token30美元,单张图像成本约0.039美元。

标签: 图像 模型 谷歌 编辑 科技 外观 人物 物体 用户 颜色 精度 据介绍 图片 瑕疵 动物 文字 背景 凤凰网 媒体 指令 手动 工具 成本 原生 单张 局部 情况 准确率 博文 文本

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。