【头部财经】5 月 15 日,谷歌 I/O 开发者大会正式开幕。大会期间,谷歌展示了多项与 AI 相关的成果和进展。
在搜索业务方面,谷歌进行了全面的 AI 改造,并推出了 AI Overviews 搜索功能。该功能使用 Gemini 大模型来综合信息并回答复杂问题,本周将向美国所有用户推出服务。
同时,谷歌还升级了 Gemini 模型,将上下文窗口从 100 万 tokens 增加到 200 万,使模型能够理解更长的文本和视频内容。此外,谷歌还推出了 Gemini 1.5 Flash 轻量化小模型,旨在降低部署人工智能的成本并加快响应速度。
在视频生成方面,谷歌发布了据称效果超越 Sora 的视频生成模型 Veo。该模型能够根据文本、图像创建高质量的 1080P 视频,用户可以对光照、镜头语言、视频颜色风格等进行设定。
在语音视觉交互方面,谷歌展示了类似于 GPT-4o 的语音视觉交互功能 Gemini Live。在演示过程中,Astra 能够识别各种物体甚至代码,并与人类进行实时语音互动。
此外,谷歌还推出了 AI 智能体 Project Astra,该智能体能够帮助人们的生活变得更方便。
谷歌搜索负责人莉兹·里德在发布会上称,谷歌搜索可以做的事情超出人们的想象,从回答、计划、需求定制到组织和视频搜索,Google 都会替用户完成,而用户需要做的只有提问。
在大会进行到中途,桑达尔·皮查伊低调宣布了谷歌的第六代张量处理单元 (TPU) 称为 Trillium,将于今年晚些时候向其云客户提供。
总的来说,谷歌 I/O 开发者大会展示了谷歌在 AI 领域的多项创新成果,这些成果将为用户带来更加智能、便捷的体验。