当前位置: 首页 » 资讯 » 新科技 » 正文

对抗 OpenAI GPT-5.2,谷歌推出Gemini Deep Research智能体

IP属地 中国·北京 环球网资讯 时间:2025-12-12 12:19:21

环球网

12月12日消息,据TechCrunch报道,在OpenAI发布GPT-5.2之后,谷歌迅速推出Gemini Deep Research深度研究智能体,同步发布全新Interactions API并首次面向开发者开放,同时开源深度搜索评估基准DeepSearchQA。此次升级标志着AI自主研究能力正式迈入工业化应用阶段,为各行业复杂研究任务提供了新的技术解决方案。


Gemini Deep Research基于Gemini 3 Pro构建,专为长周期内容收集与综合任务优化打造,其幻觉率较此前模型降低40%,是谷歌迄今“最具事实性”的智能模型。该智能体通过扩展面向搜索的多步骤强化学习,能够在复杂信息环境中以更高精度自主导航,通过反复规划研究路径——包括形成搜索查询、阅读结果、识别信息缺口并再次搜索,实现深度信息挖掘。谷歌DeepMind产品经理路卡斯·哈斯透露,该智能体已达成行业领先水平,在谷歌新基准测试中得分46.4%,在BrowseComp基准上表现与GPT-5 Pro相当,而价格仅为后者的十分之一左右。在Humanity's Last Exam(HLE人类终极考试)、DeepSearchQA及BrowseComp等多项权威评测中,该智能体均取得最新最优成绩,可在显著降低成本的同时生成高质量深入研究报告。谷歌表示,这项能力未来将逐步应用于Google Search、NotebookLM、Google Finance及Gemini App等核心产品。

为解决现有评测难以体现真实世界多步骤研究复杂性的问题,谷歌同步开放DeepSearchQA数据集与工具。该基准涵盖17个领域、900个“因果链”任务,每个任务的每一步均依赖前序分析,要求智能体生成详尽答案集,以此精准衡量其研究精度与检索全面性。此外,DeepSearchQA还可作为“思考时间”效益的诊断工具,谷歌内部测试显示,增加智能体的搜索与推理步骤可显著提升其任务表现,这一方向将在未来版本中持续探索。目前,开发者可访问该数据集、排行榜与Colab示例,并查阅相关技术报告。

在实际应用场景中,Gemini Deep Research已在多个对精度和上下文理解要求较高的行业展现出显著价值。在金融服务领域,企业借助该智能体自动化完成尽职调查中的早期信息收集工作,整合市场信号、竞争格局与合规风险等关键信息,大幅提升研究效率;在生物技术领域,Axiom Bio利用其处理药物毒性预测相关的文献分析,获得了更高的研究深度与颗粒度,有效加速了药物开发流程;在市场研究等领域,该智能体也凭借其强大的信息整合能力助力企业提升决策科学性。

通过此次推出的Interactions API,开发者可调用Gemini Deep Research构建下一代自动化研究工具,该API具备多项核心特性:统一信息综合功能可整合上传文件(PDF、CSV等格式)与公共网页数据,且能处理大上下文量信息;支持通过提示词定义输出结构、标题、表格格式等,实现可控的报告生成;可为报告中各项事实提供细粒度来源引用,保障信息可信度;支持JSON schema结构化输出,方便下游环节处理。开发者可通过Google AI Studio的Gemini API Key使用该API构建应用。

谷歌方面表示,未来将持续升级相关功能,计划加入原生图表输出能力,扩展Model Context Protocol(MCP)支持以接入更多自定义数据源,并将在企业服务平台Vertex AI上推出Deep Research服务,为企业用户提供更全面的技术支持,推动AI深度研究能力在更多行业场景的落地应用。(纯钧)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。