![]()
这项由阿里巴巴国际数字商务团队主导的研究发表于2026年2月,论文编号为arXiv:2602.06724v1,为长期复杂信息搜索任务提供了一个全新的解决思路。该研究团队包括来自阿里巴巴国际的多位研究人员,他们提出了一个名为"Table-as-Search"(TaS)的创新框架,将原本混乱无序的信息搜索过程转变为像填写表格一样条理分明的任务。
当你需要搜索大量复杂信息时,是否经常遇到这样的困扰:搜索进行到一半就迷失了方向,忘记了之前找到了什么,还需要找什么?或者在海量搜索结果中完全迷失,无法有效整理和利用获得的信息?阿里巴巴的研究团队注意到,现有的AI信息搜索系统在处理复杂、长期的搜索任务时经常"迷路",就像一个人在大型购物中心里转来转去,最终忘记了自己要买什么。
传统的信息搜索系统采用类似"思考-行动"的方式工作,就像一个人边走边想,把所有的搜索历史和结果都记在脑子里。当搜索任务简单时,这种方式还算有效。但是当面临复杂的多步骤搜索任务时,系统就会因为信息过载而出现问题,经常出现"丢三落四"的情况,这在学术界被称为"迷失在中间"现象。
研究团队提出的TaS框架就像是给搜索过程提供了一个清晰的表格模板。每当用户提出复杂的搜索需求时,系统首先会创建一个结构化的表格,其中行代表需要找到的候选对象,列代表需要验证的条件或需要收集的信息。这样,搜索过程就变成了填写表格的过程:已经找到的信息填入相应的格子,空着的格子就代表还需要继续搜索的内容。
这种方法的巧妙之处在于它将复杂的搜索状态管理问题转化为直观的表格操作。就像你在整理购物清单时,会在买到的物品后面打勾,还没买到的保持空白。通过这种方式,系统始终清楚地知道当前的进展状况,不会因为信息过多而混乱。
TaS框架能够统一处理三种不同类型的信息搜索任务。第一种是深度搜索,就像寻找一个符合多个严格条件的特定目标,比如找到一个既在出生省份上大学,又在20岁左右为电视剧唱主题歌,还在22岁左右发行首张专辑的歌手。第二种是广度搜索,需要收集大量对象的基本信息,比如搜集2005年到2015年所有TED奖获得者的详细资料。第三种是深广结合搜索,这是最具挑战性的任务,既需要大范围寻找符合条件的目标,又需要深入挖掘每个目标的详细信息,比如找到30家在西班牙市场销售阿迪达斯运动鞋、价格有竞争力且有成熟B2C运营经验的商家,并获取他们的联系方式。
在技术实现上,TaS采用多智能体协作的方式工作。系统中有一个主要规划者负责整体协调,就像项目经理一样制定搜索策略和分配任务。还有多个执行智能体负责具体的搜索操作,就像不同的专员分别负责不同方面的信息收集。所有搜索到的信息都存储在一个外部数据库中,这样可以避免系统因为信息过多而"撑爆"。
研究团队设计了一个三阶段的工作流程。首先是表格初始化阶段,系统根据用户查询创建合适的表格结构。然后是动态协调阶段,系统会在两种模式之间切换:当需要寻找更多候选对象时,启动"行扩展"模式,派遣多个搜索智能体并行寻找新的候选者;当候选对象足够但信息不完整时,启动"单元格填充"模式,针对每个候选对象补充缺失的信息。最后是答案综合阶段,系统整理表格中的信息生成最终回答。
为了验证TaS框架的有效性,研究团队进行了大规模实验测试。他们使用了多个不同类型的测试基准,包括需要多步推理的深度搜索任务、需要大规模信息聚合的广度搜索任务,以及他们专门构建的复合型深广搜索任务。特别值得一提的是,由于目前缺乏高质量的深广结合搜索测试集,研究团队专门创建了一个包含20个复杂商务开发场景的测试基准,这些场景都来自真实的商业需求。
实验结果显示,TaS框架在各种测试中都表现出了显著的优势。在深度搜索任务中,使用成本较低的Gemini-2.5-Flash模型的TaS系统,竟然超越了使用更强大模型的传统多智能体系统,准确率从38.4%提升到52.4%。这说明问题的关键不在于模型的推理能力,而在于如何有效管理复杂的搜索状态。
在广度搜索任务中,TaS系统同样表现出色。使用Claude-Sonnet-4模型时,TaS的成功率达到3.5%,与使用更强"思考"版本模型的传统系统相当。更重要的是,TaS在提高搜索覆盖率的同时还保持了较高的精确度,打破了传统系统中精确度和覆盖率相互制约的困境。
在最具挑战性的深广结合搜索任务中,TaS系统更是展现出了决定性的优势。与商用系统Gemini DeepResearch相比,TaS在候选对象发现准确率上提升了4.7%,在信息收集精确度上提升了5.1%。这证明了结构化规划相比专有黑盒系统的明显优势。
研究团队还深入分析了TaS框架的多个优势特性。在鲁棒性方面,随着搜索任务复杂度的增加,TaS相对于传统方法的优势越来越明显。在简单任务中,TaS的优势可能只有14.3%,但在最复杂的任务中,优势可以扩大到17.9%。这说明TaS特别适合处理高复杂度的搜索任务。
在效率方面,TaS的优势并不来自于简单的增加搜索量,而是来自于更精确有效的搜索策略。实验显示,TaS系统在使用相同甚至更少搜索次数的情况下,能够获得比传统系统更好的结果。这就像一个有经验的购物者能够用更少的时间买到更多需要的东西。
TaS框架还表现出了优秀的可扩展性。研究发现,给TaS分配更多计算资源时,它能够更有效地利用这些资源获得性能提升。在测试时扩展实验中,TaS的性能提升幅度比传统方法更大。
框架的灵活性也是一个重要优势。研究团队发现,TaS的执行层(子智能体)可以很容易地被更小、更专业的模型替代,而不会损失太多性能。这意味着在实际应用中可以大大降低计算成本。同时,TaS可以无缝集成现有的专业搜索智能体,让它们发挥更大的作用。
通过具体案例分析,研究团队展示了TaS如何解决传统方法的两个主要问题。第一个是过早收敛问题,传统系统经常找到部分匹配的结果后就停止搜索,而TaS通过表格结构强制系统验证所有条件。第二个是搜索不充分问题,在需要大量信息收集的任务中,传统系统经常遗漏信息或留下空白,而TaS通过明确的表格结构确保信息收集的完整性。
研究团队也诚实地指出了TaS框架的一些局限性。首先,这个框架主要针对信息搜索任务优化,对于不需要搜索的一般性任务可能会增加不必要的复杂性。其次,TaS的性能在很大程度上依赖于主规划智能体的能力,如果规划智能体的能力不足,整个系统的性能就会受到影响。此外,目前的深广结合搜索评估还需要人工验证,这在一定程度上限制了大规模测试的可行性。
尽管存在这些限制,TaS框架仍然为复杂信息搜索任务提供了一个突破性的解决方案。它不仅解决了传统方法在处理复杂长期搜索任务时的根本性问题,还展现了在多种应用场景中的广泛潜力。对于需要进行复杂信息收集和分析的商业应用、学术研究和日常信息搜索,TaS都提供了一个更可靠、更高效的解决方案。
这项研究的意义远不止于技术创新本身。它重新定义了我们对复杂信息搜索任务的理解方式,从混乱的文本生成转向结构化的信息管理。这种思维方式的转变可能会影响未来搜索系统的设计理念,让人工智能在处理复杂任务时变得更加可靠和高效。随着信息量的爆炸式增长,像TaS这样能够有效管理复杂搜索状态的框架将变得越来越重要,为构建更智能、更实用的信息搜索系统铺平道路。
Q&A
Q1:Table-as-Search框架是什么?
A:Table-as-Search是阿里巴巴国际团队开发的信息搜索框架,它将复杂的搜索任务转化为填写表格的过程。系统创建结构化表格,行代表候选对象,列代表需要验证的条件或收集的信息,通过填写表格来管理搜索进度,避免传统方法容易迷失方向的问题。
Q2:TaS框架比传统搜索方法好在哪里?
A:TaS的主要优势在于结构化的状态管理。传统方法容易在复杂搜索中"迷路",而TaS通过表格清晰追踪搜索进度。实验显示,TaS能让成本较低的模型超越更强大的传统系统,在复杂任务中优势更加明显,同时在提高覆盖率的同时保持高精确度。
Q3:TaS框架能处理哪些类型的搜索任务?
A:TaS可以统一处理三种搜索任务:深度搜索(寻找符合多个严格条件的特定目标)、广度搜索(收集大量对象的基本信息)、深广结合搜索(既要大范围寻找又要深入收集详细信息)。特别擅长处理复杂的商务开发、学术研究等需要多步骤信息收集的场景。





京公网安备 11011402013531号