当前位置：首页 » 资讯 » 智能车 » 正文

表格增强生成TAG登场：解锁AI自然语言与数据库的完美结合

IP属地中国·北京 编辑：赵静机器之心Pro 时间：2024-09-25 19:48:55

机器之心报道
编辑：陈陈
与 Text2SQL 或 RAG 不同，TAG 充分利用了数据库系统和 LLM 的功能。
人工智能已经改变了人们的工作方式和与数据交互的方式。回想几年前，研究人员必须编写 SQL 查询和代码才能从大量数据中提取有用信息。如今，他们只需输入问题，由语言模型驱动的底层系统会完成其余工作，让用户只需与数据对话即可立即获得答案。
这些新系统向数据库提供自然语言交互，这种转变取得了丰硕成果，但仍存在一些问题。从本质上讲，这些系统仍然无法处理各种查询。
本文，来自 UC 伯克利和斯坦福大学的研究人员现在正努力用一种名为表格增强生成 (TAG，Table-Augmented Generation) 的新方法来解决这一问题。
论文地址：https://arxiv.org/pdf/2408.14717项目地址：https://github.com/TAG-Research/TAG-Bench论文标题：Text2SQL is Not Enough: Unifying AI and Databases with TAG
TAG 是一种统一且通用的范式，用于回答数据库中的自然语言问题。TAG 模型代表了 LM 和数据库之间未曾探索过的广泛交互。
TAG 是如何工作的
目前，当用户对自定义数据源提出自然语言问题时，主要采用两种方法：文本到 SQL 或检索增强生成 (RAG)。
虽然这两种方法都能很好地完成工作，但当问题变得复杂并超出系统能力时，用户就会遇到问题。
举例来说，文本到 SQL 的方法（这是一种将文本提示转换为数据库可以执行的 SQL 查询）仅关注可以用关系代数表达的自然语言问题，但只能查询用户可能想要询问的一小部分问题。
相似的，RAG 只能通过对数据库中的一个或几个数据记录的点查找来回答相关的查询。这种方法专注于直接从数据库中检索特定信息点，而不涉及更复杂的数据处理或分析。
然而，对于商业用户来说，他们的问题通常需要复杂的领域知识、世界知识、精确计算和语义推理的组合。
为了解决这一问题，该研究提出了 TAG 系统，其实现主要包含三个步骤：查询合成、查询执行和答案生成。
TAG 模型很简单，但功能强大，由以下三个方程定义：
值得注意的是，TAG 模型统一了之前的方法，包括 Text2SQL 和 RAG，它们仅代表了 TAG 的特殊情况并且仅能解决有限的用户问题子集。
查询合成
首先，LM 推断哪些数据与回答问题相关，并将输入转换为该数据库的可执行查询（不仅仅是 SQL）。
其中，syn 函数接受自然语言请求

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

法拉利296 Speciale实车国内亮相 0-100km/h加速成绩2.8秒

2026款启辰大V：好省好开又好看，6万级SUV诚意之选

1500km续航+大六座，银河M9真卖20万，理想怎么办

蔚来的“长期主义”，已经亏了上千亿

奇瑞风云A9L即将上市，混动旗舰能突围吗？

北京现代新车型ELEXIO内饰设计揭晓，预计第三季度上市

全站最新

嫦娥五号月背采样：解锁月球背面科研新篇章，探索宇宙奥秘

中国高校天文团队开启流浪行星探测计划

最惨宇航员：刚升太空国家没了，滞留空间站311天，创下三个记录

2026中国生活机器人展｜服务机器人展

热门推荐

法拉利296 Speciale实车国内亮相 0-100km/h加速成绩2.8秒

2026款启辰大V：好省好开又好看，6万级SUV诚意之选

1500km续航+大六座，银河M9真卖20万，理想怎么办

蔚来的“长期主义”，已经亏了上千亿

奇瑞风云A9L即将上市，混动旗舰能突围吗？

北京现代新车型ELEXIO内饰设计揭晓，预计第三季度上市

坦克300改装：硬派越野的时尚进阶故事

上汽大众大动作，下半年劲爆新车来袭

领克10 EM-P全球首秀重新定义智能电混四驱轿车新标杆

法拉利296 Speciale实车国内亮相

“电改油”也能成一门生意？价格便宜至少四分之一

【E汽车】传祺向往M8鸿蒙版将7月9日上市配鸿蒙座舱

现代全新电动SUV预告，不玩大车玩小车？

比亚迪海豹06DM-i旅行版10.98万元起

三菱全新Grandis发布，主打欧洲市场秘密王牌