当前位置：首页 » 资讯 » 新科技 » 正文

人大、清华DeepAnalyze，让LLM化身数据科学家

IP属地中国·北京 机器之心Pro 时间：2025-10-30 20:12:15

来自人大和清华的研究团队发布了DeepAnalyze，首个面向自主数据科学的 agentic LLM。DeepAnalyze引起了社区内广泛讨论，一周内收获1000多个GitHub星标、20w余次社交媒体浏览量。
DeepAnalyze正在不断完善中，诚邀大家交流合作！欢迎研究者和从业者在GitHub提交pull request，成为contributor，共建DeepAnalyze！
DeepAnalyze-8B 能够模拟数据科学家的行为，在真实环境中主动编排、优化操作，最终完成复杂的数据科学任务。支持各种以数据为核心的任务：
数据任务：自动化数据准备、数据分析、数据建模、数据可视化、数据洞察、报告生成；数据研究：可在任意数量的结构化数据（数据库、CSV、Excel）、半结构化数据（JSON、XML、YAML）、非结构化数据（TXT、Markdown）中进行开放式深度研究，生成分析师级别的研究报告；

DeepAnalyze 是一个 agentic LLM，无需任何启发式 workflow，即可自主完成复杂数据科学任务
论文链接：https://arxiv.org/pdf/2510.16872代码、Demo链接：https://github.com/ruc-datalab/DeepAnalyze模型链接：https://huggingface.co/RUC-DataLab/DeepAnalyze-8B数据链接：https://huggingface.co/datasets/RUC-DataLab/DataScience-Instruct-500K
DeepAnalyze 的论文、代码、模型、数据均已开源，欢迎大家体验！
DeepAnalyze: 自主完成数据科学全流程
DeepAnalyze 可本地部署，作为您的私有数据科学助手！
DeepAnalyze 是什么？
现有将 LLMs 应用于自主数据科学的方法，可以分为两类：
领域特定的 LLM：面向数据科学的代码生成 LLM、结构化数据理解 LLM...基于 workflow 的智能体：人为设计 workflow，通过 prompt 调用闭源 LLM 完成任务
现有工作面临两方面局限性：
仅支持单点任务（例如数据分析、数据建模），无法端到端完成数据科学全流程。闭源模型未在真实环境中的数据科学任务上训练过，难以编排和优化各种复杂操作。
DeepAnalyze 希望推动基于 LLM 的数据科学系统从 workflow-based agent 范式转变到可训练的 agentic LLM 范式。
数据科学的复杂性为训练 agentic LLM 提出了新的挑战，包括：
奖励稀疏：数据科学的复杂性使得 LLMs 在训练的早期阶段基本无法成功完成任务，难以获得正向奖励信号，从而导致 agentic LLM 训练过程崩溃。路径稀缺：数据科学的解决过程通常依赖长链推理，求解轨迹的稀缺使得 LLMs 缺少足够的指导，导致其在庞大的搜索空间中进行低效且盲目的试错式探索。

针对这两个问题，DeepAnalyze 引入了：
Curriculum-based Agentic Training：在真实环境中从单一任务到符合任务渐进式训练 LLM，让大模型逐步提升能力，避免在复杂任务上奖励信号为 0 导致的强化学习失效Data-grounded Trajectory Synthesis：自动化合成 500K 数据科学的推理、环境交互数据，在庞大的搜索空间中提供正确路径的指导
通过在真实环境中的 agentic 训练，DeepAnalyze 具备了自动编排和自适应优化操作的能力，能端到端地完成数据科学全流程，包括具体的数据任务和开放式的数据研究。
DeepAnalyze 在数据科学 Benchmarks 上表现优异
1. DeepAnalyze-8B 在 DataSciBench（端到端数据科学 Benchmark）优于所有开源模型，和 GPT-4o 相媲美

2. DeepAnalyze 在 DSBench 数据分析和数据建模任务上由于基于 workflow 的智能体

3. DeepAnalyze 在面向数据的深度研究中取得最佳表现，能生成分析师级别的分析报告

例如：

更多实验结果请参见 DeepAnalyze 论文。
总结
DeepAnalyze 是首个面向自主数据科学的 agentic LLM，具备两项关键能力：自主编排（autonomous orchestration）和自适应优化（adaptive optimization）。DeepAnalyze 作为一个基础模型，可以直接应用，或通过提示（prompting）或监督微调（supervised fine-tuning）进一步定制以适应特定场景。提出的Curriculum-based Agentic Training 训练范式和 data-grounded trajectory synthesis 数据合成方法，解决了复杂场景下的奖励稀疏（reward sparsity）和轨迹稀缺（trajectory scarcity）问题，实现对需要多种能力的高复杂度任务的有效学习。
附 DeepAnalyze 交流讨论群：https://mmbiz.qpic.cn/sz_mmbiz_jpg/KmXPKA19gWic6zf3dIibVR9xawZv04VjicAI9yx40Al0AcA4sv5MDErrLrloTbEKUDiah5vc0K5jpgKibrfJwrXT6hg/640?wx_fmt=jpeg&from=appmsg&tp=wxpic&wxfrom=5&wx_lazy=1#imgIndex=7
作者介绍：

张绍磊，中国人民大学信息学院助理教授，位于中国人民大学讲席教授范举教授团队。他博士毕业于中国科学院计算技术研究所，导师为冯洋研究员。他的研究方向涵盖大语言模型、多模态大模型、AI for Data Science。相关研究成果在 NeurIPS、ACL、ICLR 等国际人工智能与自然语言处理会议发表论文 30 余篇，开源的多语言大模型、多模态大模型、数据科学大模型在 GitHub 社区累计获得 5000 + 星标。他长期担任 CCF-A 类国际会议 ACL ARR 的领域主席和责任编辑。个人主页：zhangshaolei1998@github.io。

范举，中国人民大学教授、博士生导师，国家级青年人才，中国计算机学会数据库专委会、大数据专委会执行委员。研究方向包括：数据治理技术与系统、智能数据库系统等。相关研究成果在计算机领域国际顶级期刊 / 会议发表论文 60 余篇。作为负责人先后主持国家自然科学基金优秀青年基金项目、重点项目、面上项目，以及多项产学研合作项目。先后获得 ICDE 2025 Best Paper Runner-Up、ACM SIGMOD Research Highlight Award、ACM China Rising Award、宝钢优秀教师等奖励。
RUC-DataLab是中国人民大学信息学院、数据工程与知识工程教育部重点实验室设立的科研团队，负责人是范举教授，团队专注于数据系统+人工智能（Data+AI）交叉领域，致力于将数据技术与人工智能技术深度融合，从而打造更加智能、高效的新型数据系统。主要研究方向包括：（1）数据库系统智能化（AI4DB）：利用人工智能技术提升数据库系统的查询性能、自治能力等；（2）数据库技术赋能AI系统（DB4AI）：利用数据管理技术支撑大模型训练的数据准备、大模型推理的低延迟、高吞吐优化；（3）数智融合的新型数据科学系统（AI4DS）：利用推理大模型、多模态语义理解与智能体等技术，提升数据科学系统的智能化水平与执行性能，有效释放数据价值。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

AI渗透率超50%，我国家电企业加速布局未来产业

龙虾风暴下的国产大模型厂商：搭上火箭的Kimi与港股双雄的盛宴

“上架新链接，下架旧链接”，部分电商平台竟这样规避“价保”义务

网贷马甲乱象③｜起底“租机贷”灰色产业链：至少九成客户奔着变现来的︱315守护消费

从“一场秀”到“一条链”，票根经济带动“为兴趣买单、为认同付费”

澎湃回声｜γ-氨基丁酸“助高”营销乱象续：淘宝开展自查工作，下架相关产品

全站最新

AI渗透率超50%，我国家电企业加速布局未来产业

龙虾风暴下的国产大模型厂商：搭上火箭的Kimi与港股双雄的盛宴

“上架新链接，下架旧链接”，部分电商平台竟这样规避“价保”义务

网贷马甲乱象③｜起底“租机贷”灰色产业链：至少九成客户奔着变现来的︱315守护消费

热门推荐

理想汽车汤靖：MEGA电池召回完成率已超过97.5%

全新比亚迪元PLUS申报信息曝光：车长突破4.6米

周鸿祎首度解释：360龙虾为何姗姗来迟？

苹果重大调整！中国内地苹果税今起下调 iPhone用户有望更省钱

3月23日开售华为畅享 90 Pro Max上架预约

AI渗透率超50%，我国家电企业加速布局未来产业

龙虾风暴下的国产大模型厂商：搭上火箭的Kimi与港股双雄的盛宴

“上架新链接，下架旧链接”，部分电商平台竟这样规避“价保”义务

网贷马甲乱象③｜起底“租机贷”灰色产业链：至少九成客户奔着变现来的︱315守护消费

从“一场秀”到“一条链”，票根经济带动“为兴趣买单、为认同付费”

澎湃回声｜γ-氨基丁酸“助高”营销乱象续：淘宝开展自查工作，下架相关产品

99元电竞鼠标，60g轻量化能有多爽？

上观315·它答非所问，我气到抓狂！消费者不解：AI客服怎成了沟通屏障？

扬州消费者保护“AI助手”上线

从“一场秀”到“一条链”，票根经济带动“为兴趣买单、为认同付费”