“跨学科 AI 是学术界一个非常令人兴奋的领域,尤其是在科学发现方面。”
在 AI 教母、斯坦福大学教授李飞飞看来,由大语言模型(LLM)等主导的 AI 范式能够与众多学科交叉,帮助人类发现、解决一些真正根本性的问题。
那么,AI 在科学研究中的潜力究竟如何?特别是在推动跨学科科学研究方面,其衍生出的 AI4Research 领域的进展又如何?
哈尔滨工业大学计算学部长聘教授、博士生导师车万翔团队及其合作者针对 AI4Research 展开的一项系统性调查,为我们提供了一个统一的视角,帮助我们更好地理解 AI 在科研中的应用与未来发展。
论文链接:https://arxiv.org/abs/2507.01903
主要贡献如下:
系统性分类:提出了一种系统性分类方法,用于划分 AI4Research 中的五大主流任务;
新兴领域:识别关键研究空白并强调未来发展方向,重点关注自动化实验的严谨性和可扩展性,以及社会影响;
丰富应用与资源:整理了大量资源,包括跨学科应用案例、数据集和工具。
研究团队希望,这一综述能够为科研社区提供快速获取这些资源的途径,并激发 AI4Research 领域的创新。
AI4Research是什么?
AI4Research 指的是将人工智能方法应用于跨学科研究,旨在改进、加速并部分自动化研究过程。
AI4Research 与 AI4Science 有着本质上的区别。
具体而言,AI4Science 主要聚焦于科学发现和数据分析,它旨在利用 AI 技术加速具体科学领域的发现过程,如材料发现、药物设计、基因组分析等,其主要目标是将 AI 嵌入研究工作流程中,帮助专家实现重大的科学突破。
相比之下,AI4Research 采用更广泛的视角,涵盖了学术研究的整体流程和基础设施。它关注学术论文、研究方法和科研生产力等更宽泛的问题,强调 AI 在提升研究方法及支持学术环境方面的作用,适用于资深研究人员与新兴科学家。
这两个框架的核心区别在于其关注重点不同:AI4Science 针对特定科学问题和实验协议,而 AI4Research 则关注更广泛的研究方法和学术基础设施。
随着 LLM 具备更强的推理和生成能力,一种统一的科研 AI 工作流正在出现,可以同时解决专门的科学挑战和一般的学术流程。AI4Science 的工具常被集成到 AI4Research 系统中,作为 LLM 科学探索的可调用组件。
AI4Research5个阶段
研究团队提出了一个涵盖科学理解、学术调研、科学发现、学术写作和学术评审五个领域的全面分类法,对应科研过程的不同阶段。
AI 用于科学理解(AI4SC):指利用 AI 提取、解释和综合单篇科学文献信息的能力。旨在帮助人类和自动系统更高效地理解科研论文,加速知识获取。
AI 用于学术调研(AI4AS):旨在让 AI 整合并结构化多个现有文献,提供某研究领域的全面综述。有助于识别科学领域中的趋势、空白及关键贡献。
AI 用于科学发现 (AI4SD):侧重于借助 AI 生成并验证新的科学假设或创意,以及执行相关实验或模拟。该模块提高了探索未知领域和加速创新的能力。
AI 用于学术写作(AI4AW):协助研究人员生成、修改和格式化科学论文。其通过提升学术写作的质量和效率,确保论文结构清晰且符合出版标准。
AI 用于学术评审(AI4PR):利用 AI 自动化和加强学术论文的同行评审过程。该模块旨在生成结构化、客观且有建设性的审稿意见,以提高评审质量和效率。
1.AI 用于科学理解
AI 用于科学理解是推动 AI4Research 的关键环节,它涉及从科学文献中提取、理解并综合信息的能力。这一能力可以加速人类对科学知识的掌握,提高自动分析的效率,从而让后续科研流程更有效。AI 辅助的科学理解划分为两大类别,即对论文文本内容的理解和表格与图表型科学理解。
文本科学理解指 AI 理解、解释并批判性评价科学文本(如学术论文)的能力。其涉及识别论文中的关键概念、掌握复杂术语、综合信息形成对科学原理和发现的整体认识。现有技术有半自动科学理解和全自动科学理解,半自动科学理解需要人工提供起始问题或交互,由 AI 生成针对该问题的论文理解结果,属于人机协同方式。全自动科学理解中 AI 可自主阅读大量文献并生成理解结果,无需人工提问或干预,属于完全自动方式。
表格理解指让 LLM 具备从科研论文的表格中提取、解释和推理数据的能力。目前思路有数据增强、推理范式增强。图表理解则指 AI 能够直接处理和解释科研论文中的图像化图表(如折线图、柱状图、示意图等),并据此回答问题或生成摘要。
2.AI 用于学术调研
学术调研指对特定研究领域文献的综述和调研,在科研工作中具有重要地位。AI 在学术调查中的应用旨在帮助研究者高效检索相关文献并自动生成综述报告,从而减轻工作量、提高综述的全面性和客观性。
相关工作检索需要人工智能主动识别与其不断发展的科学目标相一致的基础性和新颖的研究论文。现有研究将 AI 用于文献检索的方法大致分为三个范式;语义引导的检索、基于图的检索和 LLM 增强的检索。
在检索到相关文献后,下一步是自动生成结构化、连贯的综述报告。利用 AI,我们可以首先完成研究路线图映射,然后生成章节级相关工作,最后生成完整的文档级调查。
3.AI 用于科学发现
AI 用于科学发现指利用 AI 基于现有知识生成新的假设,理论或想法。旨在利用人工智能来辅助甚至自动完成这一过程的各个阶段,包括创意生成、假设评估、理论分析和实验执行等,从而加速突破性发现的产生。这种方法不仅可以指导新的研究方向还可以解决复杂的科学挑战。
科学发现模块包含五个主要类别:创意挖掘、新颖性与重要性评估、理论分析、
实验执行和全自动发现。这五个环节几乎覆盖了一个完整科学研究项目的生命周期:从产生假设想法、评估想法的价值、分析理论基础、设计并实施实验,到最终将整个过程整合为自动化系统。
4.AI 用于学术写作
AI 用于学术写作涉及使用 AI 技术来帮助研究人员或从头开始起草,编辑和格式化科学手稿。AI 正逐步成为科研写作的有力助手。
半自动学术写作指人机协同完成论文写作,AI 提供辅助而人类研究者掌控内容。具体而言,在撰写准备阶段,AI 可以提供诸多便利。而全自动学术写作指 AI 几乎不需人工参与,即可自动生成完整的学术论文草稿。这通常建立在科研流程前面环节已由AI完成的基础上——例如经过 AI 实验系统产出了结果数据和图表,然后由写作模型来撰写论文各个部分。从引言、方法到结果与讨论,AI 模型根据既有资料填充内容并形成连贯的论文文本。在实验性的演示中,研究者让 AI 读取实验记录、分析数据图表,并自动生成相应的结果描述和讨论,从而自动撰写技术报告。
5.AI用于学术评审
同行评审在提高学术论文质量方面十分重要。但它经常受到延迟,时间要求和不断增长的学术工作量的阻碍。为了应对这些挑战并提高论文质量,研究人员正在探索将 AI 融入评审过程。
在正式同行评议开始前,期刊和会议经常要对稿件进行初步筛选并选择合适的评审人。AI 已经在这一阶段得到应用。一方面,随着学术期刊投稿量的增加,编辑部在案头审查阶段面临着更繁重的工作量。为了解决这个问题,主要出版商引入了人工智能驱动的工具,例如自动关键字提取,主题匹配和初步评分,以提高效率,缩短周转时间,并减少人工筛选。另一方面,评审人匹配是确保评审质量的另一重要环节 AI 系统可以通过机器学习模型在海量专家数据库中匹配合适的候选人。
审稿中阶段,涉及通过自动化或人工评审协助生成或支持评审报告。评审员必须分配一个数字评分并提供书面评估。评审过程通常包括两个主要阶段:同行评审和元评审。
论文通过同行评审并发表后,还有一些评审后的 AI 应用来评估论文影响、扩大论文传播。旨在评估其未来学术影响并扩大其传播范围。它包括影响力分析(通过论文内容预测引用轨迹和研究意义)和推广增强(自动生成海报、通俗摘要、视频和其他宣传材料以扩大论文影响力)。
AI4Research有什么用?
在自然科学领域,AI 的应用已成为推动科学发现和开发新研究方法的重要工具。
例如,在物理学研究中,AI 如今在开发新研究方法和驱动科学发现上不可或缺。它的应用范围从自动规律发现到物理世界模拟和神经操作符学习,旨在提高模拟精度,加速计算,并从有限的数据中揭示隐藏的模式。生命科学和医学研究中的 AI 使用算法和计算模型来分析和预测跨尺度,从分子结构到临床诊断,加速药物发现,优化实验工作流程,提高诊断准确性,推进精准医疗。在化学和材料科学中, AI 驱动的化学和材料自动化将机器学习,机器人和仪器集成到一个闭环系统中,用于设计,合成和表征,加速决策和实验。
在应用科学与工程领域,AI 的应用也取得了显著进展。机器人控制领域的 AI 在机器人和控制领域应用广泛,包括深度学习、强化学习、大模型用于感知、决策和控制,以提高机器人在新环境下的适应性、鲁棒性和自主性。在软件工程,应用 AI 技术自动化软件开发任务,可以提高代码质量和开发人员的生产力。包括代码生成错误检测,代码审查和软件测试。
在社会科学领域,如社会学、心理学,AI 也被用于自动化社会科学实验的设计、执行和分析,涵盖从假设生成到数据采集等任务,尽量减少人为干预。心理学研究的 AI 研究方法侧重于心理学实验的设计,实施和验证,来确保有效性和可重复性。
未来又如何?
随着AI在科研中的广泛应用,未来的研究方向集中于多个关键领域,以推动人工智能在科研中的进一步发展。
跨学科 AI 模型成为未来研究的重点,特别是基础模型(Foundation Models)和图模型(Graph Models)两大方向。这些模型能够整合来自不同学科的数据,实现跨学科知识流动,推动科学研究的进一步发展。然而,异构数据的融合和知识整合仍面临巨大挑战。策略转移、领域对抗训练和语义对齐等技术可缩小部分差距,但高度异构环境下负面转移现象仍难以消除。
与此同时,随着 AI 在科研中的应用日益增多,伦理、安全、公平性和偏见问题已经浮现。目前提出了三大缓解策略:公平感知训练、无训练去偏和建立伦理框架。这些策略旨在消除 AI 应用中的偏见和不公平性,但仍面临性能与公平之间的权衡以及 AI 剽窃的问题,尤其是大规模文本生成可能导致的“智能剽窃”现象。
跨学科合作的增加,团队成员的背景差异也可能导致信息流不畅和决策协调困难。AI 可以帮助自动提取跨文档和跨领域的信息,从而缩小协作者之间的信息差距。同时,实时协作平台中的人工智能驱动仲裁器可根据项目进展和成员专长动态调整任务分配,从而提升效率并提高创新成果的质量。主要研究方向可大致分为两类:协同智能体与合作智能系统,以及联邦学习和分布式建模。这些技术可以提高跨机构协作效率,但也面临交互复杂性和数据隐私问题的挑战。
确保AI系统的透明性和可解释性至关重要。未来的研究需要加强模型的可解释性,使研究者能够追溯 AI 得出结论的过程,尤其是在高风险科学应用中。当前的挑战包括缺乏统一的可解释性框架以及在高性能黑盒模型和透明性之间的权衡。
此外,实时AI 系统能自动调整实验协议以应对不可预见的变量或变化条件,同时进行即时数据分析,从而大幅提升研究效率和创新潜力。智能体实时 AI 和自主实验室协同控制的研究旨在通过自动化实验过程来加速科学发现。异构设备和 AI 系统的集成以及低延迟决策的需求仍然是当前面临的很大挑战。
在多模态集成方面,有效多模态整合已成为人工智能驱动发现的关键。早期研究表明,同时嵌入文本和图表可显著提升深度分析和基于文献的发现能力,但这种方法在将高度专业化的图表与文本描述对齐时常会遇到困难。多模态融合面临的数据稀缺和标注瓶颈,以及跨模态不确定性量化的问题。
随着全球科研日益国际化,多语言集成的重要性也不断上升。若人工智能工具仅偏好英语或其他高资源语言,研究共享将受阻,加剧“信息孤岛”和“知识鸿沟”。目前有科学术语对齐、平衡多语言性两种策略,挑战包括如何在多语言模型中平衡性能和容量,以及如何在跨语言学术中保持一致。
整理:小羊
如需转载或投稿,请直接在公众号内留言