当前位置: 首页 » 资讯 » 新科技 » 正文

破解生命密码的AI,终于开源了

IP属地 中国·北京 钛媒体APP 时间:2025-12-24 18:15:17


中国工程院院士、之江实验室主任王坚

AI for Science(AI4S)再次迎来新突破。

最近,在杭州举办的021科学基础模型创新合作大会上,浙江之江实验室首次全面展示021科学基础模型及系列领域科学模型研发的进展,包括全球首个百亿级人类基因组基础模型Genos

021模型构筑形成跨学科知识、跨领域推理、跨语言理解(覆盖204种语言)三大基石,具备出色的科学推理能力,能够深入分析、推导、验证多类科学问题。

“021”就是“从0到1”,其中包含着之江实验室对科学基础模型的理解和发展规划。

在中国工程院院士、之江实验室主任王坚看来,“如果基础模型是人工智能的皇冠,那么科学基础模型就是人工智能皇冠上的明珠。”

之江实验室科学模型总体部技术总师薛贵荣认为,科学数据涵盖时间、空间、能量等多个维度,是对复杂物理系统演变规律的高维表征。为解决科学问题,科学界需要突破语言空间的局限,研发科学基础模型,构建“科学空间+语言空间”于一体的更高维空间,建立跨学科数据之间的深层连接,变革科学研究范式。

为此,之江实验室研发团队探索将科学数据和文本语料编码到统一的高维空间,让模型能够识别、处理科学数据,认识并解决复杂科学问题。经过近万次实验,团队形成了模型训练框架,包括预训练、后训练、强化学习等,并完成了2360亿参数规模的021科学基础模型训练。

021,不仅是“zero to one”的简写,也是AI正在从辅助科研转向重构科研的符号。

在AI4S的道路上,之江实验室通过与科学合作伙伴共同举办“种子班”来培养团队,让不同学科背景的人才聚集在一起,由专家级班主任带领,共同碰撞创新,在实战中完善、升级。截至目前,之江实验室已累计举办22期种子班,培育了900余名紧缺型AI人才。


之江实验室

这并不是021模型第一次落地,在本月正式发布前,其在诸多科学领域已有成果展示。

其中引人关注的,是生命科学领域的全球首个百亿级人类基因组基础模型Genos

10月23日,之江实验室与华大生命科学研究院在第二十届国际基因组学大会上联合发布并开源了这款大模型。该模型支持多达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。

Genos整合了人类泛基因组参考联盟(HPRC)和人类基因组结构变异图谱计划(HGSVC)等资源,基于636个“端粒到端粒”级别高质量人类基因组数据进行训练,覆盖全球不同人群。

Genos模型采用混合专家(MoE)架构,通过“按需激活”机制降低推理成本,在致病性突变解读任务中准确率达92%,结合科学基础模型后提升至98.3%。它提供12亿和100亿参数两个版本,已在GitHub、Hugging Face及魔搭等平台开源,并集成至DCS Cloud云平台提供免费推理服务。

在地学领域,之江实验室向全球开源了地球科学大模型GeoGPT。

该模型基于021科学基础模型研发,目前已进行了数次迭代,支持图像描述总结、图像信息提取、地理空间推理、地学分析推理等典型任务,通过融合深时地球数据与智能算法,提升地学研究效率。

同时受到瞩目的,还有之江实验室联合中国科学院国家天文台研发的天文领域科学大模型OneAstronomy

该模型同样基于021基础模型打造,能够实现跨模态融合推理,重构数据处理范式,释放望远镜自主观测潜力,推动实现“观测即发现”,今年9月被列为全球科技公共产品,服务于开放科学行动。

此外,在材料学领域,021打造出了多孔合金材料模型OnePorous,可根据材料性能需求,逆向生成新型多孔结构,目前已应用于3D打印卫星主体结构制造。

事实上,自去年诺贝尔化学奖和物理学奖,均授予了与AI密切相关的研究者后,AI4S就已被普遍认为是AI大模型的又一进阶之路。

各大高校和科研院所对AI4S探索步伐加速的同时,政策也在持续加码。其中引人关注的是,今年11月,美国总统特朗普还曾签署行政令启动AI“创世纪计划”。该计划试图利用人工智能变革科学研究方式、加速科学发现,生物技术、关键材料、先进制造业等均是重点领域。

不止于学术界,包括谷歌、微软、meta等全球科技巨头,也在这一领域进行了重点布局。其中,谷歌DeepMind的Alpha系列大模型一直被视为领军者,该模型近年来在蛋白质结构预测方面的突出表现,已成为了AI4S的典型案例。

不过,目前大模型对科研领域的助力,覆盖范围还有所局限。在这一方向上,人才、科学数据的搜集整合、不同前沿学科的交融等问题亟待解决,并且极度缺少既往成功经验和案例可参考。某种程度上,这更凸显了打造新的基础科学大模型的重要性,这也正是021科学基础模型被开发及面世的意义。(作者|胡珈萌,编辑|李程程)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。