当前位置: 首页 » 资讯 » 新科技 » 正文

上海药物所突破:AI滤波器精准筛选神经系统疾病新药

IP属地 中国·北京 科技行者 时间:2026-01-28 23:42:57


这项由上海药物研究所、卡内基梅隆大学、湖南大学等多个国际知名研究机构联合完成的突破性研究,已于2026年1月发表在计算机科学领域的知名期刊arXiv上,论文编号为arXiv:2601.19149v1。这项研究开发出了一个名为"GPCR-Filter"的人工智能系统,专门用于发现能够治疗神经系统疾病的新药物。

在现代医学中,有一类被称为G蛋白偶联受体(GPCR)的特殊蛋白质,它们就像是人体细胞表面的"信号接收器",负责接收各种化学信号并传递给细胞内部,控制着我们的神经、内分泌和免疫系统的正常运转。这些受体是目前医学界最重要的药物靶点之一,全球约有36%的FDA批准药物都是通过作用于这些受体来发挥治疗效果的。然而,为这些受体找到合适的药物一直是医学界的一大难题,就像是要在茫茫人海中找到某个特定的人一样困难。

传统的药物发现过程就像是在黑暗中摸索前进。研究人员通常需要花费数年时间,通过大量昂贵的实验来筛选可能有效的化合物。更令人沮丧的是,即使某个化合物能够与目标受体结合,也不一定能够真正激活受体发挥治疗作用,这就好比找到了正确的钥匙,但钥匙却无法顺利转动开启锁芯。

为了解决这个问题,研究团队开发了GPCR-Filter这个智能"药物过滤器"。如果把药物发现比作淘金过程,那么GPCR-Filter就像是一个经验丰富的淘金专家,能够快速从大量的沙石中识别出真正有价值的金子。这个AI系统不仅能预测某个化合物是否能与特定受体结合,更重要的是,它还能判断这种结合是否能够真正激活受体,产生治疗效果。

研究团队首先构建了一个包含超过9万个经过实验验证的GPCR-药物相互作用数据的庞大数据库,这就像是为AI提供了一个详尽的"教科书"。然后,他们采用了一种巧妙的设计思路:将ESM-3这个强大的蛋白质语言模型(类似于理解蛋白质"语言"的专家)与专门处理药物分子结构的图神经网络结合起来,再通过注意力机制让这两部分能够"对话",从而理解受体和药物之间复杂的相互作用关系。

一、突破传统局限的智能药物筛选系统

GPCR-Filter的工作原理就像一位经验丰富的药剂师,能够同时"阅读"两本不同的"说明书":一本是受体蛋白质的氨基酸序列(相当于受体的基因密码),另一本是药物分子的SMILES字符串(相当于药物的化学"身份证")。这个AI系统的巧妙之处在于,它不需要知道受体蛋白质的三维结构长什么样子,仅仅通过"阅读"这些文字信息,就能判断某个药物是否能与特定受体发生有效的相互作用。

这种设计带来了巨大的优势。传统的药物发现方法高度依赖蛋白质的三维结构信息,就像修理工必须看到机器的内部构造才能知道如何修理。但是,获得高质量的蛋白质结构信息往往需要昂贵的实验设备和漫长的实验周期。GPCR-Filter则更像是一位经验丰富的老师傅,仅仅通过观察外观特征和了解基本信息,就能判断出内在的运转机制。

GPCR-Filter的"大脑"采用了类似翻译系统的架构。当它接收到一个受体序列和一个药物分子信息时,首先会将受体序列通过ESM-3模型转换成计算机能够理解的数字表示,这个过程就像是将中文翻译成英文。同时,药物分子会通过图神经网络转换成另一套数字语言。然后,系统的核心部分——注意力机制——会让这两种"语言"进行深度对话,找出它们之间可能存在的匹配关系,最终给出一个0到1之间的分数,分数越高表示这个药物越有可能对该受体产生治疗效果。

研究团队在训练这个AI系统时遇到了一个有趣的挑战:他们拥有大量已经证实有效的受体-药物配对信息,但缺少那些证实无效的配对信息。这就像是只有成功案例的教科书,却没有失败案例的警示录。为了解决这个问题,他们采用了一种巧妙的"负样本采样"策略,通过数学方法构造出合理的"无效配对"样本,让AI能够学会区分什么是有效的,什么是无效的。

二、三重考验下的卓越表现

为了验证GPCR-Filter的实际能力,研究团队设计了三种不同难度级别的测试场景,就像是为AI设置的"三关考试"。这种测试设计非常重要,因为它能够全面评估AI系统在真实应用场景中的表现。

第一关是"随机分割测试",这相当于最基础的考试。在这种测试中,所有的受体和药物数据被随机分配到训练集和测试集中,这意味着测试时AI可能会遇到训练时见过的受体或药物。这种测试主要验证AI是否真正学会了基本的模式识别能力。GPCR-Filter在这一关表现出色,达到了接近99%的准确率,远超现有的其他同类系统。

第二关是"受体内分割测试",难度明显提升。在这种测试中,对于同一个受体,AI在训练时只能看到它与某些药物的相互作用信息,而在测试时需要预测这个受体与全新药物的相互作用。这就像是让AI根据对某个人的部分了解,来预测这个人对新事物的反应。这种测试更接近实际应用场景,因为药物研发人员经常需要为已知的疾病靶点寻找新的治疗药物。GPCR-Filter在这一关的表现依然令人印象深刻,准确率保持在97%以上,而其他对比系统的表现则明显下滑。

第三关是最困难的"跨受体分割测试",这相当于AI的"终极考验"。在这种测试中,AI必须对完全陌生的受体进行药物预测,就像是让一个从未见过某种动物的人,仅凭对其他动物的了解来判断这种新动物的习性。这种测试最能体现AI系统的泛化能力和实用价值,因为在实际药物研发中,科学家经常需要为全新发现的疾病靶点寻找治疗药物。即使在这种最严格的测试条件下,GPCR-Filter仍然保持了73%的准确率,而其他系统的表现则大幅下降,有些甚至低于随机猜测的水平。

更重要的是,研究团队通过可视化分析发现,GPCR-Filter在所有三种测试中都展现出了一致性和稳定性。就像一位经验丰富的医生,无论面对什么样的病例,都能保持冷静的判断力和准确的诊断能力。这种稳定性对于实际应用来说至关重要,因为它意味着研究人员可以信任这个AI系统的判断。

三、透明化的AI决策过程

与许多"黑盒子"式的AI系统不同,GPCR-Filter具有良好的可解释性,研究人员可以理解它做出判断的依据。这就像是能够看到AI"思考过程"的透明窗口,这种透明性对于药物研发来说极其重要。

研究团队从两个角度对GPCR-Filter的决策过程进行了深入分析。首先是从整体数据层面的分析。他们发现,具有相似药物结合偏好的受体在化学空间中会自然聚集成群,形成了一种有序的组织结构。这种现象就像是性格相似的人容易成为朋友一样,化学性质相近的受体往往偏好结合结构类似的药物分子。这种内在的组织性为GPCR-Filter的跨受体预测能力提供了理论基础:当AI遇到一个新的受体时,它可以根据这个受体与已知受体的相似性来推断其药物偏好。

更令人兴奋的是,研究团队还深入分析了GPCR-Filter的注意力机制,发现这个AI系统确实学会了关注受体蛋白质上那些在药物结合中起关键作用的区域。为了验证这一点,他们选择了两个最近解析出三维结构的GPCR-药物复合体进行详细分析。

以多巴胺D2受体复合体为例,研究人员发现GPCR-Filter预测的高注意力区域与实验确定的药物结合口袋高度重合。在这个受体的结合口袋中有9个关键氨基酸残基,GPCR-Filter的注意力机制成功识别出了其中的6到8个,准确率达到70%以上。更重要的是,这种识别能力在不同的训练条件下都保持稳定,说明AI确实学到了药物-受体相互作用的本质规律,而不是简单的记忆训练数据。

另一个验证案例是嘌呤能受体复合体,GPCR-Filter同样展现出了令人信服的结果。这种一致性表明,GPCR-Filter不是通过死记硬背来工作的,而是真正理解了受体-药物相互作用的基本原理。这就像是一个学会了数学公式原理的学生,能够灵活应用到各种不同的题目中,而不是只会背诵固定答案。

四、从计算机到实验室的成功验证

理论上的成功固然重要,但真正的考验在于实际应用。研究团队决定将GPCR-Filter应用到真实的药物发现项目中,选择了5-HT1A受体作为验证目标。这个受体在神经精神疾病的治疗中具有重要意义,是抗抑郁和抗焦虑药物的重要作用靶点。

整个验证过程就像是一场精心设计的寻宝游戏。首先,研究团队使用传统的分子对接技术从ChemDiv化合物库中的164万个分子中筛选出8705个可能的候选化合物。这个过程就像是用粗网先捞出一批可能有价值的"鱼"。然后,GPCR-Filter作为"精细过滤器"登场,从这8705个候选物中筛选出97个最有希望的化合物。由于商业可获得性的限制,研究团队最终获得了52个化合物进行实验验证。

实验采用了GloSensor-cAMP检测系统,这是一种能够精确测量受体激活水平的生物传感技术。在这个实验系统中,受体激活会导致细胞内cAMP水平下降,进而使荧光信号减弱。因此,荧光信号越弱,表示受体激活越强,药物效果越好。

令人兴奋的是,在52个测试化合物中,有4个化合物(编号D24、D29、D34和D47)显示出了明显的受体激活活性。这意味着GPCR-Filter的成功率达到了约7.7%,这在药物发现领域是一个非常令人鼓舞的数字。要知道,传统的随机筛选方法的成功率通常只有千分之几,而GPCR-Filter将这个概率提高了十几倍。

更重要的是,这4个活性化合物展现出了不同的化学骨架结构,说明GPCR-Filter不是简单地找到了某一类化合物的变体,而是真正发现了多样化的药物先导化合物。在随后的剂量-效应关系实验中,所有4个化合物都显示出了典型的S型剂量-反应曲线,证实了它们确实是通过激活5-HT1A受体发挥作用的。虽然这些化合物的效力(EC50值)在微摩尔级别,相比天然配体5-羟色胺稍弱,但这恰恰为进一步的药物优化提供了良好的起点。

五、开启药物发现新纪元的技术突破

GPCR-Filter的成功不仅仅是一个新工具的诞生,更代表了药物发现范式的重要转变。传统的药物发现严重依赖于蛋白质的三维结构信息,但获得高质量的结构信息往往需要耗费大量时间和资源。GPCR-Filter证明了基于序列的方法可以达到与结构方法相媲美甚至更好的效果,这就像是证明了仅仅通过阅读建筑图纸就能准确判断建筑的稳定性,而不必实地查看每一根梁柱的具体位置。

这种方法学上的突破带来了多重优势。首先是效率的大幅提升。传统的实验筛选可能需要测试数十万个化合物才能找到一个有希望的先导化合物,而GPCR-Filter可以在几小时内完成这样的筛选工作。其次是成本的显著降低。虽然建立和训练AI模型需要初期投入,但一旦建立完成,使用成本几乎可以忽略不计。最后是适用范围的扩大。由于不依赖三维结构,GPCR-Filter可以应用于那些难以获得结构信息的受体,大大扩展了可药物化的靶点范围。

GPCR-Filter的另一个重要特点是其出色的泛化能力。在跨受体测试中展现的稳定性能表明,这个AI系统学到的不是特定受体-药物配对的记忆,而是更深层次的相互作用规律。这种泛化能力使得GPCR-Filter能够应用于药物重定位研究,即寻找已有药物的新用途,这在当前快速响应新兴疾病的需求下具有特殊意义。

研究团队还发现了一个有趣的现象:GPCR家族内部存在着复杂但有序的化学偏好网络。某些受体亚家族偏好结合特定类型的化学骨架,而这种偏好模式可以通过机器学习方法准确捕获。这一发现不仅为GPCR-Filter的成功提供了理论解释,也为未来的药物设计提供了新的思路。药物研发人员可以根据这些化学偏好模式,有针对性地设计或筛选特定类型的化合物。

从技术实现的角度来看,GPCR-Filter巧妙地结合了多种前沿技术。ESM-3蛋白质语言模型提供了对受体序列的深度理解能力,图神经网络则负责捕获药物分子的结构特征,而Transformer架构的注意力机制则实现了两者之间的有效融合。这种多模态融合的方法为处理复杂的生物医学数据提供了新的范例。

六、未来展望与潜在影响

GPCR-Filter的成功验证为药物发现领域带来了新的希望,但这只是一个开始。研究团队已经在考虑多个方向的后续改进和扩展。首先是数据质量的进一步提升。虽然当前的数据集已经包含了超过9万个验证的相互作用记录,但随着更多实验数据的积累,特别是那些阴性结果数据的补充,GPCR-Filter的准确性还有进一步提升的空间。

在方法学层面,研究团队正在探索将结构信息与序列信息相结合的混合方法。虽然GPCR-Filter已经证明了纯序列方法的有效性,但在有高质量结构信息可用的情况下,结构与序列信息的结合可能会产生协同效应,进一步提升预测精度。这就像是同时拥有地图和GPS导航,能够提供更加准确和全面的导向服务。

另一个重要的发展方向是扩展到其他蛋白质家族。GPCR虽然是重要的药物靶点家族,但并不是唯一的。离子通道、酶类、转录因子等其他类型的蛋白质同样是重要的药物作用目标。GPCR-Filter展现的成功经验为开发针对这些蛋白质家族的专门化AI工具提供了技术路线图。

从应用前景来看,GPCR-Filter有望在多个方面产生深远影响。在罕见病药物研发方面,许多罕见病的分子机制涉及GPCR功能异常,但由于患者群体较小,传统的药物开发经济效益有限。GPCR-Filter的高效率和低成本特点使得针对罕见病的药物发现变得更加可行。

在个性化医疗领域,GPCR-Filter也展现出巨大潜力。不同患者由于基因变异可能具有略有差异的受体特性,GPCR-Filter的序列依赖特性使其能够为个体化的受体变体预测最适合的药物,为精准医疗提供技术支撑。

药物重定位是另一个重要的应用方向。现有的许多药物可能具有尚未发现的新用途,GPCR-Filter可以系统性地筛选已有药物与不同受体的相互作用,发现新的治疗适应症。这种方法不仅能加速药物开发进程,还能大幅降低开发成本,因为已有药物的安全性数据已经相对完整。

当然,GPCR-Filter的发展也面临一些挑战。负样本构造仍然是一个需要持续改进的技术难点。虽然当前的负采样策略已经取得了不错的效果,但更加精确的负样本定义可能进一步提升模型性能。此外,如何有效整合不同来源、不同质量的实验数据也是一个需要解决的实际问题。

从更广阔的视角来看,GPCR-Filter代表了人工智能在生物医学领域应用的一个重要里程碑。它展示了当高质量的生物学数据与先进的机器学习技术相结合时,可以产生具有实际应用价值的创新工具。这种成功经验为AI在其他生物医学问题中的应用提供了信心和方向。

说到底,GPCR-Filter的成功最重要的意义在于它为药物发现这一关系人类健康福祉的重要领域提供了新的可能性。通过将传统需要数年时间的筛选过程压缩到几小时,将成本高昂的实验筛选转变为经济高效的计算预测,GPCR-Filter有望加速新药开发进程,让更多患者更快地获得有效治疗。虽然从AI预测到最终的临床药物还有很长的路要走,但GPCR-Filter已经为这条道路点亮了一盏明灯。对于那些正在与疾病抗争的患者和他们的家庭来说,这种技术进步代表的不仅仅是科学的胜利,更是希望的曙光。

有兴趣深入了解技术细节的读者,可以通过arXiv:2601.19149v1这个论文编号查询完整的研究报告,其中包含了详细的方法学描述、完整的实验数据和深入的技术分析。

Q&A

Q1:GPCR-Filter是什么,它是如何工作的?

A:GPCR-Filter是由上海药物研究所等机构开发的AI药物发现系统,专门用于寻找能与G蛋白偶联受体相互作用的药物。它的工作原理就像一位经验丰富的药剂师,能够同时"阅读"受体蛋白质的氨基酸序列和药物分子的化学结构信息,然后通过AI算法判断两者是否能产生有效的治疗性相互作用,给出0到1之间的匹配分数。

Q2:GPCR-Filter相比传统药物筛选方法有什么优势?

A:GPCR-Filter的最大优势是效率和成本。传统方法可能需要数年时间和大量资源来筛选数十万个化合物,成功率只有千分之几。而GPCR-Filter可以在几小时内完成筛选,将成功率提高到约7.7%,提升了十几倍。更重要的是,它不需要昂贵的蛋白质三维结构信息,仅凭序列就能准确预测,大大降低了药物发现的门槛和成本。

Q3:GPCR-Filter发现的新药物安全性如何保证?

A:GPCR-Filter目前主要负责发现有潜力的药物候选化合物,这只是药物开发的第一步。研究团队在5-HT1A受体验证实验中发现的4个活性化合物还需要经过完整的药物开发流程,包括毒性测试、动物实验、临床试验等多个阶段来确保安全性和有效性。不过,GPCR-Filter的高准确率意味着后续开发成功的概率更高,能够减少不必要的安全风险。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新