当前位置: 首页 » 资讯 » 新科技 » 正文

对话上智院程远:构建智能体网络,区块链很重要

IP属地 中国·北京 编辑:顾雨柔 中国企业家杂志 时间:2025-07-09 18:23:28



模型不是价值,模型一定要变成一个产品。

文|《中国企业家》记者 闫俊文

编辑|张晓迪

头图摄影|邓攀

AI技术正在催生越来越多的“爱因斯坦”式大脑,它们在科研、制药、生物等领域不断施展魔法。

2024年,诺贝尔化学奖授予了三个人,一半授予华盛顿大学教授戴维·贝克;另一半授予谷歌旗下DeepMind公司的联合创始人兼CEO杰米斯·哈萨比斯和高级科学家约翰·江珀。

2018年,DeepMind推出了AlphaFold,它可以用来预测蛋白质结构。比AlphaFold更为知名的是它的“孪生兄弟”AlphaGo,它在2016年击败了围棋世界冠军李世石,成为第一个击败人类职业围棋冠军的人工智能机器人。

作为两家通过深度学习进化AI技术的头部公司,DeepMind的技术路径是让AI依靠学习知识、规则来进化,它适用于非结构数据领域,比如生物、化学等科学领域;而OpenAI则是靠参数量极大的预训练提升模型能力,主要落地在生成内容领域,比如ChatGPT等对话类产品。

当前,OpenAI备受资本市场关注,今年3月,它宣布筹集400亿美元的新融资,软银提供75%的资金,其余资金来自微软 、Coatue Management等机构,最新估值达到3000亿美元。

科学家和学者则更重视DeepMind,AI forScience(科学智能)正成为驱动新知识发现与科研范式升级的重要抓手。

今年3月,DeepMind的分拆公司Isomorphic Labs宣布完成6亿美元融资,他们还拿下了礼来(Eli Lilly)和诺华(Novartis)两家制药巨头将近30亿美元的合作订单。

上海科学智能研究院副院长程远告诉《中国企业家》:文科的世界模型很像通用语言模型、通用多模态模型;但AI for Science的世界模型,应该扩展到人类感觉之外,理解真正的、完整的世界。

程远曾于2013~2022年期间,在蚂蚁集团人工智能部工作,曾任视觉认知团队负责人,2023年他加入上海科学智能研究院(以下简称上智院)。

今年6月中旬,程远接受了《中国企业家》的专访。

以下是内容要点:

1.做科学世界模型,首先要“测一切之可测”,才能建模这个世界。

2.AI有可能发现一个新的分子结构,但发现只是提出一个新的假设,大量的验证工作、药物研发的工作都在后面。

3.将区块链的技术用在科研领域。Agent之间可能互相都不认识,区块链能记住谁用了我的Agent,我用了谁的工具去完成科学任务,它能厘清生产关系。

4.模型不是价值,模型一定要变成一个产品,结合业务应用场景,解决需求问题。

5.Agent之间数据开放,一定要有法可依,有器可用,有迹可循。

6.多智能体系统,要做真实场景的强化学习,在分布式场景里,支撑场景,这可能是人工智能发展的下一幕。

以下是访谈的内容详情(有删减):

测一切之可测,才能建模世界

《中国企业家》:上智院的定位很明确,选择做气象大模型和生命大模型——“伏羲”“女娲”,包括后来做医疗大模型。

程远:最早我们就选三个方向,它们覆盖了AI for Science的大多数场景,第一,生命科学,第二,地球科学,第三,物质科学,比如材料、化学、制药等领域。

《中国企业家》:语言通用大模型可以解决文科的问题,但解决不了像医疗这样垂直场景的问题。

程远:文科的世界模型很像通用语言模型、通用多模态模型的世界模型。文科是人类理解和写出来的东西,它一定是基于人类的感知,能听的、能看的、能说得出来的文字或者其他内容。

AI for Science的世界模型可能涵盖更多,人类感知不了世界上发生的一切,比如我们肉眼看不到蛋白质结构,需要用冷冻电镜来看;分子结构也需要通过特殊手段去观察,甚至一个人的血糖、血压,都需要特殊仪器来测量。

所以,AI for Science的世界模型,应该扩展到人类感觉之外,多模态模型要超过通用的大语言模型,它要从不同的尺度、不同的观测手段感知世界,理解真正的、完整的世界。

《中国企业家》:世界是可以被理解的吗?

程远:感知才能理解,感知之后成了数据,有了数据,做大模型才能理解它,数据从哪里来?从感知里来,感知是什么?比如冷冻电镜、质谱仪、显微镜、CT仪,这些都是感知的技术,它可以测得更多。

首先,做科学的世界模型,要“测一切之可测”,才能建模这个世界,这里有几件事情要做,第一,做好数据,把数据保存下来,做好它的“血缘”,从哪里来的,谁加工的,谁又给它做了进一步的补充、校对,所有的记录要做好。

第二,做好针对科学问题的加工,让它变成语料,去建模相关领域的世界模型,从数据到语料的过程需要大量相应领域的科学家,加上数据工程的技术语言去提高效率。

《中国企业家》:大模型可以发现新知识吗?

程远:2023年,我们在想,AI for Science能干什么?第一,提升科学实验的效率。第二,发现未知的东西,但基于数据驱动的技术暂时看不到太大的希望。当前,在数据充裕的地方,技术探索很多。数据稀疏的地方,技术能生成一个猜想,但有多靠谱?还不一定。

AlphaGo Zero为什么能击败人类棋手,它不是科学问题,它不需要跟真实世界做任何接触,它在一个可以闭环的纯数字世界进化能力。但在科学的研究中,一定要通过科学实验去验证。

《中国企业家》:AlphaGo Zero是人把下围棋规则教给它,它可以自我演化出能力,而不是去学习棋谱。

程远:棋谱会是AlphaGo Zero学习的语料之一,但是它更多的学习在于自己跟自己下了十万盘棋,以前人类没有做过的事情,它做了,它探索了这个空间,而且能给它准确的反馈。

在物理、化学这些需要实验验证的场景,现在的技术暂时很难做,但数学的对错是可以判断的,所以很多AI for Science围绕数学来做探索。

AlphaFold不是一个大语言模型,它被认为是一个深度学习的模型。

大语言模型的理解,来自大量的预训练,基于predicting the next token(预测下一个单词),但AlphaFold是根据每一个蛋白质最小单元之间的连接距离甚至是角度这样的维度,去还原结构,它不是一个个出来的,而是一起出来的。


视觉中国

《中国企业家》:人与机器之间的沟通依靠数据,行业数据怎么让机器理解?

程远:打个比方,比如你讲日语我讲中文,需要先找到一个翻译,后来,两个人可以说共同的语言。我们现在更关心的是,不需要翻译两人能直接对话。

在解决生命科学科研的问题上,首先要找到一个共同点,没有一个特别信任、互信的基础,两三次之后,我说的你听不懂,你说的我也听不懂,就很难形成紧密的合作,第一步,要找到这样的翻译,才能促成大家收到一个共同的信息。

第二,无论AI for Science还是AI for 产业,做AI的人跟这个领域的人要有共同的利益,你感兴趣,我也想做。

《中国企业家》:2025年3月,谷歌DeepMind的分拆公司Isomorphic Labs宣布完成6亿美元融资,他们还拿下了礼来(Eli Lilly)和诺华(Novartis)两家制药巨头将近30亿美元的合作订单。

程远:首先这个模式非常创新,DeepMind是谷歌的子公司,然后Isomorphic Labs把成果孵化出来,实现产业化,我们也很想复制这种模式。

《中国企业家》:AI制药有可能吗?

程远:目前来看,AI制药还没有成功,没有人为干预,AI不可能直接做出来新药,最起码5年内是不可能的。但AI提升药物研发效率,这是肯定的,就跟我们说AI看病一样,医生给病人看病,现实里,AI不替代医生,但AI可以帮助医生提升效率。

《中国企业家》:具体是怎么提升效率的?

程远:DeepMind去做这个事情,其实有大量的AI工具,也有制药的科学家、药物化学家,还有一些工具帮助科学家提效。大语言模型可以帮助科学家做FAP(靶向成纤维细胞活化蛋白)或者是一些科学计算。

AI有可能发现一个新的分子结构,但发现只是提出一个新的假设,大量验证工作、药物研发工作都在后面。一个科学家可能一天可以提出30、50个新假设,最终经过一轮轮的筛选,才能验证出来。

长期来说,10年、20年之后,经过谷歌等公司的探索,可能人和AI能协同完成某一个新药的发现,成功后,再把这个发现的过程固定下来,供后续新药研发模仿参考,可能会节省大量的人力工作。

区块链与Agent

《中国企业家》:Agent流行之后,对AI for Science有什么帮助?

程远:现在有很多科学计算软件,更多是以单机或者是相互隔离的形态存在,可能也有以一个小的软件集群的形式去完成计算。现在,Agent就是解决一个个小问题的工具、模型或者计算软件,不能联动和互动。

所以,想要做Agent AI,第一步,找到那些相对成熟的场景,或者是我们能够触达到的场景,它有足够多的工具,有足够多的Agent可以用。类似MCP这些协议出来之后,调用Agent的方式变得更加标准化,有可能性了。

第二,做好Agent AI,还需要学习。Agent AI的核心是针对一个任务,然后拆解出小的任务,知道要调用哪个工具,调用哪一类工具能更好地完成这个任务。这个事需要有一些前期的数据储备。

《中国企业家》:原来也做不到。

程远:AI for Science兴起之后,会出现大量的模型和工具能解决一个个的问题,有了解决单个问题的能力,才有可能去做Agent AI。

我们非常希望能形成一个模型共享的生态。你研发的模型可以被我调用,我研发的模型也可以被你调用,像MCP,但这还是不够。在科学领域里,还有一个协同的问题,好不容易研发一个模型被我用来解决一个重大科学问题,结果,我发个论文根本没你的份儿。

《中国企业家》:这是个很现实的问题。

程远:我们现在正在尝试一件事情,将区块链的技术用在科研领域,Agent之间可能互相都不认识,区块链能记住谁用了我的Agent,我用了谁的工具去完成科学任务,它能厘清生产关系。

在科研协作的场景,区块链是一个非常好的解决方案,科研场景没有那么标准化,每个科研场景,它需要的人不一样。在Agent AI时代,我们需要协同非常多Agent时,就必须要做好协议、做好区块链。


摄影:邓攀

《中国企业家》:Agent落地应用,你有什么看法?

程远:现在常见的Agent功能是做了简历、统计报表,比较浅,这些任务规划其实不需要特别强的规划能力,真正体现AI能力还是要到专业的领域里去。

《中国企业家》:扎进行业里。

程远:AI如果变成一个物理学家,它要学很多,比如物理学家怎么去验证新的科学假说,怎么去完成论证,你得有这样大量的案例给AI。

《中国企业家》:有的人觉得自己原来AI能力不足的时候,觉得买一体机就能解决很大的问题,但也有人说,一体机解决不了太多的问题。

程远:看解决哪方面问题,解决AI研发能力不足的问题,一体机解决不了。解决应用场景的问题,我觉得一体机是很有戏的。如果一体机只完成一个模型的部署,它完成的就是大语言模型的推理服务成本和部署便捷性的问题。

《中国企业家》:一体机解决不了什么问题?

程远:模型不是价值,模型一定要变成一个产品,结合业务应用场景,解决需求问题。如果是医院,一体机要植入到诊疗的流程当中,在银行,要植入到信用风控或者是客户服务的业务里面去,这才是一体机的价值。

Agent落地医疗

《中国企业家》:我们看到Agent在医疗行业落地比较多。

程远:我们跟复旦大学附属中山医院心内科主任葛均波院士做了心内科的模型,叫“观心大模型”,只做心内科。葛均波团队积累的数据,还有他的专家团队,以及我们这边的AI人员已经具备能力,能完成这个垂直科室的模型开发。

但医院很多疑难杂症经常需要会诊,最终会碰到病人的数据隐私问题,病人隐私数据不可能出当地医院。那么,未来,能做的事情是什么?

如果我用一家医院的数据构建出这个科室最好的Agent,几十家医院的每一个科室都有最好的Agent,医生面对一个复杂病例的时候,就可以调用这些Agent。

《中国企业家》:相当于把病人的信息脱敏了,最后成为一种知识沉淀。

程远:传统的解决数据隐私,是把智能从数据里面剥离出来,注入模型,常常应用多方安全计算这套技术。不管怎么去保护,始终就是一个攻防成本的问题。数据不管是以什么形式过来,对于隐私计算而言,它还有一定的概率能还原出来,不能百分之百保证这个数据是安全的。

Agent尤其是多智能体体系,很有可能解决这个事情,我在本地建模、本地完成(部署),给外部提供的是智能服务,而不是病人的数据。

《中国企业家》:距离完全落地应用,大概需要多少年?

程远:我觉得顶级的Agent出来,可能需要两三年。尤其DeepSeek出来之后,大量的医院都在部署DeepSeek,做推理,但很快科室就发现,模型的能力还不够,他们就会去优化这个模型,这时候,科室最强的Agent就会出现。

《中国企业家》:你们所做的“观心大模型”有哪些量化的能力指标。

程远:就心内科的疑难杂症,我们的topic case(主题案例)准确率是92%,现在千问、DeepSeek、Cloude都相对差一点。

“观心大模型”底座的大模型还是DeepSeek和千问,我们不做预训练,而是针对垂直领域,加上我们后期足够的数据进行调试,它可以超过通用模型的水平。

其实是回到一个概念,垂直模型能力提升来自哪里,我觉得来自数据和专业医生的积累。Scale AI的CEO Alexander Wang说,原来通用的、开放的数据已经用完了,未来的AI,一定是专业领域、垂直领域的数据。


摄影:邓攀

《中国企业家》:各个医院的Agent做出来之后,它跟病人、医生之间的三角关系是怎么协调的?

程远:最后还是要找医生。在可见的时间内,Agent都是一个辅助工具,辅助听起来好像价值不大,但事实上,它的价值非常大。

我这几天在想一个事情,复旦大学附属中山医院心内科就一个葛均波院士,他可能一天只能看100个病人,大模型给他提效20%,相当于就有了1.2个院士。

《中国企业家》:AI延伸了个体能力。

程远:假如,院士的能力可能是99分,基层医院的普通医生可能是70分,第一,我这个院士Agent可以帮助基层医生从70分提升到80分,辅助决策,给医生第二个意见,有一个讨论的人,让决策就更稳定、更靠谱。

第二,有普惠的价值,可能一个院士一周只能安排两天门诊,只能看200个病人,但如果赋能到基层医院的医生,可能就能看20万个病人。

《中国企业家》:跨医院合作的问题怎么解决?

程远:多个系统之间要完成对接,一定要有一套Protocol(协议),让大家说同样的语言,比如Anthropic做的MCP,国内可能也会推出一个类似的协议。

《中国企业家》:目前,部署一个科室Agent大概需要多少钱?

程远:还没有商业化,我们正在做商业化的规划。市场上类似的Agent,低到30万,高到两三百万,Agent还没有特别收敛到大家认可的水平,你能卖多少钱,其实是你给客户带来多少价值。

《中国企业家》:这个事情由大公司来做还是创业公司来做?

程远:我们做“观心大模型”也有顾虑,我们不是大厂,做这样一个垂类,它是否具备可复制性,投入这个产品,可能需要几个工程师、几个月的工作量,一算也是几十万、上百万的成本进去了。

每一家医院可能要同样做一遍,因为每家的系统都是不一样的。模型训练的上下游都需要非常强的定制化成本。

上游是什么?我要把这个科室的数据整合出来,要跟科室的医生联合完成数据的加工标注,这都是非常定制化的。

下游应用方面,大模型出来之后,接入到这个科室的系统,它的能力就强了,但各个医院流程不是一套标准的东西,需要定制,适配它的场景,投入成本比较高。

《中国企业家》:各个医院之间的Agent,数据开放问题怎么解决?

程远:有法可依,首先要有规范,对场景要有特定的数据安全规范;有器可用,就是要有一套数据安全的软件或者工具的体系;有迹可循,访问日志等数据存储。

《中国企业家》:一些医院或者企业的数字化做得不好,有可能直接进入AI化吗?

程远:它可以AI化,用别人的东西而不是它自己的。没有数据怎么做AI?这是一个根本的东西。

通用模型植入产品并投入运行后,会产生数据回流,根据场景反馈,再提升模型能力。多智能体系统,要做真实场景的强化学习,在分布式场景里,支撑场景,这可能是人工智能发展的下一幕。

《中国企业家》:Agent能力是自我增长的吗?

程远:Agent在应用中增长,类似于一个实习医生的成长,在医院查房时,老师会问那些实习医生的想法,其实就是在这个情境里面去学习,通用模型不会触达到这个场景,那么Agent就要在环境里去学习。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。