![]()
开放科学是人工智能领域发展的基础,但这个时代似乎正在远去。
从反向传播算法到 ImageNet,从 PyTorch 到 GLUE 基准,开放数据与代码让创新得以在全球复制与迭代。而如今,人工智能(AI)正从“共享的研究事业”变为“封闭的商业竞赛”,当模型、数据与论文被锁在企业的围墙之内,科学的透明与复现性也在消逝。
对此,AI 教母、斯坦福大学教授李飞飞联合斯坦福大学以人为本人工智能研究所(Stanford HAI)同事呼吁,大学与非营利机构应重新承担起推动人工智能作为公共产品的使命:投资开放数据与模型计划,建设跨学科、跨国界的科研网络,让人工智能的发展重新服务于公共利益。
学术头条在不改变原文大意的情况下,对整体内容做了精编,如下:
10 年前,马克·扎克伯格意外现身神经信息处理系统大会(NeurIPS),宣布成立 Facebook 基础人工智能研究部门(FAIR),标志着人工智能(AI)研究从大学实验室一跃进入了大型科技公司的核心。
让我们快进到今天:尽管人工智能已成为万亿美元的全球产业,meta(原 Facebook)仍宣布大幅削减 FAIR 的预算。DeepMind 不再公开其领先的人工智能模型的技术细节,并引入了 6 个月的禁发期,以及更严格的论文内部审查机制,以保持竞争优势。同样地,OpenAI 如今已变成“ClosedAI”,与其他企业实验室一样,越来越倾向于通过技术博客和内部产品发布来展示成果,而非同行评审的学术发表或开源发布。
人工智能领域的开放浪潮正在消退——随之消逝的,还有科学进步的基础本身。
我们所说的“公共利益”是什么?
开放科学首先是一种公共产品——知识惠及所有人,而非少数特定群体。当研究成果公开分享时,创新会加速,重复研究会被最小化,各种想法可以相互借鉴。在人工智能研究领域,这些共享的开源工具、数据集、库和基准测试,使某一实验室取得的进展能够在全球范围内传播——从学生到初创企业,再到大型工业部署。
但当人工智能知识被私有化时,我们失去的不仅是透明度,更失去了推动真正科学进步的思想交叉融合。大学和公共机构凭借其独特定位,能够维持这种公共利益的职能——因为它们的运作模式并非以股东回报或产品上市为核心,而是能够优先保障开放性、可重复性、人才培养和全球参与。
开放性如何塑造现代人工智能?
人工智能的发展史与开放科学的历史密不可分:
反向传播算法(back-propagation algorithm)于 20 世纪 80 年代首次公开分享,促成了深度学习的复兴。
随后,成功的深度学习技术在大学中率先取得突破,尤其在多伦多大学 Geoff Hinton 的实验室里,语音和图像识别领域取得了重大进展。
开放数据集如 TIMIT、TREC、MNIST、ImageNet 和 Stanford Alpaca 数据集,为人工智能发展提供了可复现的基准测试和共同研究基础。
开源代码/库(如斯坦福大学 CoreNLP 工具包,以及后来的 TensorFlow、PyTorch 和 FlashAttention)提供了免费获取前沿技术的途径。
共享的基准测试与挑战(例如 GLUE、ImageNet 竞赛)培养了数代人工智能研究者与工程师。
这个生态系统催生了创新飞轮效应:研究人员发布代码和数据,其他人加以利用并改进;学生从中学习;初创企业和行业将这些成果转化为产品。这绝非偶然——正是开放科学的公共产品功能的体现。在此背景下,当前企业对开放性的退缩令人忧虑。这标志着科学从共享事业向以研究成果为专有产品战略的转变。
行业的退缩——以及人才市场的失灵
企业界从开放科学中退缩是可以理解的:企业人工智能实验室面临巨大的商业压力和激烈竞争。模型开发成本高昂,研究投入巨大,先发优势至关重要。然而,这种转变对公共利益和教育领域产生了更广泛的后果。
一个鲜明的指标是人才市场:有报道称,meta 为吸引顶尖人才,不惜以 1 亿美元或更高的签约金额争夺顶级人工智能研究人员。
这标志着大学市场的失灵——本应培养下一代人才的机构,在计算能力、数据资源以及研究人员与软件工程师的合理配置方面都严重不足,无法满足大型人工智能模型开发领域对专家的需求。让研究型学生参与大型团队是掌握这些关键技能的正确途径。若高校无法按未来就业需求培养学生,我们不仅会丧失个人发展机遇,更将失去推动创新与公共利益研究所需的广泛人才储备。
大学的契机与开放的公共利益
现在正是大学重申其推动人工智能作为公共产品的历史使命的契机。学术界与非营利机构有能力将开放性、伦理规范、共享基础设施及全球可及性置于短期商业利益之上。
这意味着要投资于开放数据和开放模型计划,确保这些资源始终可自由获取用于科研和教育;建立全球合作伙伴关系,实现跨国界、跨学科的计算资源、数据和专业知识共享——避免知识被少数公司或国家垄断;同时培育跨学科团队科学,将社会科学、伦理学、设计学与人工智能技术研究相融合,确保人工智能服务于人类需求和社会价值。
大学不仅要发表成果,更要维系开放科学所代表的公共利益生态系统。通过这样做,它们能够保护人才培养与科学发现的基础,而这一基础是推动所有人工智能突破的关键。
继续前行
在 Stanford HAI,我们坚信人工智能的下一个发展阶段必须将科学开放性与尊严、公平、公共利益等以人为本的价值观相结合。当产业界优先考虑产品与竞争优势时,我们的目标是建立一个由志同道合的高校、政府、非营利组织及产业伙伴组成的全球协作网络,共同践行公共利益使命。这无关品牌塑造或竞争——而是对开放科学制度与实践的维护。
当今世界面临的最重要问题需要一种新的科研模式:团队科学。团队科学不仅需要跨学科学术研究者与软件工程师的大规模协作——这种协作模式目前仅存在于工业界——还需配套的计算能力和数据支持。我们需要新的学术模式来实现团队科学将带来的突破:建立分布式大学研究中心,跨越各大洲相互连接,共享领导权、数据、计算能力、模型和专业人才。这些中心的工作将聚焦于人类繁荣,而非商业的排他性。
问题在于,我们是要重建那些最初使人工智能成为可能的开放科学机构,还是任由它们被集中的商业力量所侵蚀。在人工智能塑造我们之前,我们拥有一个转瞬即逝的机会来塑造其发展轨迹。
https://hai.stanford.edu/news/universities-must-reclaim-ai-research-for-the-public-good
作者:
李飞飞、John Etchemendy、James Landay,均为 Stanford HAI 联合主任
Christopher Manning,为 Stanford HAI 副主任。





京公网安备 11011402013531号