在全球人工智能技术蓬勃发展的背景下,瑞士于近日正式推出了其首个完全开源的大语言模型 ——Apertus。这一模型由瑞士联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及国家超级计算中心(CSCS)共同研发,标志着瑞士在人工智能领域的自主创新迈出了重要一步。
Apertus 作为瑞士国家级的大语言模型,具有多语言处理能力,覆盖了超过1000种语言,其中40% 的数据来自非英语语言。这一特点不仅增强了对多元文化的包容性,也让 Apertus 能更好地服务于瑞士国内的特殊语言需求,如瑞士德语和罗曼什语等。这一开放的设计旨在为用户提供一个可替代 OpenAI 等国际大公司的 AI 解决方案。
值得一提的是,Apertus 的开发过程充分体现了透明和开放的原则。除了模型权重之外,研发团队还将模型的架构、训练数据和训练流程等信息公开,采用了宽松的开源许可证,支持教育、科研及商业用途。这一措施极大地降低了用户的使用门槛,使更多的科研人员和开发者能够参与到人工智能的创新之中。
Apertus 的训练依托于瑞士的 “Alps” 超级计算机,配备了超过1万颗 NVIDIA Grace Hopper GPU,并且使用的是可再生能源,体现了对可持续发展的承诺。根据研发团队的介绍,Apertus 提供了两个版本:一个是参数量为80亿,适合个人用户和轻量级应用;另一个是700亿参数,专为复杂场景设计。
目前,用户可以通过 Swisscom 平台、Hugging Face 及 Public AI Network 等渠道获取 Apertus。瑞士政府希望借助这一项目,将人工智能打造为公共基础设施,强调合规性、透明度和普惠价值,助力科研、教育和产业的创新能力提升。
地址:https://huggingface.co/swiss-ai/Apertus-8B-Instruct-2509