IT之家 11 月 25 日消息,阿里巴巴集团旗下的阿里云于 11 月 24 日宣布,将为新加坡国家人工智能计划(AI Singapore,简称 AISG)最新版本的“Sea-Lion”大语言模型(LLM)—— 即 Qwen-Sea-Lion-v4 提供技术支持。值得一提的是,AISG 此次是放弃了 meta 模型,转向阿里巴巴的通义千问 Qwen 开源架构。
![]()
阿里云在新闻稿中指出,该最新版本基于阿里云的 Qwen3-32B 基础模型构建,其发布标志着 AISG 在推动区域范围内更强大、更普惠的人工智能解决方案方面迈出了“重要一步”。
此外,双方合作还包括阿里云为该大模型的“高级后训练阶段”提供技术支撑。阿里云强调,基础模型 Qwen3-32B 已额外接受了超过 1000 亿个东南亚语种词元(tokens)的训练,从而显著提升了其对本地表达方式、对话细微差别及区域性知识领域的理解能力。
作为 Qwen 系列的最新一代,Qwen3 基础模型本身已在规模庞大、高度多元的数据集上完成预训练,涵盖 119 种语言与方言,总训练数据量达 36 万亿词元。这使其从初始阶段即具备更广泛的语种覆盖能力,尤其强化了对主流人工智能模型中通常代表性不足的东南亚语言的支持。
作为合作的另一关键环节,AI Singapore 贡献了其开源的区域性数据集 —— 包括面向东南亚语言任务的数据整理、优化与评估工作。
目前,Qwen-Sea-Lion-v4 在参数规模低于 2000 亿的开源大模型中,位居“东南亚语言模型综合评估排行榜”(South-east Asian Holistic evaluation of Language Models)首位。该模型已在 AI Singapore 官网及 Hugging Face 平台开放免费下载。
值得一提的是,2023 年 12 月,新加坡正式启动一项总额 7000 万新元(IT之家注:现汇率约合 3.81 亿元人民币)的国家级计划,旨在全面提升本国在多模态大语言模型领域的科研与工程能力。该项目由新加坡国家研究基金会(NRF)提供资金支持,并获资讯通信媒体发展局(IMDA)背书。





京公网安备 11011402013531号