当前位置: 首页 » 资讯 » 新科技 » 正文

新加坡国家AI计划“换芯”:弃用Meta Llama,拥抱阿里Qwen3-32B,开源模型Sea-Lion v4 登顶东南亚语言榜

IP属地 中国·北京 编辑:柳晴雪 Chinaz 时间:2025-11-26 18:23:27

新加坡人工智能计划AISG发布新一代大语言模型Qwen-Sea-Lion-v4,底层由meta Llama全面切换为阿里巴巴“通义千问”Qwen3-32B,并在东南亚语言综合评估基准(Sea-Helm)夺得<2000亿参数开源榜单第一名。

切换原因

- 语言适配:Llama对印尼语、泰语、马来语等低资源语言表现不佳;Qwen3预训练覆盖119种语言/方言,含36万亿token,原生多语架构降低后续训练门槛

- 分词优化:新模型放弃西方常用“句子分词器”,采用字节对编码(BPE),可无空格切分泰语、缅甸语字符,翻译准确率与推理速度显著提升

- 算力友好:量化后模型可在32GB内存消费级笔记本运行,契合东南亚大量中小企业算力稀缺场景

训练数据

AISG贡献1000亿东南亚语言token,内容浓度13%,为Llama2的26倍;阿里运用“高级后训练”注入区域知识,使模型更好理解新加坡式英语、马来式英语等混用语言。

性能结果

Sea-Helm榜单显示,Qwen-Sea-Lion-v4在印尼语、越南语、泰语、马来语任务上平均领先原Llama基线8.4%,文档级推理与跨语言摘要指标均排名第一。

开源与落地

模型已在Hugging Face、AISG官网免费开放下载,提供4/8位量化版本;新加坡政府将其纳入2023年启动的7000万新元国家级多模态计划,预计2026年在教育、医疗、金融等场景大规模部署。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新