环球时报
英伟达GTC年度开发者大会正在举行,市场普遍将之视为世界AI发展的一个风向标。这一行业热潮,也折射出全球AI竞争日趋白热化。自ChatGPT问世后,多国纷纷跟进大语言模型技术,围绕“主权级大模型”的全球战略博弈也随之拉开序幕。
当前,大模型训练高度依赖海量高质量数据和人类反馈强化学习技术。这两大技术特点,使得通过调整训练数据、引导人类反馈偏好,向大模型注入特定观点和价值观成为可能。这也直接催生了“主权级大模型”的概念。
主权级大模型的“主权”属性,要求该模型需与国家立场对齐。技术政治时代,主权级大模型与一国国家安全、国家战略紧密相连。中国的区域国别学可为训练这类大模型构建高质量且安全的训练数据集,促使主权级大模型进一步对齐国家立场,服务国家战略。
主权级大模型是国家统筹发展和安全的关键基础设施。当前,大模型被认为是AI领域最重要的软件基础设施,是可能通向通用人工智能的主要技术途径。由此而来的一个事关国家战略的核心问题是:如果使用开源模型,那么由谁掌控训练数据?其训练数据是否直接关乎一个国家的文化、经济、安全?正因如此,各国愈发关注自主人工智能,力争自主掌握并运用人工智能技术带来的战略优势。
自主人工智能包含两大支柱:物理基础设施和数据基础设施,后者的核心正是主权级大模型。根据业内的普遍理解,主权级大模型是由本土团队开发、使用本地数据集训练的大型语言模型。也就是说,该大模型符合研发国的政治制度、文化、宗教和价值观,是该国重要的人工智能基础设施。其优势在于能够有效保障国家的数据隐私和安全,无需过度依赖他国开发的人工智能大模型。目前,很多国家宣布构建服务自身的主权级大模型。比如,法国初创公司Mistral AI成立仅两年,就宣布与英伟达合作推出专注于人工智能的主权计算基础设施。可以说,发展主权级大模型等自主的人工智能能力被视为确保一国“数字主权”的关键。
主权级大模型与国家安全能力建设紧密相关。一方面,因“主权”属性,大模型拥有使用国政治、经济、军事等多方面数据,对该国制定发展战略、维护国家安全等相关举措具有直接而重大的影响。此外,融入一国社会运行、发展的主权级大模型,可对该国文化起到“编码”的作用。大模型所依赖的数据库,直接决定其如何塑造国民对自身与世界的认知,这也是“主权”属性的另一层含义。其不直接攻击物理或技术系统,而是从深层次上改变人们对世界的理解与行为逻辑。西方国家对该领域有较多论述与设计,先后发展出舆论战、心理战、认知战、模因战等概念及相关策略。
另一方面,缺乏自主可控的主权级大模型,会直接危及一国国家安全。受技术、资金以及基础设施等限制,部分发展中国家尚不具备自主构建主权级大模型的能力。主权级大模型能够提供远超人力的强大算力,以更为客观、可量化的方式来分析国内舆论态势、经济社会走势以及其他国家外交政策走向等,进而为国家战略决策提供参考乃至发挥预警作用。不掌握主权级大模型的国家很可能陷入“落后挨打”的处境,国际秩序中将因此出现国与国“AI主权”不平等的现象。就此而言,有能力构建主权级大模型的国家,有责任帮助缺乏条件的国家建设属于自己的主权级大模型。
主权级大模型的“主权”属性,要求该模型必须服务国家战略并体现使用国价值观。该模型并非仅仅将特定国家数据进行统一整理,而是基于该国独特的数据、研究和历史,通过对数据进行专业性标注、清洗,训练而成的、能够体现该国特色的工具。区域国别学的初衷是服务国家战略,与主权级大模型的“主权”属性要求一致,可为主权级大模型提供高质量大数据集及系列训练逻辑。
区域国别学能够为主权级大模型构建注入结构化、系统化的知识图谱,例如评估关键海峡通道的地缘政治风险、不同国家间领土争端现状与历史脉络、一国国际形象在特定地区传播效果等。
更重要的是,区域国别学学者能够凭借自身语言能力、专业基础,对海量数据进行甄别、清洗、标注以及评估,有效识别信息操纵,规避敏感议题,构建一个高质量且安全的训练数据集。在互动过程中,区域国别学不仅可为主权级大模型训练提供数据支撑,更可将该学科的分析逻辑、推理框架等一并输入,使大模型形成对齐国家立场的本地标准与分析体系。(作者分别是北京大学全球互联互通研究中心助理研究员、北京大学软件工程国家工程研究中心副教授)





京公网安备 11011402013531号