当前位置: 首页 » 资讯 » 新科技 » 正文

全国人大代表周迪建议:建立档案AI联合实验室 破解人工智能大模型“语料荒”

IP属地 中国·北京 编辑:赵云飞 时间:2026-03-11 10:46:16

全国人大代表 周迪

作为一名在智能物联领域深耕20余年的科技工作者,浙江宇视科技有限公司研究院院长、杭州电子科技大学教授周迪自担任全国人大代表以来,脑海里便装下了一个又一个科技“金点子”。在数字浪潮奔涌而至的当下,他对新技术如何赋能千行百业思考得更深入了。

“档案部门作为国家基础性、战略性信息资源的保管者,不仅是AI(人工智能)技术的应用者,更应当是AI治理的参与者和示范者。”周迪在今年全国两会期间接受本报记者专访时表示。

近年来,随着全球人工智能领域竞争的日趋激烈,语料库的规模和质量越来越成为牵动人工智能大模型发展的“牛鼻子”。由于中文互联网起步较晚,缺乏深厚、优质的内容积淀,大大制约了我国人工智能大模型的技术创新和国际竞争力提升。破局的关键点在哪?周迪将目光瞄向了档案。

国家档案局公布的最新数据显示,全国各级综合档案馆馆藏档案13.8亿卷(件)、纸质馆藏资料4513.2万册、馆藏电子档案2812.7TB。如此宏大的体量,加之原始记录的真实属性和凭证价值的信用背书,档案部门无疑是人工智能大模型所需的高质量语料的天然产地。

AI的应用既是发展的助推器,也是风险的集聚场。如何筑牢档案安全的“铜墙铁壁”?怎样规避数据伦理中的价值偏见?习惯于用技术理性逻辑分析问题的周迪给出了他的解决方案——

划定数据红线,明确规定哪些档案数据可以用于公有云大模型训练,哪些只能在本地进行私有化部署。建立“人机协同”审核机制,对AI生成的资政辅政决策建议、开放档案划控鉴定、辅助编研成果等内容,明确档案员在AI应用中的最终责任。加强算法安全管理,对应用于档案行业的AI算法进行安全评估和备案,杜绝算法被恶意攻击导致数据泄露或档案篡改。防止算法偏见,在训练数据的选择上,保证档案样本的多样性,避免因历史数据的不平衡导致AI在档案鉴定或开放过程中产生伦理偏见或歧视。

原载于《中国档案报》2026年3月9日 总第4411期 第一版

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。