当前位置: 首页 » 资讯 » 新科技 » 正文

500余家企业齐聚南京,全国高质量数据集供需对接大会交出超9亿元“成绩单”

IP属地 中国·北京 现代快报 时间:2025-11-05 22:10:44

金秋时节,硕果累累。11月5日,一场聚焦数据产业未来的盛会“2025全国高质量数据集和数据标注产业供需对接大会”在南京开启。本次大会由国家数据局数字科技和基础设施建设司指导,江苏省数据局与南京市人民政府联合主办。现代快报记者了解到,作为国内首个聚焦高质量数据集与数据标注全链条的全国性对接平台,本次大会共吸引全国超过500家企业参与,现场达成合作90余项,累计交易金额突破9亿元,用实打实的成果展现了高质量数据市场的蓬勃活力与巨大潜力。



五大专场精准“配对”,数据燃料驱动AI创新

本次大会以“推进高质量数据集建设,淬炼人工智能数据燃料”为主题,围绕大模型训练、行业智能化转型中的数据需求,设置了主会场及医疗健康、智慧能源、工业制造、交通运输、文化旅游五大行业供需对接专场。每个会场都上演着“需求与供给”的高效匹配。


在医疗健康分会场,国家健康医疗大数据(东部)中心与数据标注专委会、工业和信息化部电子五所及南京市多个区签署协议,共建医疗健康高质量数据集产业基地,推动AI辅助诊断、精准医疗等应用落地。


工业制造分会场,南钢集团的案例分享引发讨论。通过采集46万个点位大数据,企业实现了全流程数字化管控,成为全国“智改数转”的典范。来自南通、无锡、扬州、常州一批合作项目集中签约,总金额达千万元。

从主会场的政策解读到专场的案例分享,再到企业间的一对一洽谈,大会构建起“需求-供给-价值实现”的完整链路,为人工智能产业筑牢高质量数据根基。

从方言保护到技术创新,高质量数据应用多点开花

“注意看,这个男人叫小帅,这个女人叫小美……”这样的开场白几乎成了解说类视频的标配。而这两个虚拟角色背后,离不开幕后推手——出门问问。

谈及技术的实际应用,出门问问创新科技有限公司CTO孙鹏飞以方言的数据采集为例,阐释语音智能的两大核心能力——ASR(语音转文字)与 TTS(文字转语音)。在“听懂”层面,通过采集各地方言数据训练的ASR模型,能精准将方言转化为文字,解决跨地域沟通障碍。“比如外来者到江苏,借助方言识别技术,能快速理解当地人口语表达,实现‘走到哪都能沟通’。”在“说对”层面,TTS 模型可将文字转化为地道方言语音,满足多样化输出需求。“以跨语种翻译为例,若需将中文翻译成英文方言场景下的语音,模型既能‘听懂’中文输入,又能‘说对’英文语音,实现双向顺畅交互。”

孙鹏飞提到,出门问问已与西部部分城市合作,开展少数民族语言的数据采集工作:“一方面,在国家推广普通话的背景下,部分少数民族语言面临传承挑战,我们采集的数据能构建语言知识库,为方言拯救、挖掘提供支撑,助力人类文明传承;另一方面,少数民族地区存在大量普通话沟通需求缺口,这不仅是广阔的市场空间,更是技术服务民生的重要场景。”

不止于语音领域,在大会现场,京东科技、阿里云、华为云、企查查、澳鹏中国、上海库帕斯、江苏省人民医院及江苏省数据交易所等来自需求侧、供给侧与价值实现侧的9家代表企业分享了高质量数据集在电商、云计算、医疗、金融、工业等领域的落地实践。“现在行业最需要的,是一条标准化、规模化、可信化的‘数据供应链’。”企业代表们达成共识,同时也呼吁加强行业标准共建,破解数据质量不均、标注成本高的难题。

南京大学苏州校友会副秘书长、苏州柏川数据政府关系总监朱丹则从行业痛点出发,提出了数据采集设备升级的迫切性:“现在‘具身智能’兴起,需要采集嗅觉、味觉、震动等非传统数据,但现有设备大多针对文字、视频设计,定制化不足成了瓶颈。”此外,他还提到存储成本高的问题:“之前大家更关注算力,容易忽略存储,随着数据量爆发,如何降低单位存储成本,是全行业要一起解决的课题。”

政策地方协同发力,绘就数据产业发展蓝图

在大会主会场,国家数据局数字科技与基础设施建设司副司长李建国、江苏省数据局副局长王万军及南京市委常务副市长霍慧萍参会并致辞,从政策导向与区域实践层面,为高质量数据集建设和数据标注产业发展提供了指引。

国家数据发展研究院院长胡坚波、中国电子技术标准化研究院副院长范科峰等权威智库与国家研究机构负责人分别分享了高质量数据集建设路径、标准与评测规范,为产业规范化发展提供了坚实支撑。


同时,其他多个省市也结合本地产业特色,在能源、交通、文旅等领域开展差异化探索,共同形成“国家引导、地方实践、企业主导”的高质量数据集建设新路径。

大赛、平台同步启动,数据产业迈入“深水区”

大会现场,一系列成果集中亮相,为产业发展注入新动力

现场启动了“数智未来”高质量数据集开发者创新大赛,旨在以赛促创、以赛促用、以赛引才,为高质量数据产业发展选拔顶尖技术人才。高质量数据集建设公共赋能平台正式发布,将为产业提供一站式的数据资源开发、治理、应用与协同创新服务。同时,一批跨行业的高质量数据集与数据标注合作成果集中亮相,标志着高质量数据集的建设正从顶层设计加速走向产业实践的“深水区”。

“这次大会不是终点,而是高质量数据产业加速发展的起点。”现场嘉宾表示。9亿元的交易额、90余项合作、500余家企业参与,这些数字背后,是我国数据要素市场的活力彰显,更是“人工智能+数据”双轮驱动的产业新生态的初步成型。未来,随着高质量数据集建设不断深化,数据将真正成为人工智能时代的“新石油”,为数字中国建设注入源源不断的动能。

国家数据局相关部门、国家权威支撑机构、全国各地企业、全国各省市数据管理部门等相关负责人及产学研各界嘉宾等参加本次大会。

现代快报/现代+记者 卢河燕

部分江苏省数据局

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。