2026年5月28日,国家数据局党组书记、局长刘烈宏在2026世界智能产业博览会开幕式上发表主旨演讲,围绕 “数据赋能人工智能创新发展”,明确高质量数据集的核心支撑作用。
一、高质量数据集是先进制造业智能化升级的基础资源与创新引擎
在工业制造领域,高质量数据集是智能化升级的基础资源与创新引擎。目前,围绕汽车制造、船舶工业、轨道交通等重点方向已建设大量行业数据集,有力支撑AI在研发设计、生产制造、质量检测等关键环节的应用。只有把真实产线、设备运行和质量检测等数据系统采集、治理和利用起来,行业大模型和智能体才能真正理解工业机理、适配工业场景、优化工业流程,实现数据、模型、装备、场景的深度融合。
二、高质量数据集是具身智能 “感知-决策-执行” 的重要基础
高质量多模态数据是机器人实现"感知—决策—执行"闭环的重要基础。今年人形机器人半程马拉松中,自主导航参赛队伍占比越来越高,冠军成绩更打破人类纪录,标志着具身智能正加速迈向"全自主"阶段。而取得好成绩的企业有一个共同特点:它们均以完善的数据工程驱动发展,系统布局真机遥操、仿真合成、人类视频等多源数据产线,打造新一代多模态数据平台,实现对异构数据的统一治理与高效利用。天津投用的全球最大具身智能数据工厂,部署标准化采集单元,产出大量训练数据,进一步印证了具身智能的竞争本质上是数据体系能力的竞争。
三、高质量数据集是AI for Science加速发展的关键支撑
AI for Science对数据的准确性、规范性和可信度提出了更高要求。只有数据足够可靠,模型才能形成可信的科学推理与规律发现,进而推动基础研究走向产业应用。因此,高质量数据集不仅是科学模型训练与成果验证的底座,更是AI for Science真正落地的关键支撑。
2026年是“数据要素价值释放年”,国家数据局将推出《关于推进行业高质量数据集建设行动的实施方案》,围绕强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放等六大行动,聚焦人工智能赋能产业发展需求,以产业应用牵引数据供给、以数据驱动产业智能发展,推动各行各业“数据飞轮”更好转起来。
注意:本文讲话的原文自【国家数据局官网】刘烈宏赴天津出席2026世界智能产业博览会并开展调研,发布日期:2026年5月31日。本文仅做政策信息转载分享,不对讲话内容做主观解读,内容版权归原发布单位所有,如涉及版权事宜请联系我方删除。
特别提示:任何经营决策请以官方最新正式文件为准。
END
