

速读:
国家数据局5月31日消息,国家数据局局长刘烈宏日前在2026世界智能产业博览会上表示,高质量数据集是具身智能“感知-决策-执行”的重要基础,要以完善的数据工程驱动具身智能的发展,深入开展系统性实践。
国家数据局局长刘烈宏在2026世界智能产业博览会上讲了一件非常重要的事:未来人工智能竞争的核心,正在从“拼模型”转向“拼数据”。
很多人都在关注大模型、智能体、机器人,但这次讲话其实释放了一个更值得关注的信号——国家正在把“高质量数据集建设”放到更重要的位置。
今天,我们用大白话聊聊这件事。

为何开始强调高质量数据集?
过去两年,大家讨论最多的是大模型。
从ChatGPT到各种行业大模型,很多企业都在卷参数、卷算力、卷模型能力。
但随着行业发展,越来越多人发现一个现实问题:
模型再强,没有好数据也发挥不出来。
就像一个学霸,如果给他的教材全是错误内容,最后学出来的结果也会出问题。
所以现在行业逐渐形成一个共识:
决定AI上限的,不只是模型,更是数据。
这也是为什么刘烈宏在讲话中多次提到高质量数据集。
因为数据正在成为人工智能时代最重要的基础资源之一。
制造业为何最需要?
讲话中重点提到了先进制造业。
很多人以为制造业上AI,就是装几个机器人、上几个系统。
其实远没有那么简单。
真正的工业智能化,需要大量真实数据支撑。
比如:
设备运行数据
产品质量数据
工艺流程数据
生产管理数据
故障维修数据
这些数据积累得越完整,AI就越能理解生产逻辑。
未来很多工业大模型,靠的不是互联网公开数据,而是工厂每天产生的真实业务数据。
谁掌握高质量工业数据,谁就更容易训练出真正懂行业的模型。
这也是国家推动行业高质量数据集建设的重要原因。
机器人为何也离不开数据?
这次讲话里还有一个关键词:
具身智能
简单理解,就是能进入现实世界工作的机器人。
比如:
工业机器人
服务机器人
家庭机器人
无人设备
很多人觉得机器人主要靠硬件。
实际上,机器人最大的难题是“训练”。
机器人如何识别物体?
如何判断环境?
如何完成动作?
背后都需要海量数据支撑。
视觉数据、语音数据、动作数据、触觉数据
这些数据越丰富,机器人就越聪明。
所以未来机器人产业的发展,本质上也是数据能力的竞争。
国家正在推动一个新的方向
这次讲话里还有一个值得关注的信息:
国家数据局即将推出《关于推进行业高质量数据集建设行动的实施方案》。
从公开内容看,未来重点会围绕六个方向推进:
强基扩容
标注攻坚
提质增效
应用赋能
管理服务
价值释放
翻译成一句话就是:
不仅要把数据收集起来,更要让数据真正产生价值
因为数据放在数据库里不流通、不应用,本身并不能创造价值。
只有进入产业、进入场景、进入AI训练过程,数据才真正变成生产力。
数据产业的新机会来了
过去两年,大家讨论最多的是大模型。
从ChatGPT到各种行业大模型,很多企业都在卷参数、卷算力、卷模型能力。
但随着行业发展,越来越多人发现一个现实问题:
模型再强,没有好数据也发挥不出来。
就像一个学霸,如果给他的教材全是错误内容,最后学出来的结果也会出问题。
所以现在行业逐渐形成一个共识:
决定AI上限的,不只是模型,更是数据。
这也是为什么刘烈宏在讲话中多次提到高质量数据集。
因为数据正在成为人工智能时代最重要的基础资源之一。
总结
这次刘烈宏在天津的讲话,表面上是在讲数据集建设。
但更深层的意义是:
国家正在推动人工智能的发展逻辑发生变化。
过去大家关注模型有多强。
未来大家更关注数据有多好。
因为真正决定AI能走多远的,不只是算法和算力,还有源源不断的高质量数据。
对于企业来说,下一阶段最值得思考的问题或许不是“要不要做AI”,而是:
自己手里的数据,能不能成为AI时代的新生产力。


点击上图
直达订阅小程序
