发布信息

刘烈宏在世界智能产业博览会上发言:AI真正缺的不是模型,而是高质量数据|数据要闻

作者:本站编辑      2026-06-03 18:02:34     0
刘烈宏在世界智能产业博览会上发言:AI真正缺的不是模型,而是高质量数据|数据要闻

速读:

国家数据局5月31日消息,国家数据局局长刘烈宏日前在2026世界智能产业博览会上表示,高质量数据集是具身智能“感知-决策-执行”的重要基础,要以完善的数据工程驱动具身智能的发展,深入开展系统性实践。

国家数据局局长刘烈宏在2026世界智能产业博览会上讲了一件非常重要的事:未来人工智能竞争的核心,正在从“拼模型”转向“拼数据”。

很多人都在关注大模型、智能体、机器人,但这次讲话其实释放了一个更值得关注的信号——国家正在把“高质量数据集建设”放到更重要的位置。

今天,我们用大白话聊聊这件事。

为何开始强调高质量数据集?

过去两年,大家讨论最多的是大模型。

从ChatGPT到各种行业大模型,很多企业都在卷参数、卷算力、卷模型能力。

但随着行业发展,越来越多人发现一个现实问题:

模型再强,没有好数据也发挥不出来。

就像一个学霸,如果给他的教材全是错误内容,最后学出来的结果也会出问题。

所以现在行业逐渐形成一个共识:

决定AI上限的,不只是模型,更是数据。

这也是为什么刘烈宏在讲话中多次提到高质量数据集。

因为数据正在成为人工智能时代最重要的基础资源之一。

制造业为何最需要?

讲话中重点提到了先进制造业。

很多人以为制造业上AI,就是装几个机器人、上几个系统。

其实远没有那么简单。

真正的工业智能化,需要大量真实数据支撑。

比如:

设备运行数据

产品质量数据

工艺流程数据

生产管理数据

故障维修数据

这些数据积累得越完整,AI就越能理解生产逻辑。

未来很多工业大模型,靠的不是互联网公开数据,而是工厂每天产生的真实业务数据。

谁掌握高质量工业数据,谁就更容易训练出真正懂行业的模型。

这也是国家推动行业高质量数据集建设的重要原因。

机器人为何也离不开数据?

这次讲话里还有一个关键词:

具身智能

简单理解,就是能进入现实世界工作的机器人。

比如:

工业机器人

服务机器人

家庭机器人

无人设备

很多人觉得机器人主要靠硬件。

实际上,机器人最大的难题是“训练”。

机器人如何识别物体?

如何判断环境?

如何完成动作?

背后都需要海量数据支撑。

视觉数据、语音数据、动作数据、触觉数据

这些数据越丰富,机器人就越聪明。

所以未来机器人产业的发展,本质上也是数据能力的竞争。

国家正在推动一个新的方向

这次讲话里还有一个值得关注的信息:

国家数据局即将推出《关于推进行业高质量数据集建设行动的实施方案》

从公开内容看,未来重点会围绕六个方向推进:

强基扩容

标注攻坚

提质增效

应用赋能

管理服务

价值释放

翻译成一句话就是:

不仅要把数据收集起来,更要让数据真正产生价值

因为数据放在数据库里不流通、不应用,本身并不能创造价值。

只有进入产业、进入场景、进入AI训练过程,数据才真正变成生产力。

数据产业的新机会来了

过去两年,大家讨论最多的是大模型。

从ChatGPT到各种行业大模型,很多企业都在卷参数、卷算力、卷模型能力。

但随着行业发展,越来越多人发现一个现实问题:

模型再强,没有好数据也发挥不出来。

就像一个学霸,如果给他的教材全是错误内容,最后学出来的结果也会出问题。

所以现在行业逐渐形成一个共识:

决定AI上限的,不只是模型,更是数据。

这也是为什么刘烈宏在讲话中多次提到高质量数据集。

因为数据正在成为人工智能时代最重要的基础资源之一。

总结

这次刘烈宏在天津的讲话,表面上是在讲数据集建设。

但更深层的意义是:

国家正在推动人工智能的发展逻辑发生变化。

过去大家关注模型有多强。

未来大家更关注数据有多好。

因为真正决定AI能走多远的,不只是算法和算力,还有源源不断的高质量数据。

对于企业来说,下一阶段最值得思考的问题或许不是“要不要做AI”,而是:

自己手里的数据,能不能成为AI时代的新生产力。

文章来源:数界观

点击上图

直达订阅小程序

相关内容 查看全部