“企业数据要素开发利用指数”主要选用了反映数据要素存量、数据开发能力、数据驱动商业应用、数据价值变现等四个方面的关键词
整理步骤如下:
➤第一步,整理所有样本企业的上市公司年报并将其转化为纯文本格式
➤第二步,确定数据要素种子词搜索范围
➤第三步,根据分词词典使用python 语言编程对年报文本内容进行分词与文本抓取,统计文中出现的数据要素特征词词数
➤第四步,对词数加一取自然对数
一、数据介绍
数据名称:上市公司数据要素利用水平-词频明细
数据范围:A股上市公司
时间范围:1998-2024年
样本数量:68471条
数据来源:上市公司年报
二、数据指标
类别股票代码公司简称
年报标题年份行业名称
行业代码全文-文本总长度仅中英文-文本总长度
数据要素利用水平数据要素利用词频总数数据要素存量
数据开发能力数据驱动商业应用数据价值变现
大数据数据集成数据融合
数据信息数据管理数据资产
等等指标

