
上市公司 AI 技术与 AI 叙事相关指标数据 2010-2024
获取方法见推文末
该数据10.24前限时免费:转发推文集赞25个,添加上方图片的客服发送截图即可
数据简介
CNPaperData
在数字经济深度渗透与 AI 技术快速迭代的背景下,上市公司作为市场创新主体,其 AI 技术应用布局与 AI 叙事表达(即管理层对 AI 价值、战略的阐述)已成为反映企业技术竞争力与发展潜力的核心维度。该数据可支撑学术界探究企业 AI 战略演化规律、AI 叙事与技术落地的协同性,以及 AI 因素对企业绩效、市场估值的影响机制,同时为政策制定者评估 AI 产业政策在企业层面的传导效果提供微观数据支撑,填补了现有研究中 “企业 AI 叙事文本量化” 与 “技术实践关联分析” 的数据空白。
本指标构建过程如下:数据原始信息来源于国内上市公司公开披露年度报告中的 “管理层讨论与分析”(MD&A)部分,该部分集中体现管理层对企业技术布局、战略规划的阐述;数据层级为上市公司级;通过对2010-2024年期间上市公司公开信息的系统整理与核验,最终获得2010-2024年共计47327条上市公司人工智能发展相关指标数据,
本次数据处理流程为:首先从`result/上市公司词频统计.xlsx`(全量数据,论文所用的pdftotxt方法在将年报PDF版本转为TXT文档时,偶有PDF因版本加密等原因导致转换TXT时会出现不可逆转的偏差,故我们提供全量板,也提供初步修改的版本即DATA)读取数据;将`年份`列强制转换为数值类型并剔除无法转换的无效行;基于质量控制筛除`总词数`小于等于2000的记录,并进一步仅保留`年份`小于等于2024的数据;计算每条记录的`kw_sum`指标,随后输出数据的示例、结构信息与描述性统计以便快速检查;在存在`年份`列的前提下,按`年份`分组计算各数值字段的年度均值用于年度对比分析;最后将清洗与计算后的结果保存至`result/DATA.xlsx`以供后续使用。
关键词为:
AI_Hardware_Platform | ['类脑芯片', '智能芯片', 'AI芯片', '片上系统', '神经芯片', '神经拟态', '智能集成电路', '智能微控制器', '图形处理器', '现场可编程门阵列', '专用集成电路', '神经网络处理单元', '复杂可编程逻辑器件', '数字信号处理', '视觉数据处理器', '显示卡芯片', '忆阻器'] |
General_AI_Technologies | ['专家系统', '自适应系统', '规则学习', '多任务学习', '机器学习', '监督学习', '无监督学习', '强化学习', '深度学习', '集成学习', '模仿学习', '基于实例的学习', '隐私计算', '支持向量机', '决策树', '人工神经网络', 'k最近邻算法', '马尔可夫模型', '深度Q网络', '策略优化', '多智能体系统', 'A3C算法', '神经网络', '知识图谱', '知识抽取', '知识融合', '知识处理', '知识表示与推理', '本体论', '脑模拟', '神经计算', '脑模型', '人工生命', '合成生命', '虚拟生物', '量子计算', '模式分类', '模式聚类', '群体智能', '蚁群算法', '粒子群算法', '社会模拟', '虚拟世界', '混合智能', '生物智能', '机器智能', '机器人', '分类与回归树', '模糊逻辑', '潜在表示', '逻辑规划'] |
Key_AI_Technologies | ['自然语言处理', '语义处理', '机器翻译', '字符状态', '句法分析', '词频统计', '分词', '自然语言查询', '语义理解', '语义状态', '语义分析', '语义检索', '语义分割', '语义分类', '语义融合', '智能语音', '语音感知', '语音状态', '语音合成', '语音检索', '语音控制', '计算机视觉', '图像感知', '图像状态', '图像生成', '图像增强', '图像检索', '目标检测', '图像提取', '图像聚类', '图像匹配', '图像和视频分割', '仿生方法', '生物特征状态', '指纹特征', '人脸特征', '虹膜特征', '声纹特征', 'DNA特征', '行为特征', '血管特征', '活体检测', '虚拟现实', '增强现实', '头戴式显示器', '智能眼镜', '虚拟交互', '虚拟游戏', '虚拟购物', '人机交互', '眼动追踪', '视觉轨迹追踪', '头部轨迹追踪', '数据手套', '语音交互', '体感交互', '手势交互', '脑机交互', '场景理解', '情感分析'] |
AI_Application_Fields | ['智能制造', '智能教育', '智能金融', '智能农业', '智能家居', '智能物流', '智能交通', '智能医疗', '智能媒体', '智能疫情防控', '智能安防设备', '智能终端', '智能医疗设备', '智能媒体管理平台', '智能防疫平台', '智能驾驶'] |
数据信息
CNPaperData
数据来源:各上市公司公开披露的年度报告中 “管理层讨论与分析”(MD&A)部分
数据范围:各上市公司
时间跨度:2010-2024
数据格式:Excel
数据字段:
股票代码 | 年份 | kw_sum | 总词数 | 忆阻器 | 智能教育 | 马尔可夫模型 |
注:省略了剩下的关键词列名展示
数据展示
CNPaperData
采用表格形式呈现完整数据,包含企业基本信息、时间信息及 AI 技术与 AI 叙事核心指标,以下为部分数据示例:

注:省略了剩下的关键词列名展示
选题方向
CNPaperData
选题 1:文本挖掘视角下上市公司 AI 叙事的动态演变与行业差异研究(2010-2024)
基于 MD&A 文本数据,运用词频分析、主题模型(LDA)等文本挖掘技术,梳理 2010-2024 年上市公司 AI 叙事的关键词演变趋势与情感倾向变化,对比信息技术业、制造业、服务业等行业在 AI 叙事内容、强度上的差异,揭示企业 AI 叙事与行业技术特征、市场需求的关联机制,为不同行业企业制定 AI 战略表达策略提供参考。
选题 2:上市公司 AI 技术提及、AI 叙事一致性与企业经营绩效的关系研究
构建面板数据模型,以 AI 技术提及频次衡量企业 AI 技术关注程度,以 “AI 叙事关键词与研发投入中 AI 相关占比的匹配度” 衡量叙事一致性,实证分析二者对企业营收增长率、净利润率、全要素生产率的影响,检验 AI 叙事的 “信号传递” 效应与 “资源错配” 风险,为评估企业 AI 战略真实性提供量化依据。
选题 3:AI 产业政策冲击下上市公司 AI 叙事的响应机制研究 —— 基于双重差分模型
以 2017 年《新一代人工智能发展规划》、2021 年《“十四五” 人工智能发展规划》出台为两次准自然实验,构建双重差分(DID)模型,对比政策前后 “政策覆盖区域 vs 非覆盖区域”“政策支持行业 vs 非支持行业” 上市公司的 AI 叙事强度、内容导向变化,识别政策对企业 AI 战略表达的驱动作用,为优化 AI 产业政策传导路径提供经验证据。
选题 4:管理层特征、AI 叙事策略与企业创新投入的中介效应分析
以管理层学历背景(是否为理工科)、技术任职经历、任期为解释变量,AI 叙事策略(如关键词密度、情感导向)为中介变量,企业 AI 相关研发投入为被解释变量,通过中介效应模型量化各环节的作用系数,探究管理层特征如何通过影响 AI 叙事策略,进而引导企业资源向 AI 创新领域配置,揭示企业 AI 战略落地的内部驱动路径。
选题 5:省域 AI 产业生态、上市公司 AI 叙事与技术落地效果的跨层次分析
整合省域层面的 AI 产业政策支持力度(如财政补贴、税收优惠)、AI 人才储备(高校 AI 相关专业毕业生数量)、产业集群密度等生态数据,与企业层面 AI 叙事、AI 技术应用数据结合,构建跨层次(HLM)模型,分析省域 AI 生态对企业 AI 叙事真实性(如叙事与实际 AI 产品营收占比的匹配度)及技术落地效果的调节作用,为打造 “区域生态 - 企业实践” 协同的 AI 发展环境提供决策支持。
参考文献
CNPaperData
[1]Xing X ,Zhang Z ,He W .AI technology, AI narrative, and firm value[J].Technovation,2026,149103349-103349.
会员权益
CNPaperData
CNPaperData(简称CNPD)是立足大规模数据采集、清洗、挖掘的国家高新技术企业,借鉴Compustat、WRDS等国际知名数据库及FT50期刊专业标准,打造中国特色经济管理社会科学研究型数据库。涵盖上市公司、企业、省份、地级市、县域、高校、人物等研究对象,涵盖经济、法律、金融、政策、科技、文化、健康、环保、人口等各类热门数据。顶刊标准数据,好数据助力发好刊!获取数据地址https://www.ppmandata.cn/trade/list


获取方式
CNPaperData
数据编号 2127
1.高级会员或永久会员可在官网搜索对应编号免费下载
2.非高级会员或永久会员搜索对应编号后在网页右上角通过数据元单独购买
以1533为示例:

数据会员直接下载地址:
www.ppmandata.cn

