
上市公司人工智能概念炒作水平度量数据(2012-2024)
获取方法见推文末
数据简介
CNPaperData
人工智能概念炒作水平度量数据是刻画上市公司人工智能信息披露真实性与机会主义行为的核心载体,其精准度直接决定对“概念炒作—大股东减持”传导机制的实证检验效果。该数据聚焦于量化企业在人工智能领域的“言”与“行”差异,通过文本分析与实证建模相结合的方式,构建能够区分“实质性转型”与“象征性炒作”的度量指标,为揭示人工智能产业热潮下的资本市场套利行为、完善信息披露监管规则提供关键数据支撑,适用于学术研究、监管研判及投资决策等多元场景。
本数据核心来源包括三大模块:一是2010-2024年沪深A股上市公司年度报告,重点提取“管理层讨论与分析(MD&A)”板块文本作为基础素材,该部分是企业披露战略方向与技术布局的核心载体;二是人工智能相关词频数据,通过Python对年报文本进行词频统计与语义分析获得,词典构建以《新一代人工智能发展规划》及平安证券等权威机构研究报告为依据;三是2012-2024年上市公司规模、规模、市场负债等相关数据,来源于各上市公司官网,用于构建控制变量与残差度量模型。
数据筛选与清洗遵循严格的标准化流程:首先以2010-2024年沪深A股所有上市公司为初始样本,剔除ST类公司、金融保险行业公司及年报文本缺失的样本;其次基于构建的人工智能词典,运用Word2vec词嵌入模型对MD&A文本进行语义匹配与词频统计,生成初始词频数据;最后构建回归模型计算残差指标,模型中纳入公司规模(Size)、资产负债率(Lev)、资产回报率(ROA)等公司特征变量,同时加入人工智能发明专利数量的对数(AI_patent)作为关键解释变量,回归残差(Hype_Residual)即代表未被公司基本面解释的异常披露部分,该指标值越大,表明公司人工智能概念炒作水平越高。在此过程中,获取面板数据10230条记录,最终形成7872条有效观测值,完整呈现2012-2024年各上市公司年度人工智能概念炒作水平的核心度量结果。
数据信息
CNPaperData
数据格式:excel
数据指标:
stkcd | year | 人工智能技术专利数量 | 证券简称 | Size | Lev |
ROA | DA | TobinQ | Growth | Separation | Hype_MDA |
stkcd_id | AI_patent | Hype_Residual |
选题方向
CNPaperData
选题1:人工智能概念炒作的时序演化与驱动因素研究(2012-2020)
基于数据集中“年份—炒作强度—企业特征”三维信息,构建“数量变化+强度波动+结构差异”的分析框架。运用时间序列分析(如ARIMA模型)、双重差分模型等方法,结合国家人工智能战略节点(如“十三五”规划出台)与技术突破事件,刻画人工智能概念炒作的整体演化趋势与阶段性特征。通过面板回归模型识别“政策激励”“市场热度”“企业盈余压力”等驱动炒作行为的核心因素,为监管部门预判炒作高发期提供实证依据。
选题2:人工智能概念炒作、信息不对称与大股东减持时机选择研究
以“炒作强度—信息不对称—减持时机”为逻辑链条,将本数据集与个股交易数据(如买卖价差、换手率)结合,构建信息不对称代理变量。运用门槛回归模型检验炒作强度对大股东减持决策的非线性影响,明确股价波动、投资者结构等门槛条件。通过事件研究法分析炒作高峰期与大股东减持公告的时间关联性,揭示大股东“借势套现”的行为规律,为完善内幕交易监管规则提供支撑。
选题3:媒体监督对人工智能概念炒作的治理效应评估
将本数据集的炒作强度指标与上市公司媒体报道数据(如报道数量、情感倾向)关联,构建“媒体关注—炒作识别—市场反应”的分析框架。运用固定效应模型实证检验媒体正面报道倾向与炒作强度的负向关系,验证媒体的风险预警作用。通过异质性分析对比不同媒体类型(财经媒体vs大众媒体)、不同企业产权性质下的治理效应差异,为发挥媒体外部监督作用提供路径参考。
选题4:人工智能概念炒作的经济后果:股价崩盘风险与投资者利益保护研究
基于数据集中的炒作指标与减持数据,结合上市公司股价数据构建股价崩盘风险代理变量(如负收益偏态系数)。运用中介效应模型检验“概念炒作—大股东减持—股价崩盘”的传导路径,量化减持行为在其中的中介效应。通过分组回归对比个人投资者与机构投资者持股比例不同的企业中,炒作后果的差异,为中小投资者风险防范与监管层投资者保护政策制定提供依据。
选题5:监管政策对人工智能概念炒作的抑制效应研究
以证监会发布的“上市公司信息披露指引”“大股东减持新规”等政策为准自然实验,运用双重差分模型评估政策对人工智能概念炒作强度的净效应。从“炒作指标下降幅度”“减持行为规范程度”“股价稳定性提升”三个维度衡量政策效果,通过异质性分析探究政策在不同行业、不同规模企业中的实施差异。结合工具变量法解决内生性问题,为完善新兴技术领域信息披露监管提供实证支撑。
参考文献
CNPaperData
[1]孙月,王新,郝晓蓓.上市公司人工智能概念炒作与大股东股份减持[J].南方经济,2025,(11):143-162.DOI:10.19592/j.cnki.scje.421284.
数据展示
CNPaperData


会员权益
CNPaperData
CNPaperData(简称CNPD)是立足大规模数据采集、清洗、挖掘的国家高新技术企业,借鉴Compustat、WRDS等国际知名数据库及FT50期刊专业标准,打造中国特色经济管理社会科学研究型数据库。涵盖上市公司、企业、省份、地级市、县域、高校、人物等研究对象,涵盖经济、法律、金融、政策、科技、文化、健康、环保、人口等各类热门数据。顶刊标准数据,好数据助力发好刊!获取数据地址https://www.ppmandata.cn/trade/list


获取方式
CNPaperData
数据编号 2176
1.永久会员可在官网搜索对应编号免费下载
2.非永久会员搜索对应编号后在网页右上角通过数据元单独购买
以1533为示例:

数据会员直接下载地址:
www.ppmandata.cn

