
上市公司数据风险暴露变量数据(2010-2024)
免费获取方法见推文末
数据简介
CNPaperData
数据风险暴露变量作为量化企业数据安全管理水平的核心指标,是衡量上市公司在数字化转型进程中数据治理能力与风险防控实力的关键标尺。随着《中华人民共和国数据安全法》《个人信息保护法》等法规的密集出台,数据风险已成为影响企业持续经营的重要因素,该变量通过文本挖掘技术将企业数据风险相关的定性信息转化为可量化的定量指标,有效填补“数据风险识别—风险程度度量—治理效果评估”分析链条中的数据空白,为监管部门完善数据安全监管政策、高校开展数据治理研究、投资者评估企业运营风险提供权威可靠的数据支撑。
本数据核心来源为2010-2024年中国A股上市公司年度报告中“管理层讨论与分析(MD&A)”部分的文本信息。数据构建过程严格遵循“基础关键词界定—语义拓展—精准匹配—清洗校验”的标准化流程:首先参考《工业和信息化领域数据安全风险信息报送与共享工作指引(2021)》(试行)及和国家互联网信息办公室印发的《国家网络安全事件应急预案(2017)》中对数据风险和网络风险的定义和具体分类,考虑到企业应用数字技术类型的差异还包括了各种数字技术的具体风险,界定了数据泄露、数据窜改、数据滥用、违规传输四大类基础关键词;随后基于Word2vec模型对基础关键词进行语义拓展,形成包含基础词与拓展词的完整关键词词典;再通过在MD&A文本中抓取相关内容并统计词频,最终以词频值作为数据风险暴露变量的核心度量,完整呈现2010-2024年各上市公司数据风险暴露的时序特征。
数据信息
CNPaperData
数据格式:excel
数据字段:
股票代码 | 年份 | kw_sum | 总词数 |
注:剩余“数据风险暴露”关键词已整合到txt文档中(如下图)

数据展示
CNPaperData


参考文献
cNPaperData
[1]陆瑶,施函青,周欣怡.中国企业数字技术风险暴露对企业价值的影响——来自大语言模型的文本分析证据[J].经济研究,2025,60(02):73-89.
选题方向
CNPaperData
选题1:数据风险暴露的时序演化与行业差异研究(2010-2024)
基于数据集“年份—企业—行业—风险词频”四维信息,构建“风险演化趋势+行业差异特征+政策驱动效应”的三维分析框架。运用时间序列分解(HP滤波)、核密度估计及技术图谱(CiteSpace)方法,系统刻画2010-2024年我国上市公司数据风险暴露的整体演化规律(如《数据安全法》出台前后的风险关注差异)及行业分化特征(如金融、互联网等数据密集型行业与传统制造业的风险水平差距)。结合面板数据回归模型,实证检验数据风险暴露对企业价值(托宾Q值)、融资成本、经营绩效的影响效应,识别不同行业中数据风险“从暴露到损失”的传导路径差异,为企业精准开展数据风险防控提供实证依据。
选题2:数据治理政策对企业风险暴露的抑制效应研究
以《数据安全法》(2021年实施)、《个人信息保护法》(2021年实施)等政策出台为准自然实验,结合本数据集与上市公司数据治理投入数据(如信息安全费用、数据合规团队规模),构建“政策冲击—治理投入—风险暴露”的分析框架。运用双重差分倾向得分匹配(PSM-DID)方法,评估数据治理政策对上市公司数据风险暴露水平的净抑制效应。通过异质性分析,对比政策在国有与非国有企业、大型与中小型企业中的效应差异,结合中介效应模型检验“合规意识提升”“技术投入增加”“流程优化完善”三大作用路径,为进一步完善数据治理政策体系、提升政策实施效能提供数据支撑。
选题3:数字经济背景下数据风险暴露与企业创新平衡研究
将本数据集与上市公司研发投入数据、专利产出数据(尤其是数字技术相关专利)关联,构建“数据风险暴露—创新投入—创新产出”的分析框架。运用门槛回归模型,探究数据风险暴露对企业创新的“双重效应”——适度风险暴露推动企业加大数据安全创新投入,过度风险暴露抑制整体创新活力的门槛特征,识别风险暴露的“最优区间”。结合LDA主题模型挖掘企业年度报告中创新相关文本信息,实证检验数据安全技术创新对“风险防控—创新提升”平衡关系的调节作用,为企业在数字经济中实现“风险可控下的创新突破”提供策略参考。
选题4:数据风险暴露对投资者决策的影响机制研究
聚焦资本市场视角,将本数据集与上市公司股票收益率、换手率、分析师关注度等市场数据关联,构建“数据风险暴露—信息披露质量—投资者决策”的分析框架。运用事件研究法,以企业数据风险相关公告发布为事件点,分析数据风险暴露水平对短期股票超额收益率的影响;结合多元回归模型,实证检验数据风险暴露通过“信息不对称程度”“风险溢价水平”两条路径影响投资者决策的机制,为投资者完善风险定价模型、监管部门强化市场信息披露监管提供实证依据。
会员权益
CNPaperData
CNPaperData(简称CNPD)是立足大规模数据采集、清洗、挖掘的国家高新技术企业,借鉴Compustat、WRDS等国际知名数据库及FT50期刊专业标准,打造中国特色经济管理社会科学研究型数据库。涵盖上市公司、企业、省份、地级市、县域、高校、人物等研究对象,涵盖经济、法律、金融、政策、科技、文化、健康、环保、人口等各类热门数据。顶刊标准数据,好数据助力发好刊!获取数据地址https://www.ppmandata.cn/trade/list


获取方式
CNPaperData
数据编号 2172
1.点击公众号右上角三个点-设为星标
2.文章底部右下角点击“在看”图标
3.皮皮侠公众号后台发送数据编号,按照提示添加客服微信(回复时间:周一至周五14:30-18:00),发送保留2小时截图(要有10个点赞哦)
数据会员直接下载地址:
www.ppmandata.cn

