**一、数据集基本信息**
1. **时间跨度**:2007-2024年2. **样本规模**:涵盖5.6万条观测值,涉及5400余家中国上市公司3. **数据结构**:电子表格形式面板数据,支持计量经济学与机器学习分析4. **核心变量**:- **报刊媒体关注度**:传统媒体渠道报道量及情感极性- **网络媒体关注度**:互联网平台全量新闻数据及情感分类- **情感指标**:中性、负面、正向(基于文本分析技术量化)
**二、数据构建方法论**
1. **数据来源与清洗**:- 整合权威报刊数据库与网络新闻平台数据,经去重、标准化处理,确保跨年度、跨企业可比性。2. **情感分析技术**:- 采用自然语言处理(NLP)方法,结合机器学习模型与人工校验,对新闻文本进行情感极性分类,生成量化指标。3. **时间维度处理**:- 提供日度原始数据与年度聚合数据,支持动态趋势分析与静态截面研究。
**三、学术引用规范**本研究数据构建参考以下文献方法论:[1] 杨国超, 张李娜. 产业政策有效性研究——基于媒体报道与研发操纵的实证分析[J]. 经济学(季刊), 2021, 21(06): 2173-2194. DOI: 10.13821/j.cnki.ceq.2021.06.14[2] 沈艳, 王靖一. 媒体报道与新兴金融市场透明度——以中国P2P网络借贷市场为例[J]. 管理世界, 2021, 37(02): 35-50+4+17-19. DOI: 10.19744/j.cnki.11-1235/f.2021.0018
ACADCN数研慧通 深耕数据服务,赋能学术研究与政策实践
数据下载网址:https://www.acadcn.cn/8980.html
点击左下角「阅读原文」,查看数据广场更多数据
