? 第一部分:什么是固定效应?一个比喻
想象你要研究“工作效率”:
企业固定效应 ? 好比是个人的天生特质(如自律性、学习能力),这些特质在短期内不会因跳槽而改变。
行业固定效应 ? 好比是不同公司的工作环境(如科技公司的弹性工时、制造业的流水线节奏),是同一行业内员工共享的外部条件。
一般情况下,如果我们知道“张三在科技公司”,那么“张三”这个人和“科技公司”这个环境信息就是高度重叠的——我们无法区分他的高效是源于个人能力,还是公司氛围。这就是所谓的完全多重共线性。
⚠️ 第二部分:为什么通常不能一起控制?
在面板数据中,如果一家企业从未更换行业,那么它的行业信息是完全包含在企业标识符内的。简单来说:
企业ID = 固定不变的“个人身份证”
行业ID = 从企业ID推导出的“户籍信息”
在数学上,行业虚拟变量会成为企业虚拟变量的线性组合,导致模型无法估计。这时,你只能二选一。
? 第三部分:特例出现!当企业“中途改行”
如果样本中有企业在研究期间更换了行业,情况就完全不同了!此时:
行业对企业而言,变成一个“随时间变化”的变量
? 举个例子:
假设我们追踪一家公司“星辰科技”:
企业固定效应:始终捕捉“星辰科技”自身不变的特质。
行业固定效应:2022年前后,该公司所处的行业环境发生突变。
此时,两个效应在数学上不再共线,可以同时放入模型!
标准答案如下:在实证研究中,同时控制企业固定效应和行业固定效应,主要是为了更准确地识别变量间的因果关系,避免因遗漏重要特征而导致估计偏误。企业固定效应控制了各企业自身不随时间变化的特质(如管理风格、初始资源等),行业固定效应则控制了行业层面共同的、不随时间变化的特征(如技术壁垒、政策环境等)。本文样本中存在部分企业在研究期间内更换行业的情况,若简单剔除这些样本,可能导致选择性偏误,即剩余样本不再具有代表性,进而影响结论的普遍性。因此,同时控制两类固定效应,可以在保留全样本的基础上,更干净地分离出企业自身变动与行业变动对研究对象的影响,提高估计的可信度。此外,作者在稳健性检验中还将对更换行业的企业进行专门分析,以进一步验证结论的稳健性。
? 第四部分:这样做的好处与场景
✅ 主要优势:
控制更干净 → 同时吸收企业个体异质性与行业共性冲击。
避免样本选择偏差 → 无需删除“改行”企业,提升结论外推性。
适用于重要研究话题 → 如企业战略转型、跨行业经营、行业政策评估等。
? 常用场景:
上市公司业务重组、多元化战略
企业跨行业并购后的绩效分析
行业分类标准调整(如证监会行业代码变更)
? 最后的小提示
在论文中,如果使用此方法,建议在稳健性检验中单独分析“行业变更企业样本”。
可考虑加入“行业变更虚拟变量”或“企业-行业匹配年限”作为进一步控制。
记得在附录或脚注中说明样本中行业变更企业的比例与性质。
? 总结一下:
当企业身份不变、但行业身份可变时,你就能同时控制企业与行业固定效应——这是面板数据中一个既巧妙又实用的建模技巧。如果你们在研究中遇到过类似的“改行”企业,或者有更好的处理方法,欢迎在评论区交流! ?
#计量经济学 #实证研究 #固定效应 #面板数据 #经济学研究 #数据科学 #科研技巧 #学术干货
【数据免费共享】本人整理了诸多公共资料包含55个干货,内容多多!详情请添加微信:GGboy-Stata或stata123stata,即可获取海量资源!
| 资料类别 | 核心数据/资源清单 |
|---|---|
| ? 宏观经济与区域数据 | |
| ? 环境、能源与地理 | |
| ? 企业微观与上市公司 | |
| ? 贸易、跨国与专题数据 | |
| ? 人口与健康 | |
| ?️ 研究工具与代码 |

