

本文版权归原作者所有,未经授权,不得转载


工业设备智能故障检测中类别非平衡和标签缺失问题研究
Research on Intelligent Fault Detection for Industrial Equipment with Class Imbalance and Label Unknown
作者:钱敏
指导教师:李彦夫
培养院系:工业工程系
学科:管理科学与工程
读博感言:往前看,别回头。
对设备进行实时准确的故障检测是提高工业系统可靠性与安全性的关键。但由于工业设备可靠性高,早期故障难以识别,很难获得大量准确标记的故障样本用于模型训练。论文基于集成学习、积极无标签学习等理论基础,从样本重采样、故障特征提取、分类模型训练等多阶段开展研究。为解决实际工程应用中的故障样本稀少、标注不完全等问题提供新的解决思路和方法。
论文针对类别非平衡和故障标签缺失这两个痛点衍生出的三个问题,设计了五种故障检测方法。具体来说,针对故障样本稀少导致的类别非平衡问题,提出了基于图半监督学习的过采样方法和基于自适应欠采样的集成学习方法;针对早期故障标记困难导致的标签缺失问题,提出了基于积极无标签学习的混合深度网络方法,并进一步考虑样本标记偏差问题进行了改进;当同时存在类别非平衡和标签缺失问题时,我们设计了一种基于深度非平衡分离网络的故障检测方法。

自适应欠采样集成学习框架

混合深度网络方法结构示意图
1、提出了一种基于图半监督学习的生成样本筛选方法,在缓解类别非平衡的同时尽量避免破坏原数据分布和改变边界信息,提高生成样本总体质量。针对高度非平衡问题,设计了一种基于深度强化学习的自适应欠采样集成学习框架,考虑训练过程不同阶段集成分类器的实时性能,通过关键参数的动态决策实现采样器的自动调整,最大化集成效果。
2、考虑到早期故障的标记困难,设计了一种基于积极无标签学习的混合深度网络方法。仅需要标注训练集中的部分正常样本即可完成训练,所提出的聚类层能够降低故障类和正常类之间的类重叠,提高数据可分性。并进一步考虑到实际工程应用中完全随机标记假设无法满足,设计了一种间接故障检测方法。
3、考虑到类别非平衡和标签缺失这两类问题可能在训练集中同时出现,设计了一种基于深度非平衡分离网络的故障检测方法,能够充分利用PU训练集少量标签信息来提取敏感故障特征和学习分类边界。所提框架高度灵活,能够适用于实际工程应用中的多种使用场景。
共发表SCI、EI论文9篇,其中在IEEE Transaction系列上发表一作论文5篇,Google Scholar引用量200+,授权发明专利4项。
何为优博微展?
优博微展是清华大学应届优秀博士毕业生论文精华的呈现,由清华大学研究生院联合各院系收集并发布,旨在对我校博士研究生的阶段性学术成果和在校时期科研成绩进行简要、集中展示。
作者、图片:钱敏
组稿、校阅:楚若冰
统筹:研究生院培养办
编辑与设计:研究生院综合办
