一、研究背景与意义
在工业4.0时代,高端复杂设备向智能化、系统化快速演进,其运行安全性与可靠性成为工业生产的核心诉求。设备在长期运行中,受磨损、随机冲击、负载变化等恶劣工况影响,性能会逐渐退化,甚至引发严重安全事故。故障预测与健康管理(PHM)技术应运而生,其中设备剩余寿命(RUL)预测是PHM的核心环节,可为维修决策提供关键依据,对保障设备安全运行、降低运维成本具有重要意义。
传统基于深度学习的RUL预测方法多依赖监督学习框架,需大量含完整寿命标签的“理想数据”训练模型。然而,实际工业场景中,完整寿命周期数据稀缺,大量存在的是片段式、无完整标签的“非理想数据”。这种数据特性导致传统模型泛化性弱、预测精度低。此外,现有时序模型存在两大局限:一是对高频噪声敏感,易导致预测波动;二是基于循环神经网络(RNN)的模型采用顺序计算,效率低且难以捕捉长时程特征。因此,开发能有效利用非理想数据的高效RUL预测方法成为工业界与学术界的迫切需求。
二、主要研究内容
本文提出一种时序对比注意力网络(SCAN),通过时序对比学习与注意力机制的深度融合,实现非理想数据下的设备剩余寿命精准预测。研究内容主要包括模型架构设计、训练策略优化及多场景实验验证三部分。
(一)模型整体架构
SCAN模型采用“编码-解码”双阶段架构,核心由时序对比编码器与寿命预测注意力解码器组成。编码器负责从非理想数据中提取深层退化特征,无需依赖寿命标签;解码器基于编码特征实现RUL预测,通过注意力机制捕捉时序依赖。两者通过弹性权重共享策略实现协同优化,形成端到端的预测框架。
(二)时序对比编码器设计
编码器旨在无标签条件下提取设备退化的时序特征,由非线性编码模块与自回归整合模块构成。
非线性编码模块基于卷积神经网络(CNN)构建,包含多个卷积层、批标准化层与ReLU激活函数。其功能是将原始监测数据(如振动信号、磨损参数)映射为高维隐变量,捕捉局部退化特征。通过卷积操作的局部感受野特性,有效过滤高频噪声,增强特征的鲁棒性。
自回归整合模块基于门控循环单元(GRU)设计,整合历史隐变量序列,生成含长时程时序信息的退化特征向量。GRU通过重置门与更新门动态控制信息传递,既能保留关键历史信息,又能遗忘冗余噪声,解决传统RNN的梯度消失问题,更精准地刻画设备性能随时间的退化趋势。
编码器的训练通过“对比预测任务”实现:利用当前时刻的特征向量预测未来k步的隐变量,通过噪声对比估计损失函数优化模型。该过程强化了特征的时序自相关性,使模型无需寿命标签即可学习设备退化规律。
解码器负责将编码后的退化特征映射为RUL预测值,核心是多头自注意力机制,解决传统时序模型的效率与长依赖捕捉问题。
为弥补自注意力机制对时序顺序不敏感的缺陷,解码器首先引入位置编码,通过正弦余弦函数组合为每个时间步嵌入位置信息,确保模型理解时序先后关系。
多头自注意力机制将特征向量映射为查询(Q)、键(K)、值(V)矩阵,通过计算Q与K的相似度得到注意力分数,再与V加权求和生成输出。“多头”设计使模型能并行学习不同子空间的时序依赖,增强对复杂退化模式的建模能力。相较于RNN的顺序计算,自注意力机制支持并行处理,大幅提升计算效率,同时通过全局依赖建模,捕捉长时程退化特征。
解码器末端通过线性层整合注意力特征,输出最终RUL预测值,实现从特征到预测结果的映射。
为解决编码器与解码器的协同优化问题,本文提出基于弹性权重共享(EWC)的训练模式,分三阶段实现模型优化。
第一阶段,用非理想数据预训练编码器,通过对比预测损失函数优化参数,保存预训练模型,使其具备独立提取退化特征的能力。
第二阶段,将预训练编码器作为解码器的前置模块,引入EWC策略微调编码器参数。通过计算编码器参数的费希尔信息,衡量参数对特征提取的重要性:对关键参数施加强约束,避免其在解码器训练中被过度修改;对次要参数放松约束,使其适应预测任务。这种差异化约束保障了编码器特征提取能力的稳定性。
第三阶段,用少量含标签的理想数据训练解码器,以均方误差(MSE)为损失函数,优化解码器参数的同时,通过EWC约束同步微调编码器,实现两者的高效协同。
(五)实验验证设计
为验证方法有效性,实验选取两类典型工业设备场景:轴承与城轨列车轮对,采用公开与实际数据集开展验证。
轴承数据集包括XJTU-SY全寿命数据集与CWRU非完整寿命数据集,涵盖不同转速、负载下的外圈、内圈、保持架故障样本;轮对数据集来自5列城轨列车,含不圆度、轮缘高度等磨损参数,具有采样间隔不均、参数趋势不一致的非理想特性。
实验采用滑动窗口分段与正则化预处理数据,以均方根误差(RMSE)为评估指标,将SCAN与双向LSTM、GCU-Transformer、多尺度CNN等主流方法对比,并通过消融实验验证各模块作用。
三、关键技术解析
(一)非理想数据的特征提取技术
针对非理想数据(片段化、无标签)的特性,时序对比编码器通过“无监督特征学习+时序建模”双机制实现有效特征提取。
非线性编码模块利用CNN的局部感知能力,对原始信号进行多层卷积与激活,过滤高频噪声与无关干扰,提取局部退化特征(如振动信号中的冲击成分、磨损参数的微小变化)。批标准化层稳定训练过程,ReLU激活函数引入非线性,增强特征表达能力。
自回归整合模块通过GRU的门控机制,将局部特征按时间序列整合,形成含长时程信息的退化特征向量。例如,在轴承退化过程中,早期振动信号变化微弱,GRU可累积多时刻的微小变化,捕捉性能缓慢退化的趋势;后期信号突变时,又能快速更新状态,反映加速退化阶段的特征。
对比预测训练通过“预测未来特征”任务,迫使模型学习时序相关性:若当前特征与未来特征关联紧密(如退化趋势一致),模型预测误差小;反之误差大。这种机制使模型无需寿命标签,即可自主学习设备从健康到失效的退化规律。
(二)时序依赖建模与并行计算技术
寿命预测注意力解码器通过多头自注意力机制,解决传统时序模型的长依赖捕捉与计算效率问题。
位置编码为每个时间步嵌入独特的位置信息,使模型能区分“早期-中期-晚期”的时序顺序,例如在轮对磨损数据中,即使某两天的磨损值相同,模型也能通过位置编码识别其处于退化前期还是后期。
多头自注意力机制通过多组Q、K、V矩阵并行计算注意力,每组专注于不同的时序关系。例如,一组可能关注相邻时刻的短期变化(如每日磨损增量),另一组关注跨周/月的长期趋势(如磨损速率的季节性波动)。通过拼接多组结果,模型可全面捕捉复杂的时序依赖。
并行计算特性使注意力机制无需像RNN那样按时间步顺序处理数据,而是一次性计算所有时刻的关联,大幅提升效率。实验显示,自注意力解码器的迭代速度比GRU快45%,比LSTM快31%,尤其适用于大规模工业监测数据。
(三)编码-解码协同优化技术
弹性权重共享(EWC)策略通过差异化约束参数,实现编码器与解码器的有机协同。
费希尔信息量化了编码器参数对特征提取的重要性:例如,卷积层中负责捕捉振动信号特定频率成分的参数,对退化特征提取至关重要,其费希尔信息值高,EWC对其施加强约束,确保微调时不丢失关键特征提取能力;而某些辅助参数的费希尔信息值低,允许较大调整以适应预测任务。
这种机制平衡了“保留编码器能力”与“适配解码任务”的矛盾:编码器预训练获得的非理想数据特征提取能力被保留,解码器则通过少量标签数据学习如何将这些特征映射为RUL,实现“无监督特征学习+有监督预测”的高效结合。
四、创新点提炼
(一)理论框架创新:时序对比学习与注意力机制的深度融合
突破传统监督学习对理想数据的依赖,提出“时序对比学习+注意力机制”的联合框架,首次将时序对比学习范式应用于非理想数据的RUL预测。
时序对比学习通过无监督方式从非理想数据中挖掘退化规律,解决标签稀缺问题;注意力机制通过并行计算与全局依赖建模,提升预测效率与精度。两者结合形成“特征提取-时序建模-预测输出”的端到端解决方案,为非理想数据场景下的寿命预测提供了新范式。
(二)技术方法创新:非理想数据的无监督特征学习机制
设计时序对比编码器,实现无需寿命标签的退化特征提取。传统方法需完整寿命数据标注退化阶段,而本方法通过“预测未来特征”的自监督任务,使模型自主学习时序相关性,例如在无标签的轴承振动片段中,可自动识别“轻微磨损-中度磨损-严重磨损”的特征差异。
这种机制不仅降低了对数据标注的依赖,还能利用海量非理想数据(如设备日常运行的片段监测数据),提升模型的泛化能力,尤其适用于难以获取全寿命数据的高端设备(如轨交列车轮对)。
(三)模型设计创新:高效时序依赖建模的注意力解码器
针对传统RNN顺序计算效率低、长依赖捕捉弱的问题,设计基于多头自注意力的解码器:
1. 多头子空间并行学习,可同时捕捉短期波动与长期趋势,例如在轮对数据中,既能关注每日磨损的微小变化,又能捕捉月度磨损速率的变化规律;
2. 并行计算架构大幅提升效率,解决工业大数据实时预测的时效性需求;
3. 动态权重分配使模型聚焦关键退化阶段,例如在轴承失效前的加速退化期,注意力分数自动提高,增强对故障预警的敏感性。
(四)训练策略创新:弹性权重共享的协同优化模式
提出EWC策略,通过量化参数重要性实现编码器与解码器的协同优化。传统联合训练易导致“灾难性遗忘”(解码器训练破坏编码器已学能力),而EWC对关键参数施加保护,次要参数灵活调整,例如在轴承与轮对跨场景迁移时,编码器中通用的退化特征提取参数被保留,与设备相关的特异性参数被调整,平衡了模型的通用性与场景适配性。
五、实验结果与分析
(一)轴承剩余寿命预测实验
采用XJTU-SY与CWRU数据集,将SCAN与双向LSTM、GCU-Transformer、多尺度CNN对比,结果显示:
SCAN的平均RMSE为0.0686,较最优对比方法(GCU-Transformer)降低34%。在#1-1、#2-3等典型样本中,SCAN的预测曲线更贴近真实值,尤其在退化加速阶段,对故障的敏感性更高。
消融实验验证:含时序对比编码器的模型预测曲线振荡幅度降低40%,表明其有效过滤高频噪声;自注意力解码器的迭代速度(201.77s/次)显著快于GRU(368.46s/次)与LSTM(293.97s/次),验证了并行计算的效率优势。
(二)城轨列车轮对剩余寿命预测实验
基于5列列车的轮对磨损数据集,SCAN的平均RMSE为6.4371,除038号列车外均优于对比方法。轮对退化过程较平稳,SCAN仍能精准捕捉磨损趋势,例如在39车1号车厢2轴样本中,对轮缘厚度的缓慢退化预测误差比GCU-Transformer降低18%。
结果表明,SCAN不仅适用于轴承这类退化特征复杂的场景,也能有效处理轮对这类平稳退化过程,体现了良好的泛化能力。
(三)综合分析
两类场景的实验均表明,SCAN在非理想数据下的预测精度、稳定性与效率均优于主流方法,平均精度提升约34%。其优势源于:
1. 时序对比编码器充分利用非理想数据,提取稳健的退化特征;
2. 注意力解码器高效捕捉时序依赖,提升预测精度与速度;
3. EWC策略保障模型协同优化,增强鲁棒性。
六、结论与展望
(一)研究结论
本文提出的SCAN模型通过时序对比学习与注意力机制的融合,有效解决了非理想数据下设备剩余寿命预测的难题:
1. 时序对比编码器实现无标签特征提取,摆脱对理想数据的依赖,适用于工业场景中标签稀缺的现状;
2. 注意力解码器通过多头自注意力机制,兼顾长时程时序依赖捕捉与并行计算效率,提升预测精度与速度;
3. 弹性权重共享策略实现编码-解码协同优化,增强模型鲁棒性与泛化能力。 实验验证,SCAN在轴承与轮对场景中平均预测精度提升34%,为工业设备PHM提供了高效可靠的技术方案。
(二)未来展望
1. 扩展数据集类型:将方法应用于航空发动机、风电设备等更多工业场景,验证其普适性;
2. 优化时序对比任务:设计更贴合设备退化规律的对比策略,如引入领域知识引导特征学习;
3. 轻量化模型设计:针对边缘设备部署需求,压缩模型参数,在保持精度的同时降低计算成本;
4. 融合多源数据:结合振动、温度、压力等多传感器数据,进一步提升预测鲁棒性。
SCAN方法为非理想数据下的寿命预测提供了新思路,其核心技术可推广至工业健康管理的其他领域,推动PHM技术在实际生产中的落地应用。
参考文献:非理想数据下基于时序对比注意力模型的寿命预测方法,林天骄等,机械工程学报