欢迎光临HAWKER英国霍克蓄电池(中国)营销总部
服务热线:15313702523

首页 > 新闻中心

霍克锂电池基于分布度量学习的锂离子电池健康状态预测通用基础模型

随着电动汽车和锂离子电池的快速普及,电池健康状态(State of Health)的精确评估变得愈发关键。然而,电池类型与运行工况的差异常导致数据集间存在分布偏差,且单一数据集内标记数据稀缺,使得SOH预测面临特殊挑战。针对这些问题,本文提出一种基于多源域数据训练的少样本电池SOH估计通用基础模型。所提出的方法采用最大均值差异(Maximum Mean Discrepancy)来最小化不同域之间的特征分布差距,并通过将ResNet-Transformer混合架构与Kolmogorov-Arnold网络相结合以增强非线性特征表征能力。通过利用来自多性向领域的电压、电流和时间数据,该模型能有效学习电池退化的广义知识,并将其迁移至目标域以实现稳健的健康状态(SOH)预测。实验结果表明,所提出的广义基础模型展现出卓越的泛化性能,即使在标注数据有限的情况下仍能保持较高的预测精度。这表明其在电动汽车电池健康管理和寿命预测等实际应用场景中具有显著潜力。

引言

近年来,随着温室效应加剧与石油基燃料的过度消耗,电动汽车(EVs)因其显著的环境效益[1][2]已逐渐成为更为主流的交通工具。锂离子电池(LIBs)作为电动汽车最常用的储能技术,凭借稳定性好、安全性高、能量密度大等优势得到广泛应用。考虑到交通运输领域对储能系统的严苛安全要求,电池健康状态(SOH)成为关键参数。当循环过程中SOH下降过多时,电池内部化学成分与结构特征通常会出现明显偏离初始状态的状况。此类老化现象往往导致稳定性与安全性降低,因此锂离子电池通常在SOH衰减至80%左右时退役。然而在实际应用中,电动汽车往往配备不同类型的电池,而针对特定电池型号的高质量标记数据通常稀缺,这使得有效训练复杂的深度学习模型变得困难。为确保电动汽车用锂离子电池达到高标准安全性能,准确预警健康状态(SOH)衰减并建立可靠的SOH预测模型显得尤为重要[3][4]。
在SOH预测领域,既往研究系统地将SOH估算方法划分为基于模型与数据驱动两类,并阐明其各自优势与局限[5]。同时,锂离子电池复杂且多模态的退化机制使得SOH估算成为极具挑战性的任务[6]。基于模型的方法通常依赖于电化学模型或等效电路模型(ECMs)。例如,Plett采用扩展卡尔曼滤波器(EKF)实现电池参数与SOH的联合估算,在不同工况下均表现出鲁棒性能[7]。类似地,Hu等学者通过结合等效电路模型与无迹卡尔曼滤波器(UKF)构建了在线SOH估算框架,其平均预测误差始终保持在2%以内,凸显了基于模型方法的高精度与可解释性优势[8]。然而,此类方法通常需要复杂的建模与参数识别过程,这可能会限制其在真实工况下的适用性[9][10]。
相比之下,数据驱动方法近年来在多个领域获得了越来越多的关注[11], [12], [13], [14], [15], [16], [17]。Paradis等学者利用LSTM网络进行健康状态(SOH)估计[18]。Greenbank团队提出了一种自动特征选择方法作为高斯回归的输入[19]。Zhang等(2023)综述了用于SOH预测的机器学习和深度学习方法,研究表明支持向量机(SVM)、梯度提升模型(CatBoost)以及双向长短期记忆网络(Bi-LSTM)等算法在复杂条件下均可实现优异的预测精度[20]。Hou团队(2021)基于真实电动汽车行驶数据提出了一种新型数据驱动的老化估计方法,在SOH预测中实现了低于1.5%的均方根误差[21]。最新研究中,Lu等(2023年)提出了一种深度学习框架,该框架能在缺乏目标标签的情况下实现精确的健康状态(SOH)估算,展现了数据驱动策略在实际应用与实时场景中的优势[22]。其他研究则尝试采用不同网络架构,如CNN-LSTM[23]或多模态方法[24],或通过预测局部节点而非完整SOH曲线来实现该目标[25]。这些方法无需依赖详细的电化学与结构建模,即可从充放电循环数据中学习复杂的非线性映射关系。实验表明,当训练数据集足够庞大且具有代表性时,此类方法尤其展现出优异的预测性能[3]。
尽管上述方法已实现较高的预测精度,但它们均依赖于足量的训练样本。当训练样本数量有限时,模型仅能学习整体退化趋势,而无法准确匹配特定电池的实际退化曲线,最终导致预测结果出现偏差。与此同时,不同领域的电池数据往往经历差异显著的充放电循环过程,且不同电池的化学成分也存在极大差异,从而导致数据分布呈现显著的域间差异。如图1所示,来自不同数据集的电池健康状态(SOH)退化曲线表现出明显区别,这使得直接利用多个异构数据集的循环数据同时训练模型变得极为困难。
为应对这些挑战,多位研究者提出了潜在解决方案[26]。部分研究聚焦于特征提取与特征融合,以提升有限样本下的模型效能。例如,Zhang等人通过文献综述指出,多域特征融合结合梯度提升模型在小样本场景中取得了显著效果,但仍依赖于足够代表性的特征[20]。Zhang团队提出一种基于自监督Informer的方法,该方法在少样本条件下表现优异[27]。此外,Jameel等学者的研究...本研究聚焦于数据高效方法,采用支持向量回归(SVR)模型并验证了精简特征集的有效性[28]。另一研究方向则探索迁移学习,如Qin等提出的可迁移多阶段循环差异学习模型,显著降低了跨细胞预测中的差异性[29]。基于CORAL的域偏移简单处理方法亦被证实有效[30]。Yang等则利用域对抗神经网络(DANN)解决了域适应问题[31]。此外,还存在其他方法可将模型从源域适配至目标域,例如采用最大均值差异(MMD)(Gretton等人)[32]、自注意力机制(Chen等人)[33],或利用领域泛化技术(Liu等人)[34]以及多领域迁移学习-少样本学习(MDTL-FSL)(Dong等人)[35]。然而,当可获取的目标域样本极为有限时,此类方法仍存在不稳定性[36][37]。值得关注的是,少样本学习方法(Zhang等人)与结合模型驱动和数据驱动的混合框架虽被广泛研究,但往往伴随高计算成本或需要较强的先验知识[38]。
电池健康状态(SOH)文献中现有的大多数迁移/适应研究主要集中于单源到单目标的设定,或需要适量标注目标数据进行微调。针对实际SOH部署仍存在两大关键空白:如何有效利用多个异构源域(多源迁移)来辅助仅具有极少量标注样本集的目标域,以及如何保持模型对域内异质性的鲁棒性,即——即使在单一数据集内部,由于微观制造与使用差异,单个细胞也可能以不同方式老化。近期提出的多阶段与阶段感知迁移方法虽展现出潜力,但通常假设目标域标注更完备或依赖特定领域处理步骤[29][39]。针对这些局限性,本文提出一种源域辅助训练方法,通过利用通用基础模型进一步降低在目标域样本稀缺时由个体差异引起的偏差。该解决方案方法如图2所示。本文的主要贡献可概括如下:
  • 1.
    我们提出了一种用于电池健康状态(SOH)预测的通用基础模型,其设计为一个可复用且与领域无关的退化表征主干网络,而非针对特定任务的估计器。通过联合利用多个异构电池数据集,该模型能够学习可迁移的退化特征,这些特征可在不同电池类型和运行条件间共享。
  • 2.
    为支持构建领域不变表征,本文引入统一的多源联合训练策略。该方法摒弃单一数据集聚焦,采用最大均值差异(MMD)损失函数对齐多源域与目标域间的特征分布,从而在少样本目标场景下实现有效的知识迁移。
  • 3.
    本研究采用大规模数据集进行训练,首次引入广义基础模型的概念用于电池健康状态(SOH)预测。结果表明,该方法对不同类型和工况条件下的电池均具备较强的泛化能力,为电动汽车实际电池健康估算提供了新思路。