基于稀疏样本场景的锂离子电池容量概率性迁移学习估计方法

 锂离子电池健康状态(State of Health, SOH)的准确评估对其安全可靠运行至关重要。然而在真实工业场景中,数据驱动模型常面临老化标记数据稀缺的挑战,这类数据在工业实践中通常难以获取。针对该问题,本文提出一种基于贝叶斯卷积神经网络(Bayesian Convolutional Neural Networks, BCNN)的概率迁移学习框架(Probabilistic Transfer Learning Framework, PTL-BCNN)。该方法的核心在于将知识从数据丰富的源域(涵盖多种电池类型)迁移至数据稀疏的目标域。其机制不仅涉及微调确定性参数,还扩展到调整模型权重的整体概率分布。该方法在提供容量预测的同时,天然具备不确定性估计功能。研究框架在牛津大学(Oxford)、CALCE两个公开数据集及自定义稀疏样本数据集上得到全面验证。所提出的PTL-BCNN模型实现了0.XX%的极低平均绝对百分比误差(MAPE),这一性能表现显著优于传统方法。值得注意的是,模型在数据稀疏条件下的优异表现验证了概率迁移学习策略的有效性,特别是其通过贝叶斯卷积神经网络实现的分布对齐机制。实验结果表明,该方法在跨电池类型容量预测任务中展现出卓越的泛化能力,同时保持了对预测结果的概率解释性。在这些数据集上分别达到71%、1.21%和0.79%的误差率,显著优于传统深度学习和迁移学习基准模型。关键的是,该模型即使仅使用部分充电段数据仍能保持稳健性能,展现出强大的实际应用价值。本研究建立了概率迁移学习范式,为跨电池类型实现可靠且数据高效的健康状态估计提供了基础性解决方案。

 

引言

全球气候变化与环境污染问题持续恶化,促使各国加速推进碳减排与替代能源开发进程[1]。锂离子电池凭借其无污染、零排放的优势,已成为清洁能源技术体系中的关键组成部分。多国通过出台政策支持措施,推动锂离子电池技术的研发与产业化进程,从而进一步激发该领域的技术创新活力[2][3]。然而,锂离子电池在运行过程中会因化学-物理耦合效应而出现性能衰退。因此,准确评估电池的健康状态(SOH)对于理解其运行寿命、性能退化程度及潜在安全隐患至关重要。在实际应用中,SOH通常以容量保持率作为表征指标。因此,本文将容量估计列为首要任务,通过将估计容量除以初始容量进行归一化处理来获取SOH。锂离子电池的老化与容量衰减主要源于锂离子沉积、SEI膜增厚和活性物质损失等物理化学过程[4][5]。最新研究强调了物理-数据融合在电池状态估计与退化预测中的价值,其通过将经验性退化模式、状态空间方程或电化学限制级约束显式嵌入神经网络来实现[6][7][8]。示例包括用于稳定退化建模与预测的物理信息神经网络,以及用于健康状态估计的物理信息混合神经网络[6][7][8]。尽管这些方法提升了外推的稳定性和可解释性,但可能需要额外假设、物理相关的状态定义或参数辨识。除滥用导致的加速老化外,常规充放电操作也会对电池健康产生累积影响[9]。电池容量的精确估计不仅能实现故障征兆的及时识别,还可通过主动维护延长电池使用寿命。
当前在线电池容量估算方法主要分为两类:基于模型的方法和数据驱动方法[10][11]。基于模型的方法通过构建等效电路模型、电化学模型或退化经验模型,依据电池材料特性、工作条件和电化学机制来预测健康状态[10][11]。
在工程实践中,配对电路模型通过建立电气元件之间的等效关系来模拟实际条件下的系统运行特性[12]。例如,在并联电池组中,此类模型可分析不同支路的电流分配模式,并用于老化评估与故障诊断。将配对电路模型与卡尔曼滤波算法相结合,可实现高精度的SOC或SOE预测[13]。Hu等基于分数阶微积分理论改进了传统二阶RC模型,建立了适用于锂离子电池的分数阶等效电路模型[14]。电化学模型通过描述锂离子输运动力学与化学反应平衡方程,精确复现电池工作特性。Li等提出的简化电化学模型在电压与温度预测方面表现优异,尤其在低温条件下显著优于传统固态扩散假设模型[15]。经验建模方法侧重于通过历史数据拟合建立退化经验公式。Ma等提出的端-云协同框架将终端经验模型与云端数据驱动模型相融合,实现了全生命周期健康状态的高精度实时追踪[16]。
基于模型的预测方法更适用于短期预测场景。毕竟,电池内部参数会随使用循环次数的增加而动态变化,而短期内的变化相对规律,使模型更容易捕捉这些特征[17]。为提高适应性,实践中常采用粒子滤波、卡尔曼滤波等技术实现参数实时更新[18]。然而,构建高精度模型需要大量专业知识或精心设计的实验数据,这些资源难以获取且成本高昂,形成显著技术壁垒。相比之下,数据驱动的锂离子电池在线能力估计技术无需复杂建模,而是直接从数据中识别规律。这种灵活性使其近年来日益突出,吸引了研究者的广泛关注[19][20]。
数据驱动的锂离子电池容量估计方法更为务实,其直接聚焦于分析电池退化数据而非探究基础电化学原理。这类方法从历史数据中识别模式,构建映射模型,并将电池状态特征与可测量信号相关联[21]。具体而言,开发数据驱动模型需要大量电池测试数据,以学习输入参数与输出响应之间的非线性关系[22]。相较于基于模型的方法,其优势显而易见:它避免了处理复杂的电化学反应过程,尤其是电化学模型中繁琐的偏微分方程[23]。然而,数据驱动方法也面临重大挑战。首先,开发模型需要获取高质量数据集,这要求精心设计实验并执行严格的训练-验证-测试流程,需耗费大量资源和时间成本。其次,模型性能对输入变量选择、模型结构设计和输出变量定义高度敏感,这些细节直接影响模型的泛化能力[24]。目前三种主流数据驱动方法分别为模糊逻辑、支持向量机和神经网络[25]。
模糊逻辑方法在建模复杂非线性系统时展现出独特优势[26]。然而该方法的有效实施高度依赖领域专家与操作人员积累的经验值。若缺乏足够的领域知识,模型的预测性能可能难以达到预期目标。为克服这一局限,研究者将神经网络的自学习能力融入模糊系统构建过程,由此形成了跨学科的"神经模糊系统"方法[27]。这类系统能够通过数据驱动方式自动生成模糊隶属度函数与规则,相较于传统方法显著降低了对先验知识的依赖[28]。Borujerd等人开发的模糊故障模式与影响分析框架已成功应用于电动汽车浸没冷却电池包的风险评估[29]。基于统计学习理论的支持向量机方法具有严谨的数学基础和结构风险最小化原理,在保证模型泛化能力方面展现出显著优势[30][31]。李等学者通过双滤波融合策略将电池容量退化状态估计与最小二乘支持向量机参数优化相结合,验证了该方法在锂离子电池剩余寿命预测中的卓越性能[32]。神经网络是模拟生物神经系统的计算模型,通过多层节点间的非线性映射实现复杂模式识别[33]。吴等学者提出一种半监督卷积神经网络方法,创新性地将局部充电数据特征提取与容量估计相结合,为电池健康管理提供了新思路[34]。
数据驱动方法的有效实施高度依赖于充分的数据支持。然而,锂离子电池的长寿命特性导致在工业环境下获取多工况全生命周期老化数据既耗时又成本高昂[35]。传统机器学习模型通常需要完整的数据标注结构和充足的样本量,但在实验室环境中实现这些条件存在实际困难——样本标注缺失、数据分布不均以及结构不完整等问题尤为突出[36]。因此,严重依赖标注数据的传统机器学习方法在实际环境中的锂离子电池状态估计性能存在局限[37]。如果能够实现锂离子电池在不同工况、实验环境和化学系统间的有效信息迁移,这将一定程度上缓解标记数据不足的问题,对于复杂环境下电池内部状态的精确估计具有重要价值[38][39]。例如,Chun等人提出了一种将描述电池物理化学行为的电化学模型知识迁移至小型倒置瓶颈网络的方法[40]。Van等人开发了基于深度学习的长短期记忆网络方法,用于估计锂离子电池健康状态和内阻[41]。
近期研究表明,不确定性感知建模在电池健康诊断与寿命预测领域具有重要价值[42]。相较于传统点估计方法,概率机器学习技术能提供更丰富的置信度信息,从而提升预测结果的可靠性[43]。然而受电池化学体系与运行工况多样性的影响,跨域泛化仍是当前面临的主要挑战。为解决该问题,研究者逐步发展出基于迁移学习与域适应的电池健康状态评估框架,以实现小样本条件下的快速模型适配[44]。尽管现有研究取得一定进展,但多数方法将迁移过程视为确定性参数调优[44]。鲜有研究能同时在分布层面实现知识迁移,并在稀疏目标域样本下完成不确定性量化[45]。为填补这一研究空白,本文提出一种基于贝叶斯卷积神经网络的概率迁移学习框架。该框架能在目标域数据稀缺条件下实现高置信度的容量估算,并提供系统化的不确定性评估,为电池健康管理提供更鲁棒的技术支撑。
本工作的具体思路是:首先采用牛津大学Cell 1-Cell 6小型软包锂电池老化数据集以及CALCE锂电池老化数据集中的CS2-35和CS2-37叠片氧化物电池数据对模型进行训练,随后选取Cell 7、Cell 8以及CS2-36和CS2-38作为测试对象。通过引入少量目标域数据(实验室条件下的电池数据)对模型进行微调,从而提升容量估计性能。与现有基于迁移学习的容量估计方法不同,本研究在迁移学习中引入概率模型,构建了PTL-BCNN模型。此外,本研究对不同电池间的迁移更符合工业场景应用需求,且不进行特征提取,直接采用原始数据建模。需要特别说明的是,模型输入中的累积充电量特指单个充电片段内的累计值,可通过库仑计数实时获取。实际应用中,仅需设定电压阈值以判定充电起始点,并从该点开始积分。以此方式构建的电压-累积电荷轨迹与容量估计值相互独立,不存在循环依赖问题,而模型输出仍为电池容量或健康状态(SOH)的估计值。
尽管已取得进展,实际电池健康状态(SOH)估算仍存在关键研究空白:(i)大多数深度学习模型仅提供点估计而未量化预测可靠性,这对安全关键型应用构成风险。(ii)现有迁移学习方法往往难以充分应对不同电池化学体系或运行条件下的显著分布偏移,尤其在目标域数据极度稀缺时。为填补这些空白,本研究在三方面作出贡献:
  • (1)
    本研究开发了一种新型数据驱动的深度学习框架PTL-BCNN,首次将概率迁移学习引入锂电池容量估计领域,以解决小样本条件下锂电池容量估计的挑战。该设计高度契合工业场景中数据量有限的实际情况。相较于传统方法,该框架实现了显著的技术突破,为跨域跨类型电池容量估计提供了创新解决方案。
  • (2)
    开发一种直接处理原始电压-容量序列的端到端模型,可消除人工特征工程环节,并提升模型在多种数据格式下的实用价值。
  • (3)
    通过涵盖小型软包电池、层状氧化物电池及大型磷酸铁锂电池的跨领域实验,本框架在数据稀缺条件下的准确性、鲁棒性与实用价值均得到严格验证。该框架即使仅使用部分充电数据仍能有效运行。