对抗型半监督光伏面板故障检测

卢芳芳,牛然,杜海舟*,杨振辰,陈菁菁

1.上海电力大学计算机科学与技术学院,上海 200090;
2.上海上电新达新能源科技有限公司,上海 200010;3.浙大城市学院,杭州 310015

在全球推进清洁低碳能源转型进程中,光伏(photovoltaic, PV)面板在清洁能源中的地位日益升高。据国际能源署(International Energy Agency,IEA)统计,截至2018年底,全球光伏发电累计装机量达480 GW,预计2030年有望达到1 721 GW。为了增加光伏面板的受光时间,大型光伏发电场往往位于没有明显的遮阳区域,如平原、丘陵或鱼塘上方,如图1所示。长时间运行在紫外线、高温或潮湿的环境中会加速光伏面板的氧化和失效(Sadok等,2016)。严重的密封剂分层会增加反射,降低辐照度,使水分在模块中下沉,加速面板氧化(Kontges等,2014)。粉尘的积累会直接降低透光率,影响光伏发电系统的效率,有时可达50%左右,甚至达到80%(Tabanjat等,2015)。虽然蜗牛纹路对发电效率没有直接影响,但看不见的裂纹,通常会降低电量输出(Dolara等,2016)。

图1 渔光互补大型光伏电站示意图

光伏产业的兴起和部署地理位置的特殊增加了其故障检测的难度。光伏面板故障检测方法大致经历了以下几个阶段。1)人工检测。这是最原始的光伏面板故障检测方法,由专门人员通过相机拍出来的光伏面板图像来判断是否存在缺陷。传统的人工检测通过目视评估单个光伏组件,成本高、错误率高且效率低下(Tatapudi等,2016),对于不同缺陷存在严重的主观意向。2)物理检测。Sawyer和Kessler(1980)利用激光扫描技术进行检测,该方法通过显示激光扫描正向转换的晶硅中电阻的连续性来判断是否存在裂纹,如果裂纹存在会出现电阻的不连续性。Tsuzukik等人(2001)提出使用声波进行故障检测,使光伏面板振动而产生声波,根据与无缺陷的太阳能电池片产生的声波进行对比分析,实现故障检测。利用物理检测,对于光伏面板特定类型故障具有较高的检测精度,但是对于其他故障无法进行有效检测。3)基于机器视觉的检测。Bastari等人(2010)提出一种对电发光图像中暗色缺陷区域进行纹理分析从而自动分类出有缺陷和无缺陷的电池片的方法。Quater等人(2014)率先提出无人机巡检系统可以对大型光伏电站进行无损巡检。但是故障诊断效果无法达到使用要求,后续很多学者进一步研究故障诊断方法。Li等人(2017)先对采集图像计算高斯函数一阶导数提取特征,再通过特征匹配的方法进行缺陷检测。该方法在一定程度上验证了基于图像处理的故障分析算法的有效性,但是对于采集图像的质量要求较高。然而,由于风效应等多种原因导致获取的图像分辨率较低,该方法的性能会明显下降。此外,传统的模式识别算法往往无法实现对获得的航拍图像进行复杂程度可接受的故障特征提取。随着深度卷积神经网络性能的提高,将人工智能学习算法引入到智能巡逻系统中(杨挺 等,2019)可提高系统的健壮性和可靠性(周念成 等,2019)。Li等人(2018)提出一种基于深度卷积神经网络(convolutional neural network,CNN)的航拍光伏组件图像缺陷智能诊断方法,利用CNN进行多种深度特征和状态分类。与传统方法相比,可以灵活可靠地解决光伏组件图像质量低、易失真的问题。

由于缺乏大量的负例样本,CNN等监督学习在异常检测问题上不适用。Schlegl等人(2017)提出基于正样例的无监督异常检测方法(anomaly generative adversarial network,AnoGAN),通过不断迭代优化,在隐空间寻找某个点,该点生成的图像与测试图像最为接近,如果两者的差距大于某个值,就可判断测试图像为异常图像。由于需要迭代优化,AnoGAN算法势必会耗费大量时间。Zhao等人(2018)提出了使用生成对抗网络(generative adversarial network, GAN)和自编码器来重建缺陷图像,再用局部二值模式(local binary pattern, LBP)提取图像局部对比度来检测缺陷。但是对于复杂的背景,Zhao等人(2018)的方法无法较好地重建和修复缺陷图像来进行缺陷异常检测。

为了解决深度学习中缺少大量负样例无法训练监督学习型异常检测模型的问题,本文采用将对抗式自动编码器(adversarial auto-encoders)(Makhzani等,2015)与深度卷积生成对抗网络(deep convolutional GAN)(Goodfellow等,2014)相结合的半监督异常检测模型(Akcay等,2018),通过应用梯度中心化和Smooth L1损失函数,使模型具有更好的准确性和鲁棒性。算法步骤如下:首先构建半监督异常检测模型,其次将正常的光伏面板图像作为正样例原图输入到半监督异常检测模型,进行模型训练。接着将待测光伏面板图像输入到训练好的半监督异常检测模型,生成器网络生成该待测图像对应的重建图像。然后计算待测原图图像与其重建图像隐空间向量之间的误差。最后通过判断该误差是否大于自适应阈值,推断该待测光伏面板是否存在异常。该半监督异常检测模型的训练样本中只需包含大量无需标签的正样例。相较于监督学习,该模型无需标签、无需大量负样例,解决了缺少负样例无法训练异常检测模型的问题。

1.1 半监督异常检测模型

图2 半监督异常检测模型架构图

1.2 生成器网络

1.2.1 编码—解码器(GE1-D)子网络

本文利用形似蝴蝶结的自动编码器对光伏面板图像进行重建,具体过程如下:

1)生成器编码器GE1。生成器网络G读取输入光伏面板图像x,传递给生成器编码器网络GE1,x经过GE1的卷积层、批量标准化层及带泄露线性整流激活函数层多次向下缩小尺度后,压缩成向量z=GE1(x),即生成器编码器GE1的隐空间向量z。理论上可以将z假定为包含x最佳表示的最小维度的向量。

图3 正样例和负样例数据分布图

1.2.2 编码器(GE2)子网络

1.3 判别器网络

1.4 模型训练中损失函数

为了将上述假设数学化,定义了对抗损失、上下文损失和编码器损失3个损失函数,并将其结合以建立模型的目标函数。每个损失函数都对单个子网络进行优化。同时,将GANomaly网络使用的L1损失和L2损失组合改为Smooth L1损失,具体计算为

(1)

由式(1)可知,当|t|<1时,Smooth L1损失就是L2损失,由于L2损失会对误差进行平方,因此会得到更小的损失,有利于模型收敛。而当t较大的时,Smooth L1损失是L1损失的平移。相比于L2损失,L1损失对离群点、异常值不敏感,可控制梯度的量级使训练时不容易爆炸。Smooth L1损失其实是L2损失与L1损失的结合,同时具有L2损失和L1损失的优点。

1.4.1 对抗损失

(2)

式中,Px为正样例光伏面板数据分布;
φ(x)表示输入图像x在判别器DE中间层的特征输出;
G(x)为输入图像x在生成器的重建图;E表示期望。

1.4.2 上下文损失

(3)

式中,Px为正样例光伏面板数据分布;
G(x)为输入图像x在生成器的重建图。

1.4.3 编码器损失

(4)

至此为止,可定义光伏面板故障检测模型的目标损失函数L,其函数式为

L=Ladv+λLcon+Lenc

(5)

式中,λ为调整生成图像锐度的参数。

1.5 梯度中心化

图4 梯度中心化示意图

1.5.1 GC公式

(6)

1.5.2 GC的性质

从理论上讲,GC可以提高模型的泛化能力。

图5 GC的几何解释

2)输出空间正则化。引入GC后,一个输入特征的恒定强度变化会引起一个输出激活的变化,这个变化与当前权重向量无关。如果初始权重向量的均值趋近于0,那么输出激活对输入特征的干扰强度变化不敏感,所以输出特征空间对于训练样例的变化具有更强的稳定性。

本文采用基于对抗训练的半监督光伏面板故障检测模型,通过应用梯度中心化(GC)对权重空间和输出特征空间正则化来防止过拟合,并使用Smooth L1损失函数,使模型具有更好的准确性和鲁棒性。

2.1 模型训练

2.1.1 数据集的来源及处理

数据集采用无人机实地拍摄的浙江某光伏电站的光伏面板图像,原始图像大小为3 840×2 048像素。通过观察发现,光伏面板图像的颜色和图案形状是单一且规则的,将一幅大图分割成若干幅小图,不仅对模型无负面影响,而且可以加快模型训练的迭代速度。将一幅原始图像分割成32×32像素的图像,如图6(a)所示,通过分割原始正常光伏面板图像,得到32 000幅32×32像素的正样例分割图。训练集从总样本中随机抽取80%,共25 600幅。剩余的20%为测试集,共6 400幅。因为在测试阶段需要负样例来测试模型的异常检测效果,所以从拍摄的异常光伏面板图像中切割缺陷图,得到3 200幅32×32像素的负样例图像,如图6(b)所示。

图6 光伏面板分割图

2.1.2 训练细节及参数

生成对抗网络中生成器和判别器的搭建是模型构建的关键,生成器用到了编码器和解码器,判别器是类编码器结构。

1)编码器。由于图像尺寸为32×32像素,彩色图像为三通道,所以编码器的输入尺寸为32×32×3,采用4×4的卷积核,前3层卷积采用边缘填充0个数为1,卷积核步长为2,并在卷积层后加批量标准化层(Ioffe和Szegedy,2015)和LeakyReLU激活函数层(Xu等,2015)。最后一层卷积采用无填充无步长卷积后,直接输出为1×1×100的隐空间向量。

2)解码器。编码器结构是对称的,第1层转置卷积无填充和步长,后3层转置卷积填充为1、步长为2。前3层转置卷积层后,加批量标准化层和ReLU激活函数层,输出为32×32×3的重建图。

2.2 模型验证

2.2.1 模型评估

模型训练完成后,需要对模型进行评估,以保证以最小代价、高效准确地完成光伏面板异常检测任务。主要从判别器中间特征和生成器的隐空间向量两个角度对模型进行评估。

1)对于判别器中间特征Dfeature,在训练过程中获得其中间特征Dfeature,将4×4×256数组变为 1维数组4 096。利用t-SNE(t-distributed stochastic neighbor embedding)以主成分分析的方式分别降维成3维和2维数组,绘制测试集中的正负样例的散点,如图7所示。可以看出,光伏面板正负样例的散点在2维和3维空间中都有明显的决策边界,可以较好地划分正负样例(即正常和异常光伏面板)。

图7 t-SNE降维后的Dfeature散点分布图

2)对于生成器的隐空间向量z,从3个方面进行评估:

图8 隐空间向量z联合核密度估计分布图

图9 隐空间向量Lz分布图

(3)原图与生成器的重建图。上述都是以数据分析图的方式展示出正负样例,从解码器中还可以获得重建图。如图10所示,在训练过程中,随着迭代次数的增加,原图与重建图之间的差异逐渐缩小。由此可见,经过训练后的生成器网络可较好地重建输入图像。

图10 训练阶段的原图与重建图

2.2.2 模型检测

(7)

(8)

(9)

图11 检测结果图

2.2.3 性能度量指标

为了验证本文方法的有效性,与GANomaly(Akcay等2018)、Zhao等人(2018)、AnoGAN和Pre-trained VGG16(Visual Geometry Group 16-layer network)方法进行对比。考虑到VGG16的最小输入图像是48 × 48像素,所以需将图像由32 × 32像素放大为48 × 48像素。由于VGG16的训练集中需要负样例,所以在训练集中分别加入10幅、100幅和200幅负样例光伏面板图像进行训练,对比不同数量的负样本对模型预测准确率的影响。

采用ROC曲线(receiver operating characteristic curve)、Precision分数、Recall分数以及 F1分数作为模型的性能度量指标。图12是各算法的ROC曲线对比图,结果表明,本文算法在光伏面板故障检测中表现出最优性能,本文方法的AUC(area under curve)值为0.935,分别比GANomaly、Zhao等人(2018)、AnoGAN和Pre-trained VGG16(100)方法高0.033、0.044、0.052和0.12。

图12 不同方法的ROC曲线对比

表1是评估的Precision分数、Recall分数以及F1分数。Pre-trained VGG16随着负样例(异常光伏面板图像)的个数增加,性能逐渐增加。在没有负样例的情况下,本文方法总体上与其他先进方法具有很强的竞争力,并实现了更高的召回率和F1分数。

表1 模型性能度量表

相较于监督学习,本文提出的半监督异常检测模型无需标签、无需大量负样例,解决了缺少负样例无法训练异常检测模型的问题。相关实验结果证明,本文提出的基于生成对抗网络的半监督异常检测模型大幅提高了光伏面板故障检测的准确率。

2.2.4 消融实验

图13(a)展示了在50轮训练中使用梯度中心化GC与未使用GC的损失对比。原始网络只使用批量归一化(batch normalization,BN)作为优化。可以看出,与批量归一化BN相比,BN+GC的训练损失减少的更快,GC可以进一步加快训练速度,表明梯度中心化GC可以在加快训练速度同时增加泛化性能。

图13(b)是Smooth L1损失与手动组合L2损失和L1损失的对比。使用Smooth L1损失明显比手动组合L2损失和L1损失下降很多,表明Smooth L1损失可以使模型具有更好的准确性。

从图13可以看出,本文提出的光伏面板故障检测模型通过应用梯度中心化GC,在加快模型训练速度的同时,增加了模型的泛化性能,使用Smooth L1作为损失函数,进一步提升了光伏面板故障检测的准确性和鲁棒性,可代替人工巡检,实现光伏面板故障检测的自动化。

图13 损失对比图

本文结合实际需求,设计了基于生成对抗网络的光伏面板故障检测系统。在缺少大量负样例(异常光伏面板)数据的情况下,运用生成对抗网络提取图像特征逼近正样例(正常光伏面板)图像数据分布,使计算机可以生成与正样例相似度极高的重建图像。最后通过计算待测原图图像与其重建图像之间的误差来判断该待测光伏面板是否存在异常。该异常检测模型的移植性很强,只要有大量的正样例,训练完成模型后就可以进行二分类,即光伏面板的故障检测,解决了缺少负样例无法训练异常检测模型的问题。同时,该异常检测模型通过应用梯度中心化GC,在加快模型训练速度的同时,增加了模型的泛化性能,并通过使用Smooth L1损失函数,进一步提升了光伏面板故障检测的准确性和鲁棒性,可代替人工巡检实现光伏面板故障检测的自动化。在未来工作中,可在上述系统的基础上尝试收集多个种类的异常特征图(如灰尘遮蔽、蜗牛纹和生锈等),利用CNN的分类能力,在检测到异常区域后再对异常特征做进一步分类。

猜你喜欢 编码器面板卷积 基于全卷积神经网络的猪背膘厚快速准确测定农业工程学报(2022年12期)2022-09-09基于ResNet18特征编码器的水稻病虫害图像描述生成农业工程学报(2022年12期)2022-09-09WV3650M/WH3650M 绝对值旋转编码器传感器世界(2022年4期)2022-08-05WDGP36J / WDGA36J编码器Wachendorff自动化有限公司传感器世界(2022年3期)2022-05-24一种基于卷积神经网络的地磁基准图构建方法北京航空航天大学学报(2021年9期)2021-11-02基于3D-Winograd的快速卷积算法设计及FPGA实现北京航空航天大学学报(2021年9期)2021-11-02一种并行不对称空洞卷积模块①计算机系统应用(2021年9期)2021-10-11基于Beaglebone Black 的绝对式编码器接口电路设计*数字技术与应用(2021年1期)2021-03-24第 一 季度AMOLED面板出货量京东方全球第二中国计算机报(2019年28期)2019-09-04面板厂商向大尺寸转移2015年LCD电视面板增长目标仅为3%消费电子(2014年12期)2014-12-20

推荐访问:对抗 面板 故障