通過改進自動編碼器提升數據不足條件下的變壓器故障診斷精度
變壓器發生故障的情況較少,使得基于機器學習的變壓器故障診斷方法存在數據不足的問題。為此,智能電網教育部重點實驗室(天津大學)、瑞典皇家理工學院電氣工程與計算機科學學院、國網冀北電力有限公司檢修分公司的研究人員葛磊蛟、廖文龍、王煜森、宋麗可,在2021年《電工技術學報》增刊1上撰文,提出一種基于改進自動編碼器(IAE)的變壓器故障數據增強方法。
首先,針對傳統自動編碼器生成的數據有限和缺乏多樣性的問題,提出改進的變壓器故障數據生成策略。其次,考慮到傳統卷積神經網絡的池化操作會丟失大量特征信息,構建改進的卷積神經網絡(ICNN)作為故障診斷的分類器。最后,通過實際數據驗證了所提方法的有效性和適應性。仿真結果表明,相對于隨機過采樣算法、合成少數類過采樣技術及自動編碼器等傳統的數據增強方法,IAE能同時兼顧數據的分布和多樣性特征,生成的變壓器故障數據對分類器的性能提升效果最好。和傳統分類器相比,ICNN在數據增強前、后都具有更高的故障診斷精度。
變壓器是一種利用電磁感應原理來實現電壓變換的裝置,它在輸電側和配電側都起著至關重要的作用。一旦變壓器發生故障,會嚴重影響電力系統的正常運行,造成負荷大面積失電等嚴重事故,并帶來一定的經濟損失。因此,開展變壓器故障診斷研究具有重要的理論意義和工程實際應用價值。
目前,大部分的大型電力變壓器屬于油浸式變壓器,變壓器油中的溶解氣體含量是故障診斷的重要依據。基于分析溶解氣體含量發展而來的傳統故障診斷方法主要包括三比值法、支持向量機(Support Vector Machine, SVM)法、貝葉斯網絡法、多層感知機(Multi-Layer Perceptron, MLP)法及輕梯度提升機(Light Gradient Boosting Machine, LightGBM)法等。這些傳統方法的原理簡單、對于數據量要求比較小,但它們存在共性的問題,即特征能力不足,故障診斷的精度有限。
近年來,深度學習技術在自然語言處理、計算機視覺和視頻分析等多個領域都取得了優異的成績,這為提升變壓器故障診斷精度帶來了新的契機。基于深度學習技術的變壓器故障診斷方法主要包括卷積神經網絡(Convolutional Neural Network, CNN)法和深度信念網絡法,它們不僅具有強大的特征提取能力,還能映射溶解氣體和故障類型之間復雜的非線性關系,相較于傳統方法具有更高的診斷精度。
訓練集中包含充足且分布均勻的故障樣本,是保障深度神經網絡具有較強泛化能力的關鍵條件。然而,變壓器發生各類故障的頻率差異較大,可能存在信息記錄不全或者數據缺失等問題,導致難以滿足深度神經網絡對于故障樣本數據量的要求。因此,如何在數據不足的條件下對變壓器故障數據進行增強是亟待解決的問題。
一些專家學者已經對此展開了初步的研究,有學者分別利用隨機過采樣(Randdom Over-Sampling, ROS)算法和合成少數類過采樣技術(Synthetic Minority Over-sampling Technique, SMOTE)讓每個正樣本和附近的多個樣本隨機結合,極大地增加了原有樣本的個數,但無法兼顧故障數據的整體分布特征和多樣性的問題。
為了解決這些問題,有學者構建了條件生成對抗網絡(Conditional Generative Adversarial Network, CGAN),以服從高斯分布的隨機噪聲作為生成器的輸入,產生指定類型的變壓器故障樣本數據,在一定程度上提升了故障診斷的性能,但存在訓練過程不穩定,容易出現梯度消失及調參難度大等問題。
作為備受歡迎的新型深度生成模型,自動編碼器(Auto-Encoder, AE)是一種利用輸出向量來重構輸入特征的前饋神經網絡。目前,AE在機器翻譯、數據降維、表征學習及圖像修復等領域具有較好的應用效果,但在變壓器故障數據增強中的應用仍處于初級階段。理論上,AE可以利用具有強大學習能力的編碼器有效地提取溶解氣體的潛在特征,并通過解碼器反向重構溶解氣體數據,更可為變壓器故障診斷提供數據保障。
然而,已有的自動編碼器的變體,如變分自動編碼器,雖然可以應用于數據生成,但它需要將海量的故障樣本用于訓練模型,這有違數據不足的先決條件。相對而言,傳統AE對數據量的要求不高,但它生成的數據和輸入數據高度相似,不僅缺少多樣性,而且生成的樣本個數有限。如何根據變壓器的溶解氣體特征,設計一種能夠兼顧變壓器故障數據多樣性和樣本個數的自動編碼器結構,有待進一步的研究。
針對上述的問題,智能電網教育部重點實驗室(天津大學)等單位的科研人員在數據不足條件下提出了一種基于改進自動編碼器的變壓器故障數據增強方法。
圖1 所提方法的計算流程
首先,在分析傳統AE的基礎上,提出了IAE用于變壓器故障數據的增強。其次,針對傳統CNN的池化操作會丟失大量特征信息的問題,構建了ICNN作為變壓器故障診斷的分類器。再次,以溶解氣體數據作為模型的輸入特征,并對變壓器狀態進行編碼,提出了相關的指標用于評估模型的性能。最后,通過實際數據進行仿真得出以下結論:
1)IAE的訓練過程平穩、收斂速度快,可以很好地擬合原始數據的分布,并生成和原始數據特征相似的數據。相對于ROS、SMOTE和AE等傳統的數據增強方法,IAE在考慮數據分布的同時還能兼顧數據的多樣性,生成的變壓器故障數據對分類器的精度提升效果最好。
2)和MLP、SVM、LightGBM以及CNN等分類器相比,ICNN在數據增強前、后都具有更高的故障診斷精度。CNN的池化操作會讓其損失部分特征信息,限制了模型的診斷精度。ICNN通過調節卷積核尺寸來替代傳統CNN的池化層可以提升診斷性能。
3)相對于原始訓練樣本,經過IAE進行數據增強后,MLP、SVM、LightGBM、CNN和ICNN等分類器的診斷精度都有著不同程度的提升,說明利用IAE來生成變壓器故障樣本數據不受限于某個分類器,具有一定的適應性。
在本項目中,科研人員對深度學習技術在變壓器故障數據增強中的應用進行了初步的研究。后續收集到更多的變壓器故障樣本數據,可以進一步探究當訓練集樣本個數是否越多,IAE產生的數據對于分類器性能提升效果越好。
以上研究成果發表在2021年《電工技術學報》增刊1,論文標題為“數據不足條件下基于改進自動編碼器的變壓器故障數據增強方法”,作者為葛磊蛟、廖文龍 等。
了解更多關于編碼器知識,請關注西安德伍拓自動化傳動系統有限公司網站。公司專業技術團隊為您免費提供
旋轉編碼器的選型、安裝、調試、保養等技術指導服務,盡量避免企業因為編碼器技術人員的短缺帶來的損失,采取“線上+線下”服務的服務形式,幫助企業解決技術難題。