大模型時代下智能故障診斷如何發(fā)展,清華綜述《大規(guī)模基礎(chǔ)模型在預(yù)測和健康管理(PHM)中的應(yīng)用》
源自:北京科技大學(xué)機械工程學(xué)院
作者:陳哲涵 黎學(xué)臻
1.引言
圖1。從AI-1.0到AI-2.0,深度學(xué)習(xí)的研究范式發(fā)生了巨大的變化。
在過去的兩年中,大規(guī)?;A(chǔ)模型(LSF-Models)[56,57],如GPT-3[58,59]和ChatGPT[60,61],已經(jīng)展示了具有流暢文本對話的高度智能的自然語言理解能力。大規(guī)模的多模態(tài)文本和圖像理解模型,如gtp -4 [62], DALL-E-2[63],以及segment anything model (SAM)[64],進一步展示了該研究范式在多模態(tài)對話、圖像生成和分割方面的非凡成就。基于人工智能的深度模型已從單模態(tài)、單任務(wù)、有限數(shù)據(jù)研究范式(AI-1.0)迅速發(fā)展到多模態(tài)、多任務(wù)、海量數(shù)據(jù)、超大模型研究范式(AI-2.0)。圖1清楚地顯示了這兩種研究范式的差異。AI-2.0的核心是具有跨領(lǐng)域知識的LSF-Model,可以理解數(shù)據(jù)的一般概念,實現(xiàn)Zero-shot對不可見數(shù)據(jù)進行泛化,無需額外訓(xùn)練[64]。該模型的實現(xiàn)主要基于以下三個關(guān)鍵部分:有效特征提取模型[65-68]、無監(jiān)督表示學(xué)習(xí)算法[69-71]和多模態(tài)融合算法[72,73]。此外,廣泛的未標(biāo)記或標(biāo)記的多模態(tài)數(shù)據(jù)是這種開發(fā)的先決條件。然而,在PHM領(lǐng)域如何構(gòu)建具有跨領(lǐng)域知識的LSF-Model仍然是未知的,對于如何開發(fā)適合PHM領(lǐng)域的特征提取、表示學(xué)習(xí)和多模態(tài)融合算法也缺乏足夠的研究和分析。此外,PHM領(lǐng)域如何應(yīng)對人工智能領(lǐng)域的這一巨大變化還沒有定論,缺乏系統(tǒng)的文獻綜述,以及未來研究方向的路線圖。為了填補這一空白,本文首先系統(tǒng)介紹了lsf模型的關(guān)鍵組成部分和研究進展。然后,系統(tǒng)地回答了如何建立適用于PHM領(lǐng)域的有效lsf模型。我們也闡述了這一研究范式將面臨的挑戰(zhàn)和未來發(fā)展的路線圖。
具體來說,本次調(diào)查的主要工作總結(jié)如下:
1)本文對lsf模型的三個關(guān)鍵組成部分及其各自的研究進展進行了綜述。
2)結(jié)合PHM領(lǐng)域的實際情況,系統(tǒng)地分析并回答了如何建立適用于工業(yè)PHM應(yīng)用的有效lsf模型。
3)本文討論了LSF-Model在PHM領(lǐng)域的研究路線圖,并詳細分析了該研究范式面臨的挑戰(zhàn)和解決方案。
2.大規(guī)?;A(chǔ)模型的關(guān)鍵組成部分
介紹了一些基本知識:Transformer架構(gòu)的提出為基礎(chǔ)模型提供了強大的特征提取能力[66,68]。自監(jiān)督學(xué)習(xí)促進了基礎(chǔ)模型強大的無監(jiān)督特征表示能力的發(fā)展[69,70]。此外,多模態(tài)融合算法使基礎(chǔ)模型具備了跨模態(tài)交互的能力[72]。
3.大型地基模型研究進展
對LSF-Models在NLP和CV領(lǐng)域的發(fā)展進行了廣泛的概述和論述
4.PHM的大型基礎(chǔ)模型
雖然深度學(xué)習(xí)模型在PHM中取得了顯著的成績,但由于它們通常是針對特定領(lǐng)域和任務(wù)進行訓(xùn)練和優(yōu)化的,因此其有效性有限。因此,在復(fù)雜和開放的行業(yè)場景中,深度學(xué)習(xí)模型可能會表現(xiàn)出一些局限性,如局限性的泛化、多任務(wù)和認知能力?,F(xiàn)有的模型可能在已知的情景下表現(xiàn)良好,但要有效地推廣到未知的情景是有挑戰(zhàn)性的[192-194]。這種零鏡頭泛化能力的缺乏使得它難以應(yīng)對實際工業(yè)場景的復(fù)雜性。此外,現(xiàn)有的深度模型通常專注于單個任務(wù)。然而,工業(yè)設(shè)備有數(shù)百個核心部件,都需要健康監(jiān)測和故障預(yù)測。為每個核心組件開發(fā)相應(yīng)的深度模型是不現(xiàn)實的。最后,現(xiàn)有的深度模型認知能力有限,難以理解工業(yè)數(shù)據(jù)的本質(zhì)和一般概念,往往會產(chǎn)生難以理解和錯誤的結(jié)果。
lsf模型的研究為我們提供了一種有效的解決方案,可以成功地解決上述問題。如第3節(jié)所述,現(xiàn)有的lsf模型,如ChatGPT[62]和SAM[64],表現(xiàn)出了出色的數(shù)據(jù)理解能力、零次泛化能力和強大的多任務(wù)能力。此外,它還具有一定的高級認知能力來解決一些推理任務(wù)。因此,LSF-Models的成功標(biāo)志著人工智能領(lǐng)域的研究范式從單模態(tài)、單任務(wù)和有限數(shù)據(jù)研究范式(AI 1.0)向多模態(tài)、多任務(wù)、海量數(shù)據(jù)和超大模型研究范式(AI 2.0)的轉(zhuǎn)變。然而,如何在PHM領(lǐng)域發(fā)展LSF-Model還沒有定論。為了促進LSF-Model在PHM領(lǐng)域的研究和應(yīng)用,本節(jié)從四個方面對如何構(gòu)建適用于PHM應(yīng)用的LSF-Model進行了說明和分析。
4.1 PHM的大規(guī)模數(shù)據(jù)集
4.1.1研究現(xiàn)狀
與NLP和CV領(lǐng)域不同,PHM領(lǐng)域的數(shù)據(jù)一般是由各種傳感器采集的高頻或低頻時間序列數(shù)據(jù),如振動信號[195]、聲音信號[196]、電流電壓[197]、溫度[198]、壓力[199]等。此外,一些應(yīng)用嘗試使用視頻和圖像數(shù)據(jù)來實現(xiàn)設(shè)備健康監(jiān)測,如跟蹤缺陷監(jiān)測[200,201],缺陷產(chǎn)品識別[202,203],設(shè)備裂縫監(jiān)測[204,205]。目前,PHM社區(qū)已經(jīng)開源了幾十個不同規(guī)模和領(lǐng)域的數(shù)據(jù)集,如軸承故障數(shù)據(jù)集[206]、軸承退化數(shù)據(jù)集[207]、齒輪箱故障數(shù)據(jù)集[208]、飛機發(fā)動機退化數(shù)據(jù)集[209]、三相電機故障數(shù)據(jù)集[210]、工業(yè)生產(chǎn)監(jiān)測數(shù)據(jù)集[211]、風(fēng)力發(fā)電機監(jiān)測數(shù)據(jù)集[212],等等。CWRU軸承數(shù)據(jù)集[195]是最經(jīng)典的故障診斷數(shù)據(jù)集,僅包含有限的工作條件和4種不同的健康類別,每一種故障類別僅包含3種故障程度。Wang等[207]發(fā)布的XJTU-SY軸承數(shù)據(jù)集僅包含15個軸承從健康到故障的退化數(shù)據(jù)。Lessmeier等[213]發(fā)表的數(shù)據(jù)集包括來自32個軸承的振動信號數(shù)據(jù)和來自驅(qū)動電機的電流數(shù)據(jù)。Wang等[211]發(fā)布的晶圓缺陷識別數(shù)據(jù)集包含38,000個晶圓數(shù)據(jù)樣本,包括38種不同類型的混合缺陷類別。Chao等人[209]開放了渦扇發(fā)動機退化模擬數(shù)據(jù)集,該數(shù)據(jù)集包含8組128臺機組的數(shù)據(jù),有7種失效模式??梢钥闯觯@些數(shù)據(jù)集的規(guī)模非常小,滿足LSF-Models訓(xùn)練和優(yōu)化的需求具有挑戰(zhàn)性?;谶@些數(shù)據(jù)集訓(xùn)練的深度模型難以理解PHM數(shù)據(jù)的性質(zhì)和規(guī)律,難以具備多任務(wù)和零拍泛化能力。因此,在PHM領(lǐng)域構(gòu)建大規(guī)模數(shù)據(jù)集是實現(xiàn)lsf模型的第一步。
工業(yè)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)(IoT)技術(shù)的出現(xiàn)[214]使得現(xiàn)代工業(yè)生產(chǎn)設(shè)備和各種復(fù)雜的機械設(shè)備上安裝了大量傳感器,以便實時監(jiān)測系統(tǒng)的各種物理量,以便及時發(fā)現(xiàn)異常。因此,大多數(shù)大型企業(yè)都收集了大量的行業(yè)數(shù)據(jù),并建立了相應(yīng)的數(shù)據(jù)中心。例如,中國城市軌道交通列車擁有數(shù)十年的運營經(jīng)驗和實際運營數(shù)據(jù)的積累,形成了龐大而全面的數(shù)據(jù)集[215]?,F(xiàn)在,一輛列車可以實時監(jiān)測和記錄與子系統(tǒng)、部件和外部環(huán)境相關(guān)的數(shù)百個變量,如軸承油溫、變速箱噪音以及各種系統(tǒng)的電流和電壓。類似地,軌道檢測車可以獲得密集的參數(shù),如軌道軌距、水平和高度的擴展距離。這些海量的數(shù)據(jù)集提供了列車實時狀態(tài)、退化過程以及列車子系統(tǒng)和部件之間相互依賴的寶貴信息。它們共同為建立lsf模型奠定了基礎(chǔ)。
盡管這些工業(yè)數(shù)據(jù)在構(gòu)建lsf模型以解決各種PHM任務(wù)方面具有顯著的潛力,但仍需要進一步探索。工業(yè)數(shù)據(jù)可以包括各種傳感器數(shù)據(jù),如信號、圖像和視頻,以及大量的文本信息,包括維修工作單和報告。因此,建立lsf模型來有效地利用多傳感器數(shù)據(jù)提出了新的挑戰(zhàn)。此外,對于LSF-Model的構(gòu)建,單個數(shù)據(jù)中心的數(shù)據(jù)規(guī)模可能會受到限制。例如,GPT 3.0[58]的訓(xùn)練數(shù)據(jù)超過4100億個令牌,而GPT 3.5[60]的訓(xùn)練數(shù)據(jù)可能顯著超過GPT 3.0。為了解決這一問題,跨中心或區(qū)域聯(lián)合深度模型訓(xùn)練和優(yōu)化是一種可行的解決方案。但是,這些行業(yè)數(shù)據(jù)通常會涉及商業(yè)秘密,所以政府和企業(yè)建立了嚴格的數(shù)據(jù)保護制度,極大地限制了行業(yè)數(shù)據(jù)的共享和使用。
(模型的能力和潛力已經(jīng)被證明,數(shù)據(jù)量有限也是亟需解決的問題,如何設(shè)計訓(xùn)練任務(wù),例如整合已有的數(shù)據(jù)集,并開展有效的數(shù)據(jù)學(xué)習(xí)和模態(tài)對齊;工業(yè)界的大模型構(gòu)建,有些方面是可以去借鑒的,關(guān)鍵部分還是要有新的理解和突破。)
4.1.2解決方案
雖然LSF-Models在NLP和CV中都有很好的結(jié)果,但PHM領(lǐng)域的數(shù)據(jù)與前兩者有明顯的不同。因此,有必要根據(jù)PHM領(lǐng)域特有的數(shù)據(jù)特性,對lsf模型的關(guān)鍵部件進行優(yōu)化和改進,以在該領(lǐng)域取得可觀的性能。這需要探索新的特征提取模型,自我監(jiān)督表示學(xué)習(xí)算法,以及適合PHM領(lǐng)域的多模態(tài)融合算法。此外,在工業(yè)領(lǐng)域,學(xué)術(shù)界建立了最前沿的算法設(shè)計和數(shù)據(jù)分析能力,而工業(yè)界則積累了大規(guī)模的工業(yè)監(jiān)測數(shù)據(jù)。因此,建立校企聯(lián)合研究中心,充分發(fā)揮各自優(yōu)勢,將有效應(yīng)對現(xiàn)有挑戰(zhàn),顯著促進LSF-Model在PHM領(lǐng)域的研究。
此外,LSF-Models的實現(xiàn)需要訪問大規(guī)模數(shù)據(jù)。在利用這些數(shù)據(jù)的同時確保數(shù)據(jù)隱私保護是另一個值得注意的關(guān)鍵問題。與NLP和CV領(lǐng)域不同的是,相關(guān)數(shù)據(jù)可以從互聯(lián)網(wǎng)上大規(guī)模獲取,而PHM數(shù)據(jù)集則掌握在設(shè)備運營商手中,往往非常珍貴,可能包含商業(yè)秘密。此外,隨著對數(shù)據(jù)隱私和安全的日益關(guān)注,監(jiān)管機構(gòu)也出臺了新的法律來規(guī)范數(shù)據(jù)的管理和使用[216]。因此,有必要開發(fā)符合嚴格隱私保護法規(guī)的解決方案,并解決數(shù)據(jù)碎片化和隔離的挑戰(zhàn)。聯(lián)邦學(xué)習(xí)[217,218]是一種具有隱私保護和安全加密的分布式機器學(xué)習(xí)框架,是一種可能的解決方案。它允許分散的參與者在機器學(xué)習(xí)模型訓(xùn)練上進行協(xié)作,而不會將私人數(shù)據(jù)透露給其他參與者。目前,PHM領(lǐng)域已經(jīng)提出了基于聯(lián)邦學(xué)習(xí)的數(shù)據(jù)隱私保護解決方案[219-221]。圖6為基于聯(lián)合學(xué)習(xí)的多車多中心數(shù)據(jù)隱私安全保護架構(gòu)。然而,現(xiàn)有的大多數(shù)聯(lián)邦學(xué)習(xí)算法還沒有應(yīng)用到真實的工業(yè)大規(guī)模數(shù)據(jù)分析中。因此,推動大規(guī)模的工業(yè)數(shù)據(jù)分析和LSF-Models的建立,需要學(xué)術(shù)界和工業(yè)界的共同努力。
(大佬們估計已經(jīng)悄悄著手了,組里做模型安全的博士就靠著聯(lián)邦學(xué)習(xí)的研究畢業(yè)了)
圖6。多車多中心數(shù)據(jù)隱私安全保護聯(lián)合學(xué)習(xí)框架流程圖(1-發(fā)送加密梯度 2-安全聚合)。
4.2 PHM Transformer
Transformer[75]是一種深度學(xué)習(xí)模型,專門用于建模長距離特征相關(guān)性,允許建模信號中任意兩個位置之間的相關(guān)性,而不考慮特征之間的實際物理距離。其高效的長期依賴建模能力使其非常適合分析和處理PHM領(lǐng)域的各種傳感器數(shù)據(jù)。因此,Transformer在各種PHM應(yīng)用中得到了廣泛的應(yīng)用[42,222 -224],取得了令人印象深刻的性能結(jié)果。Jin等人[224]提出了一種基于時間序列的Transformer模型,與傳統(tǒng)的CNN和RNN模型相比,該模型具有更強的故障識別能力。Wang等人[42]提出了一種基于Transformer的高速列車輪轂?zāi)p預(yù)測模型,該模型利用Transformer和CNN的優(yōu)勢,對全局和局部信息進行有效編碼。Fang等[222]對Transformer模型進行了優(yōu)化,提出了一種基于Transformer的輕量級故障診斷框架,在降低計算復(fù)雜度的同時實現(xiàn)了高效、準(zhǔn)確的故障診斷。盡管在PHM領(lǐng)域取得了顯著的成功,Transformer模型仍然有一些需要解決的局限性。首先,Transformer模型主要是為處理靜態(tài)輸入數(shù)據(jù)(如文本)而設(shè)計的,雖然它可以通過位置編碼合并時序信息,但它并沒有直接考慮時序信息[225]。因此,Transformer在處理工業(yè)時間序列數(shù)據(jù)時,很難充分了解數(shù)據(jù)的連續(xù)時間關(guān)系。其次,Transformer模型可能不能很好地處理有噪聲的工業(yè)數(shù)據(jù)。在真實的工業(yè)生產(chǎn)過程中,包含噪音的工業(yè)數(shù)據(jù)是常見的,Transformer模型可能不夠健壯,無法處理這些噪音數(shù)據(jù)。第三,如前所述,工業(yè)數(shù)據(jù)往往包含多種類型的傳感器數(shù)據(jù)和大量的文本信息,這對設(shè)計提出了新的挑戰(zhàn)。Transformer模型通常不能同時處理大量傳感器數(shù)據(jù)。
4.2.2解決方案
由于Transformer模型的實現(xiàn)基于自注意機制,因此它在考慮時間序列數(shù)據(jù)之間的時間關(guān)系方面面臨挑戰(zhàn)。自我注意機制局限于只考慮序列中位置之間的關(guān)系,缺乏在時間軸上捕捉相對時間關(guān)系的能力。為了解決這個問題,可以采用幾種方法。首先,可以將時間編碼機制集成到Transformer模型中,以方便直接學(xué)習(xí)時間關(guān)系。其次,可以研究一種有效的時間注意機制來捕獲Transformer體系結(jié)構(gòu)中數(shù)據(jù)之間的時間依賴關(guān)系。最后,基于Transformer的時間序列模型,如時間序列Transformer[226],可以考慮傳感器數(shù)據(jù)的特性進行探索。這些模型需要專門設(shè)計來處理時間序列數(shù)據(jù),整合全局時間序列信息,并改進時間相關(guān)性的建模。
在工業(yè)領(lǐng)域收集的數(shù)據(jù)往往包含復(fù)雜的噪音,不像NLP和CV領(lǐng)域的數(shù)據(jù)通常是干凈的。因此,現(xiàn)有的大多數(shù)深度學(xué)習(xí)模型都不能很好地處理時間序列信號上的噪聲或無關(guān)信息的干擾。在傳統(tǒng)的信號分析中,人們提出了各種方法去噪,提取有價值的信息。這些方法包括時域和頻域濾波[227,228],快速傅里葉變換(FFT)[229,230],小波變換[231,232]等。因此,Transformer與信號分析技術(shù)的深度融合是解決這一問題的一個很有前途的方法。例如,Rao等人[233]提出了一種基于fft的全局濾波層來取代Transformer的自注意機制,從而獲得了更好的性能。同樣,Wang et al.[41]通過將小波變換與深度學(xué)習(xí)模型進行融合,在噪聲環(huán)境中獲得了最佳性能,本文提出的多層小波模型如圖7所示。然而,如何賦予Transformer更先進、更有效的信號分析能力,還有待進一步研究。
最后,為了同時處理多傳感器數(shù)據(jù)和工業(yè)文本數(shù)據(jù),有必要重新設(shè)計Transformer架構(gòu)并創(chuàng)建多模態(tài)Transformer[234-236]。多模態(tài)Transformer的主要思想是將不同類型的數(shù)據(jù)(如文本、圖像和音頻)嵌入到Transformer模型中,從而在處理多模態(tài)數(shù)據(jù)時支持端到端建模。有幾種解決方案是可行的,包括基于Transformer的多模態(tài)嵌入、基于Transformer的跨模態(tài)預(yù)訓(xùn)練和基于Transformer的多模態(tài)注意。多模態(tài)嵌入編碼并將各種傳感器數(shù)據(jù)嵌入到Transformer體系結(jié)構(gòu)中,以同時表示多傳感器數(shù)據(jù)。交叉模態(tài)預(yù)訓(xùn)練利用各種傳感器數(shù)據(jù)對Transformer進行預(yù)訓(xùn)練,從不同的數(shù)據(jù)類型中學(xué)習(xí)有價值的信息,然后應(yīng)用于下游的多傳感器數(shù)據(jù)處理。多模態(tài)注意是利用多傳感器信息實現(xiàn)自適應(yīng)融合的常用方法注意力權(quán)重。
(在我看來對于大模型的實現(xiàn),模型的架構(gòu)是其次的,數(shù)據(jù)量和模型參數(shù)量的積累和提升才是最關(guān)鍵的)0
圖七。多層小波模型的基本結(jié)構(gòu),深度融合了小波變換和CNN的優(yōu)點,使其具有較強的抗噪能力(圖像來自[41])。
4.3 PHM的自監(jiān)督學(xué)習(xí)
4.3.1研究現(xiàn)狀
如前所述,在工業(yè)生產(chǎn)和設(shè)備運行過程中,需要采集大量的傳感器監(jiān)測數(shù)據(jù)。然而,學(xué)術(shù)界和業(yè)界都在努力充分利用這大量的運營數(shù)據(jù)來構(gòu)建PHM模型。主要的挑戰(zhàn)是標(biāo)簽數(shù)據(jù)的不可用性、噪聲的存在和大數(shù)據(jù)量。因此,現(xiàn)有的深度模型很難從這些數(shù)據(jù)中有效提取有用信息。自監(jiān)督學(xué)習(xí)[70,124]可以從大量無標(biāo)記數(shù)據(jù)中自動學(xué)習(xí)有價值的特征表示,已成為構(gòu)建PHM基礎(chǔ)模型的核心算法。目前,自監(jiān)督學(xué)習(xí)已經(jīng)在PHM領(lǐng)域進行了研究和應(yīng)用[237-241]。例如,Zhang等人[239]開發(fā)了一種融合先驗知識的自監(jiān)督算法,并在小標(biāo)記數(shù)據(jù)集上展示了良好的故障識別能力。Wang et al.[49]提出了一種新的自我監(jiān)督表征訓(xùn)練的借口任務(wù),該任務(wù)能有效地從無標(biāo)記信號中提取有價值的信息。同時,Ding等人[237]開發(fā)了一種基于對比學(xué)習(xí)的訓(xùn)練前算法,該算法在識別軸承早期故障方面表現(xiàn)良好。
雖然自我監(jiān)督學(xué)習(xí)在PHM領(lǐng)域顯示出了巨大的潛力,但它需要設(shè)計有效的借口任務(wù)來學(xué)習(xí)有用的特征表示。當(dāng)前的托詞任務(wù)可能不能充分捕捉故障和健康相關(guān)的信息,特別是在復(fù)雜的工業(yè)系統(tǒng)中。此外,自監(jiān)督學(xué)習(xí)模型可能對噪聲很敏感,在數(shù)據(jù)質(zhì)量較差的情況下,會影響學(xué)習(xí)到的特征表示,從而降低故障診斷性能和健康管理。此外,現(xiàn)有的自我監(jiān)督學(xué)習(xí)算法難以處理包含多個傳感器模式的真實工業(yè)數(shù)據(jù)。因此,開發(fā)有效的、能夠處理此類工業(yè)數(shù)據(jù)的自監(jiān)督表示學(xué)習(xí)算法是一個關(guān)鍵的研究領(lǐng)域。
4.3.2解決方案
lsf模型研究的基本目的是實現(xiàn)少鏡頭或零鏡頭的泛化。因此,在設(shè)計模型和算法時需要解決的首要問題是:什么樣的模型和算法可以實現(xiàn)零次泛化[64]?類似于自動編碼器的架構(gòu)[53],特別是那些與信號重構(gòu)、信號補全、信號去噪等相關(guān)的架構(gòu),構(gòu)成了一個有效的解決方案。然而,它們的特征表示過程缺乏與健康信息的直接關(guān)聯(lián)。因此,在制定托辭任務(wù)時,必須確保與設(shè)備健康的最大相關(guān)性。
在PHM領(lǐng)域中,頻域比時域更能有效地反映設(shè)備的故障和健康狀態(tài)信息。此外,從頻域水平分析可以更好地處理噪聲干擾,提高模型噪聲的魯棒性。因此,在構(gòu)建自我監(jiān)督學(xué)習(xí)任務(wù)時,必須綜合考慮信號頻域信息。對此有幾種可能的解決方案。1)在自監(jiān)督學(xué)習(xí)算法中同時利用時域和頻域特征,可以融合成統(tǒng)一的特征表示。該方法以原始時域數(shù)據(jù)和相應(yīng)的頻域數(shù)據(jù)為輸入,訓(xùn)練多模態(tài)自監(jiān)督學(xué)習(xí)模型,學(xué)習(xí)時域和頻域特征。2)開發(fā)深度頻率空間學(xué)習(xí)模型,如基于小波的CNN[41,46,47],可以直接學(xué)習(xí)頻率特征,捕捉數(shù)據(jù)中的頻率信息。3)構(gòu)建依賴于信號頻域數(shù)據(jù)的托詞任務(wù),如頻域信息重構(gòu)。4)建立基于信號時頻一致性的對比學(xué)習(xí)算法[242],對時間序列數(shù)據(jù)進行有效的自我監(jiān)督訓(xùn)練。5)多傳感器數(shù)據(jù)的相關(guān)性可以用來構(gòu)造借口任務(wù)。例如,可以利用部分傳感器數(shù)據(jù)預(yù)測其他傳感器數(shù)據(jù)的值,從而誘導(dǎo)模型學(xué)習(xí)多傳感器之間的直接相互依賴關(guān)系,便于工業(yè)多傳感器數(shù)據(jù)的特征表示學(xué)習(xí)。最后,不同的自監(jiān)督學(xué)習(xí)算法可以表示數(shù)據(jù)的不同特征信息。結(jié)合多種自我監(jiān)督學(xué)習(xí)算法可以幫助模型學(xué)習(xí)更多樣化的特征表示集,提高下游任務(wù)的性能。因此,在實踐中采用各種算法對模型進行全面的預(yù)訓(xùn)練是一種很好的解決方案。
4.4 PHM的多模態(tài)融合
4.4.1研究現(xiàn)狀
在PHM領(lǐng)域中,主要的數(shù)據(jù)源是由各種傳感器獲得的離散時間序列數(shù)據(jù),包括振動信號、電流電壓、溫度和壓力。此外,某些應(yīng)用程序試圖利用視頻和圖像數(shù)據(jù)進行設(shè)備健康監(jiān)測,如跟蹤缺陷監(jiān)測、缺陷產(chǎn)品識別和設(shè)備裂縫監(jiān)測。工業(yè)領(lǐng)域的數(shù)據(jù),可能包含許多傳感器數(shù)據(jù)類型(例如,信號、圖像、視頻等)和大量的文本信息(例如,維修工作單、維修報告等)。因此,相對于NLP和CV領(lǐng)域,PHM領(lǐng)域更注重多傳感器數(shù)據(jù)的信息融合,從而更全面地了解設(shè)備的健康狀態(tài)。目前已有多篇論文對多傳感器信息的融合進行了研究[243-248]。例如,Yang等[243]提出了一種基于峰度加權(quán)算法和金字塔原理的多傳感器多尺度融合模型,在軸承健康識別方面表現(xiàn)出了較強的性能。Long等[245]利用Hilbert變換和FFT從多傳感器信號中提取有價值的頻率信息,建立了基于注意的故障識別模型。Kumar等[248]同時考慮了振動和聲音信號,利用小波變換作為特征提取器,隨后將機器學(xué)習(xí)方法應(yīng)用于故障診斷。
然而,現(xiàn)有的數(shù)據(jù)集大多只包含1 ~ 3個傳感器的數(shù)據(jù),遠遠不能滿足實際工業(yè)應(yīng)用的需要。此外,隨著傳感器數(shù)量的增加,不同傳感器產(chǎn)生的數(shù)據(jù)可能具有不同的分布、尺度和信噪比。適當(dāng)?shù)念A(yù)處理方法和融合策略對PHM模型的性能至關(guān)重要。此外,在工業(yè)領(lǐng)域,多模態(tài)融合算法必須考慮各種工業(yè)傳感器信息(如信號、圖像、文本等)的融合。然而,現(xiàn)有研究缺乏足夠的解決方案和優(yōu)化策略來應(yīng)對這一挑戰(zhàn)。
4.4.2解決方案
PHM中有效的多傳感器數(shù)據(jù)融合需要在數(shù)據(jù)融合、特征融合和模型融合方面進行綜合研究。以下解決方案可以增強模型的多傳感器融合能力:
1)探索新的方法,將來自多個傳感器或源的數(shù)據(jù)集成為一個統(tǒng)一的數(shù)據(jù)表示,考慮到每個傳感器的獨特特征。這種數(shù)據(jù)融合方法可以提高模型在處理不同模態(tài)數(shù)據(jù)時的性能和穩(wěn)定性。
2)針對特定的任務(wù)和數(shù)據(jù)特征構(gòu)建適當(dāng)?shù)淖⒁鈾C制,實現(xiàn)高效的多傳感器關(guān)聯(lián)建模,融合傳感器有價值的特征。這種機制使模型能夠捕獲傳感器之間的相關(guān)性,并突出相關(guān)的特征。
3)優(yōu)化模型的結(jié)構(gòu)和參數(shù),更好地適應(yīng)不同傳感器數(shù)據(jù)的特性。此外,對于不同的傳感器數(shù)據(jù),建立不同的模型,然后采用模型融合算法,建立模型之間的連接,實現(xiàn)多傳感器信息融合。通過根據(jù)不同傳感器的具體特性定制模型,可以提高性能,并做出更準(zhǔn)確的預(yù)測。
4)研究基于圖神經(jīng)網(wǎng)絡(luò)(GNN)的多模態(tài)融合算法[249-251],可以對多模態(tài)數(shù)據(jù)之間的復(fù)雜關(guān)系進行建模。該方法利用GNN構(gòu)造多模態(tài)數(shù)據(jù)的圖結(jié)構(gòu),以不同傳感器或數(shù)據(jù)類型的信息作為節(jié)點輸入,實現(xiàn)多模態(tài)數(shù)據(jù)的融合。
最后,上述解決方案均為通用性解決方案,需要針對特定的數(shù)據(jù)和應(yīng)用充分結(jié)合特征提取模型和自監(jiān)督算法,才能達到最優(yōu)的多模態(tài)數(shù)據(jù)融合性能。
5.挑戰(zhàn)和未來路線圖
在前一節(jié)中,我們討論了在PHM領(lǐng)域中構(gòu)建lsf模型的技術(shù)細節(jié)和可行的解決方案。本節(jié)試圖從更廣泛、更全局的角度討論這些模型的挑戰(zhàn)、路線圖和前景。通過這樣做,我們可以更好地了解更大的圖景,并確定PHM領(lǐng)域有待改進和未來研究的領(lǐng)域。
5.1大型基礎(chǔ)模型在PHM中的挑戰(zhàn)
LSF-Models在PHM領(lǐng)域面臨的挑戰(zhàn)如圖8所示,主要包括數(shù)據(jù)集、安全性、可信性、可遷移性、高級認知性、可解釋性和邊緣設(shè)備部署七個方面。下面將詳細描述它們。
5.1.1大型數(shù)據(jù)集
企業(yè)不愿向競爭對手披露其商業(yè)敏感信息,包括重要設(shè)備的性能參數(shù)、維護記錄和生產(chǎn)過程故障。這些信息可能被競爭對手利用,以提高競爭力或損害企業(yè)聲譽。用于PHM應(yīng)用的工業(yè)生產(chǎn)數(shù)據(jù)和機械設(shè)備運行監(jiān)測數(shù)據(jù)將不可避免地涉及這些商業(yè)敏感信息。因此,企業(yè)建立了嚴格的數(shù)據(jù)保護措施,導(dǎo)致PHM領(lǐng)域大規(guī)模的可公開訪問的行業(yè)數(shù)據(jù)嚴重缺乏。此外,現(xiàn)代工業(yè)設(shè)備通常在復(fù)雜和無限的環(huán)境中工作,導(dǎo)致數(shù)據(jù)的收集經(jīng)常充滿噪音、丟失數(shù)據(jù)、失真、異常干擾等問題。此外,部署的各種工業(yè)傳感器陣列導(dǎo)致采集不同的數(shù)據(jù)類型,需要處理不同的模態(tài)數(shù)據(jù)。因此,利用這些數(shù)據(jù)構(gòu)建有效的大規(guī)模PHM模型具有挑戰(zhàn)性。
圖8。lsf模型在PHM領(lǐng)域面臨的挑戰(zhàn)
-大規(guī)模數(shù)據(jù)集----安全性---------可信度----可遷移性---高級認知------可解釋行--------邊緣設(shè)備部署-----
---------商業(yè)敏感信息---對抗攻擊----結(jié)果可靠性-應(yīng)用不同----一般概念(常識)--內(nèi)部機理----資源有限--
---------工業(yè)數(shù)據(jù)分析---偏差和錯誤----魯棒性----任務(wù)不同----一般特征--------------理論基礎(chǔ)----時間敏感性-
5.1.2安全
盡管lsf模型已經(jīng)在大量數(shù)據(jù)集上進行了訓(xùn)練,但它們?nèi)匀蝗菀资艿桨踩{,如對抗性攻擊[252]。對抗性攻擊可以通過設(shè)計良好的噪聲干擾PHM模型的輸出,導(dǎo)致模型產(chǎn)生錯誤的結(jié)果。這在關(guān)鍵的PHM應(yīng)用中是不可接受的,如核電站的安全監(jiān)測。在對大規(guī)模數(shù)據(jù)進行訓(xùn)練的過程中,除了直接攻擊外,還可能引入無意的偏差或錯誤,從而導(dǎo)致模型輸出有偏差甚至錯誤的結(jié)果。在這種情況下,PHM模型可能存在安全風(fēng)險,并且很難排除故障,因為特定的偏差和錯誤結(jié)果只在特定場景中偶爾出現(xiàn)。此外,由于lsf模型需要大量的計算資源進行訓(xùn)練和推理,因此容易受到針對計算資源的攻擊,如DDoS攻擊[253,254]和惡意軟件攻擊[255,256]。
5.1.3可信度
LSF-Model的可信度[257]表示用戶對其輸出的準(zhǔn)確性和一致性的信心。此外,模型必須承受諸如偏差、噪聲和輸入數(shù)據(jù)擾動等干擾,同時保持預(yù)測的準(zhǔn)確性和穩(wěn)定性。目前,LSF-Model的可信度較傳統(tǒng)的深度學(xué)習(xí)模型有了明顯的提高。然而,在PHM領(lǐng)域,復(fù)雜的工作條件、不同的背景噪聲和不同的舊設(shè)備導(dǎo)致數(shù)據(jù)分布差異較大。因此,提高lsf模型的可信度仍然是一個重大的挑戰(zhàn)。
5.1.4可遷移性
LSF-Model的可移植性是指模型是否能夠很好地遷移和適應(yīng)不同的任務(wù)和數(shù)據(jù)集。在PHM領(lǐng)域,不同的場景需要不同的任務(wù)(如異常檢測、故障預(yù)測、RUL估計)。然而,這些PHM任務(wù)的性質(zhì)和執(zhí)行是非常不同的,如何在不同的任務(wù)之間實現(xiàn)相當(dāng)大的可轉(zhuǎn)移性和適應(yīng)性是一個挑戰(zhàn)。此外,不同的機械設(shè)備具有不同的性能;例如,軸承、齒輪箱和曲軸都是核心旋轉(zhuǎn)設(shè)備,但它們的失效特性和性能差別很大。另一個挑戰(zhàn)是如何處理這些差異,使lsf模型在各種應(yīng)用中具有較強的可移植性和適應(yīng)性。
5.1.5高級認知
目前對大規(guī)模語言和視覺模型的研究表明,lsf模型具有高級的認知能力,可以在一定程度上學(xué)習(xí)一般概念[62,64]。然而,目前還不清楚這些模型是如何獲得這些能力的,以及如何明確地增強它們。此外,PHM數(shù)據(jù)具有顯著的隨機性,這對模型從該數(shù)據(jù)中概括高級認知提出了挑戰(zhàn)。相對于具有規(guī)則性的文本和視覺數(shù)據(jù),時間序列數(shù)據(jù)的多樣性使得模型難以提取廣義特征表示。
5.1.6可解釋性
可解釋性[258-261]是指模型的決策和輸出可以被解釋和理解,而透明度是指模型的內(nèi)部結(jié)構(gòu)和操作可以被人理解和審查。然而,隨著LSF-Models的發(fā)展,這些模型的內(nèi)部工作原理和運行機制越來越難以解釋和理解,透明度越來越低。此外,LSF-Models在訓(xùn)練期間可能捕獲不可預(yù)測的數(shù)據(jù)關(guān)系和噪聲,這可能導(dǎo)致重大的安全風(fēng)險。在PHM領(lǐng)域[41,262,263],可解釋性和透明度非常重要,因為在核能和航空航天等領(lǐng)域,缺乏透明度的模型難以獲得信任。然而,lsf模型的復(fù)雜性使得研究其可解釋性和透明性變得極其困難。
5.1.7邊緣設(shè)備部署
lsf模型具有大量的參數(shù)和復(fù)雜的結(jié)構(gòu),需要大量的計算資源進行訓(xùn)練和推理。然而,在PHM領(lǐng)域,常常需要將監(jiān)控模型部署到邊緣計算設(shè)備或移動終端上,以滿足實時性和安全性要求。然而,由于現(xiàn)有的邊緣計算設(shè)備普遍缺乏執(zhí)行l(wèi)sf模型的能力,在不影響其性能的情況下實現(xiàn)此類模型的部署是一個重大挑戰(zhàn)。因此,迫切需要設(shè)計新的技術(shù)來解決這個問題,并促進lsf模型在邊緣計算設(shè)備上的部署[264-266],同時保持其性能。
5.2 PHM中大型基礎(chǔ)模型的路線圖
圖9顯示了lsf模型在PHM領(lǐng)域的未來發(fā)展方向。根據(jù)LSF-Models面臨的挑戰(zhàn),本節(jié)探討了如何解決這些挑戰(zhàn),并闡述了未來的路線圖。下面將詳細描述它們。
圖9。lsf -模型在PHM領(lǐng)域的路線圖。
5.2.1大規(guī)模數(shù)據(jù)集的路線圖
在PHM領(lǐng)域構(gòu)建大規(guī)模數(shù)據(jù)集的核心解決方案是消除企業(yè)對數(shù)據(jù)隱私和安全的擔(dān)憂,特別是使所有企業(yè)都能獲得利益,從而實現(xiàn)互利共贏。為此,PHM領(lǐng)域的大規(guī)模數(shù)據(jù)集的分析和利用可以通過以下方法來推進。
1)國際國內(nèi)標(biāo)準(zhǔn)建設(shè)。首先,在學(xué)術(shù)界和行業(yè)的共同推動下,構(gòu)建一套完整的標(biāo)準(zhǔn)體系,包括數(shù)據(jù)采集和存儲標(biāo)準(zhǔn)等。然后,通過這些標(biāo)準(zhǔn)來規(guī)范行業(yè)內(nèi)的數(shù)據(jù)采集方法、數(shù)據(jù)采集對象、數(shù)據(jù)采集頻率、數(shù)據(jù)采集質(zhì)量、數(shù)據(jù)存儲格式、數(shù)據(jù)隱私保護要求。
2)建立行業(yè)數(shù)據(jù)聯(lián)盟,實現(xiàn)數(shù)據(jù)共享。在政府或行業(yè)協(xié)會的推動下,成立行業(yè)數(shù)據(jù)聯(lián)盟,在保護各企業(yè)商業(yè)秘密的同時實現(xiàn)行業(yè)數(shù)據(jù)共享,實現(xiàn)互利共贏。使用大規(guī)模行業(yè)數(shù)據(jù)建立的模型可以反饋參與的公司,以提高其產(chǎn)品的質(zhì)量、可靠性和安全性。
3) .推進校企聯(lián)合研究中心建設(shè)。在工業(yè)領(lǐng)域,學(xué)術(shù)界掌握了前沿的算法設(shè)計和數(shù)據(jù)分析能力,工業(yè)界掌握了大規(guī)模的工業(yè)數(shù)據(jù)。因此,建立校企聯(lián)合研究中心可以協(xié)同發(fā)揮各自的優(yōu)勢,促進lsf模型在PHM領(lǐng)域的研究進展。
4)探索數(shù)據(jù)隱私保護算法。在保護數(shù)據(jù)隱私的同時,探索高效的跨數(shù)據(jù)中心大規(guī)模深度學(xué)習(xí)模型訓(xùn)練和優(yōu)化算法。為了解決企業(yè)之間對數(shù)據(jù)隱私和安全的擔(dān)憂,可以采用數(shù)據(jù)脫敏、加密等技術(shù)來促進數(shù)據(jù)共享。
5.2.2安全路線圖
LSF-Models的安全性主要分為數(shù)據(jù)安全性、模型安全性和系統(tǒng)安全性。為此,可以從以下幾個方面來提高LSF-Model的安全性。
1)確保數(shù)據(jù)安全。確保數(shù)據(jù)安全需要避免惡意篡改或污染數(shù)據(jù),并避免向模型引入偏差或錯誤信息。因此,有必要確保模型的訓(xùn)練數(shù)據(jù)源是可靠的、高質(zhì)量的、充分的和有代表性的。此外,還需要建立數(shù)據(jù)安全保護機制,防止惡意數(shù)據(jù)泄露和篡改。
2)確保模型安全。為lsf模型探索實用的對抗訓(xùn)練和正則化方法[267-269],以提高模型抵抗惡意干擾和噪聲的能力。此外,增強模型的安全性和私密性,如模型加密[270-272],防止模型被盜或被逆轉(zhuǎn)。
3)確保系統(tǒng)安全。對于基于lsf模型的PHM系統(tǒng),建立監(jiān)控系統(tǒng),及時發(fā)現(xiàn)異常操作和攻擊行為,同時記錄操作日志和審計日志,對安全事件進行調(diào)查和跟蹤。
5.2.3可信度路線圖
提高lsf模型的可信度是一個綜合性和復(fù)雜性的問題,可以從以下幾個方面進行優(yōu)化和改進。
1)提高數(shù)據(jù)質(zhì)量。數(shù)據(jù)質(zhì)量是模型訓(xùn)練的基礎(chǔ),保證數(shù)據(jù)質(zhì)量是提高模型可信度的關(guān)鍵。因此,需要采取一系列措施來保證數(shù)據(jù)質(zhì)量,包括數(shù)據(jù)清理、剔除離群值、數(shù)據(jù)增強等。
2)提高模型的魯棒性。探索提高模型魯棒性和抗干擾能力的新方法,如提高模型在有噪聲[9,10,273 -276]、分布移位[277-281]和分布外場景[282-284]下的性能。
3)提高模型評價的綜合性。評價的全面性和公平性是提高模型可信度的關(guān)鍵。為了實現(xiàn)這一目標(biāo),需要使用多個評價指標(biāo)和多個數(shù)據(jù)集對模型進行綜合評價,同時避免針對特定場景的模型偏差等問題。
4)保證模型可追溯性。為了提高模型的可信性,有必要對模型的開發(fā)、培訓(xùn)、測試、部署和其他過程進行充分的記錄和跟蹤。這樣可以保證模型的過程是可控的,結(jié)果是可以驗證的,從而提高模型的可信度。
5.2.4可遷移性路線圖
進行l(wèi)sf模型的目標(biāo)是提出能夠執(zhí)行所有任務(wù)的通用模型的概念。本著這個目標(biāo),我們致力于創(chuàng)建一個全面的多任務(wù)PHM系統(tǒng)。為了實現(xiàn)這一目標(biāo),最重要的是盡可能地提高基礎(chǔ)模型的可移植性和適應(yīng)性。PHM領(lǐng)域包含了各種各樣的下游任務(wù),其應(yīng)用對象是復(fù)雜的,因此需要探索新的架構(gòu)設(shè)計方法、特征學(xué)習(xí)方法和訓(xùn)練算法,以適應(yīng)真實的工業(yè)場景,以增強可移植性。
1)探索靈活的模型架構(gòu)設(shè)計。為了構(gòu)建通用的基礎(chǔ)模型,有必要研究靈活的模型體系結(jié)構(gòu)設(shè)計,這些設(shè)計可以針對不同類型的PHM應(yīng)用程序(如監(jiān)控、診斷、預(yù)測等)進行定制。
2)探索一般特征表示方法。從不同的數(shù)據(jù)類型中提取有價值的特征是實現(xiàn)通用模型的關(guān)鍵。這些特征表示算法需要能夠捕獲各種類型的故障模式,還需要對不同類型的故障數(shù)據(jù)具有魯棒性。
3)探索適合PHM應(yīng)用的訓(xùn)練算法。雖然在NLP和NLP領(lǐng)域已經(jīng)提出了大量的自監(jiān)督訓(xùn)練算法[49,69 - 71,124,125]CV,只有根據(jù)PHM領(lǐng)域特點設(shè)計的訓(xùn)練算法,才能最大限度地提高基礎(chǔ)模型的可移動性和適應(yīng)性。
5.2.5高級認知的路線圖
lsf模型有潛力獲得先進的認知,并從使用大量訓(xùn)練數(shù)據(jù)和精心設(shè)計的算法的數(shù)據(jù)中學(xué)習(xí)一般概念。在PHM領(lǐng)域,具有高級認知能力的lsf模型能夠很好地理解工業(yè)數(shù)據(jù)的本質(zhì)和一般概念。因此,LSF-Models可以迅速適應(yīng)不同的工業(yè)場景和任務(wù),有效地避免產(chǎn)生難以理解的輸出。然而,目前的lsf模型所顯示的高級認知能力還不夠。除了擴大訓(xùn)練數(shù)據(jù)量外,還需要在以下幾個方面進行探索:
1)探索數(shù)據(jù)需求,實現(xiàn)高級認知能力。雖然一些現(xiàn)有的lsf模型已經(jīng)證明了有限的高級認知能力,但需要什么樣的數(shù)據(jù)和多少數(shù)據(jù)才能達到這種能力是未知的。此外,如何充分利用數(shù)據(jù)信息,在相對較小的數(shù)據(jù)集上獲得可觀的認知能力也是一個值得研究的課題。
2)探索實現(xiàn)高級認知能力的模型要求。大多數(shù)現(xiàn)有的lsf模型采用Transformer架構(gòu),但它有局限性。因此,探索新的Transformer架構(gòu)或設(shè)計新的模型架構(gòu),以使LSF-Models顯示出更好的認知能力,是值得探索的領(lǐng)域。
3)探索實現(xiàn)高級認知能力的理論要求。高級認知能力的實現(xiàn)不能僅僅依靠大量的實驗分析;這也需要適當(dāng)?shù)睦碚搧硖峁┲笇?dǎo)性的解決方案。因此,利用lsf模型研究高級認知能力習(xí)得的原因和機制,將對該領(lǐng)域的研究起到重要的推動作用。
5.2.6可解釋性的路線圖
深度學(xué)習(xí)因缺乏可解釋性和透明度而受到批評,這種缺陷在LSF-Models中更為明顯。提高這些模型的可解釋性和透明度將提高它們的可信性、可控性和可靠性,使它們更適合于在航空航天和核能等關(guān)鍵工業(yè)領(lǐng)域的應(yīng)用。未來的研究可以從以下三個方面來解決這個問題。
1)探索深層可解釋模型。在PHM領(lǐng)域,一種可行的解決方法是利用信號分析方法的理論基礎(chǔ),實現(xiàn)具有高可解釋性的深度模型[41,46,47,263]。此外,將先驗知識或物理背景信息納入模型也可以顯著提高模型的可解釋性。
2)探索分析模型可解釋性的方法。根據(jù)深層模型的特點,需要探索分析模型可解釋性的實用方法。例如,通過使用可視化方法[41,48,285,286]分析模型的內(nèi)部結(jié)構(gòu)參數(shù),使用信號分析方法分析模型的濾波器[287],了解模型學(xué)習(xí)了哪些特征。
3)推進深度模型理論研究。這就需要深入分析基礎(chǔ)模型的原理,通過理論分析,探索其本質(zhì)屬性、特點、優(yōu)缺點,揭示其內(nèi)在機制和規(guī)律[288-290]。通過建立基礎(chǔ)模型的數(shù)學(xué)模型,推導(dǎo)其收斂性、泛化性和魯棒性等特性,揭示深層模型的內(nèi)在機理。
5.2.7邊緣設(shè)備部署示意圖
盡管lsf模型的性能令人印象深刻,但其計算需求極大地限制了其適用性。為了促進lsf模型在PHM領(lǐng)域的應(yīng)用,可以從以下幾個方面進行探索,使lsf模型輕量化。
1)探索輕量級的深度模型。通過探索輕量級深度模型的設(shè)計方法[291,292],開發(fā)新的低復(fù)雜度算法和算子設(shè)計范式,可以降低模型的計算負荷和資源占用。
2)模型壓縮和剪枝??梢蕴剿髂P蛪嚎s[293,294]和剪枝[295,296]技術(shù)來減小模型的尺寸。有效的壓縮方法,如權(quán)重分配、低秩分解和知識蒸餾。此外,可以使用有效的剪枝方法消除冗余神經(jīng)元或連接。
3)網(wǎng)絡(luò)拓撲優(yōu)化。探索新的網(wǎng)絡(luò)拓撲設(shè)計方案,如腦激勵尖峰神經(jīng)網(wǎng)絡(luò)[297,298],以實現(xiàn)低功耗和計算需求的深度網(wǎng)絡(luò)模型。
5.3前景:通用PHM平臺
傳統(tǒng)的基于人工智能的PHM模型通常需要為每個子任務(wù)開發(fā)獨特的數(shù)據(jù)處理和模型優(yōu)化算法,以在特定場景中獲得良好的性能。例如,需要建立獨立的軸承故障診斷模型和RUL估計模型。然而,復(fù)雜的工業(yè)設(shè)備可能包含數(shù)百個核心部件,為所有部件建立相應(yīng)的PHM模型是一個龐大的項目。此外,該應(yīng)用范式不能充分利用工業(yè)設(shè)備的多模態(tài)關(guān)聯(lián)數(shù)據(jù),不能全面表征工業(yè)設(shè)備的健康狀態(tài)。構(gòu)建的各種子任務(wù)模型耗時費力,不能保證模型具有良好的泛化性能。如前所述,NLP和CV領(lǐng)域,如ChatGPT[62]和SAM[64],證明了LSF-Models在跨模態(tài)多任務(wù)場景中的出色表現(xiàn),并在一定程度上實現(xiàn)了所有任務(wù)模型的思想。因此,受此啟發(fā),實現(xiàn)通用PHM平臺成為可能實現(xiàn)所有PHM任務(wù)的一個模型。這一研究理念將徹底改變PHM領(lǐng)域的研究范式,實現(xiàn)通用PHM平臺將顯著促進PHM領(lǐng)域的綜合智能化。
圖10為高速列車通用PHM平臺示意圖。通用PHM平臺的核心是大型跨模態(tài)基礎(chǔ)模型。該模型接收來自高速列車的各種數(shù)據(jù),如傳感器數(shù)據(jù)(包括信號、圖像和視頻)、維修工作單和記錄,以及專家的經(jīng)驗和知識,作為輸入。隨后,對高鐵各子系統(tǒng)和核心部件的健康狀況進行全面評估和監(jiān)測。其中,采用多模態(tài)融合算法和自監(jiān)督特征表示算法構(gòu)建跨模態(tài)基礎(chǔ)模型,使其能夠理解和學(xué)習(xí)多模態(tài)列車數(shù)據(jù)的通用高質(zhì)量數(shù)據(jù)特征。隨后利用零/少鏡頭學(xué)習(xí)范式將跨模態(tài)基礎(chǔ)模型擴展到各種訓(xùn)練PHM子任務(wù),從而實現(xiàn)平臺效應(yīng)??缒B(tài)基礎(chǔ)模型的最終目標(biāo)是通過學(xué)習(xí)大量的列車運行數(shù)據(jù),為PHM任務(wù)(如健康監(jiān)控、故障預(yù)測、異常檢測、RUL估計、維護計劃和健康管理)提供強大的、可泛化的數(shù)據(jù)挖掘和理解工具。即使對于訓(xùn)練過程中不存在的新對象和數(shù)據(jù),跨模態(tài)基礎(chǔ)模型仍然可以提供相當(dāng)大的特征挖掘能力。因此,所提出的通用PHM平臺有望成為PHM領(lǐng)域的核心工具,在提高工業(yè)設(shè)備健康管理效率方面發(fā)揮關(guān)鍵作用減少維護成本。
圖10。通用PHM平臺的原理圖,以高速列車PHM應(yīng)用為例。
6.結(jié)論
目前,深度學(xué)習(xí)研究正在經(jīng)歷一場新的革命,即單一模式、單一任務(wù)、有限數(shù)據(jù)的研究范式(AI 1.0)正迅速向多模態(tài)、多任務(wù)、海量數(shù)據(jù)、超大模型的研究范式(AI 2.0)發(fā)展。AI 2.0專注于開發(fā)具有跨領(lǐng)域知識的lsf模型,在海量數(shù)據(jù)集上進行訓(xùn)練后,具有較強的泛化和多任務(wù)能力。為此,本文對三大技術(shù)進行了全面的概述并分析了LSF模型在自然語言處理和CV中的研究現(xiàn)狀。文獻回顧表明,嚴重缺乏對LSF模型在PHM領(lǐng)域的研究,并沒有可行的解決方案,如何建立LSF模型的PHM應(yīng)用程序。因此,本文從四個方面全面回答了如何構(gòu)建適合PHM領(lǐng)域的LSF-Models:數(shù)據(jù)集、深度模型、學(xué)習(xí)算法和數(shù)據(jù)融合。最后,本文試圖從更廣泛,更全球的角度討論LSF模型的挑戰(zhàn)和路線圖。總體而言,本綜述系統(tǒng)地介紹了LSF模型及其在PHM領(lǐng)域的研究現(xiàn)狀、挑戰(zhàn)、解決方案、路線圖和前景,期望為該領(lǐng)域的未來研究提供有價值的指導(dǎo)。
聲明:公眾號轉(zhuǎn)載的文章及圖片出于非商業(yè)性的教育和科研目的供大家參考和探討,并不意味著支持其觀點或證實其內(nèi)容的真實性。版權(quán)歸原作者所有,如轉(zhuǎn)載稿涉及版權(quán)等問題,請立即聯(lián)系我們刪除。
掃描二維碼
報名相應(yīng)課程
相關(guān)知識
故障預(yù)測與健康管理——PHM技術(shù)簡介
裝備故障預(yù)測和健康管理(PHM)行業(yè)報告
遠舢智能化故障預(yù)測與健康管理系統(tǒng)
故障預(yù)測與健康管理(PHM):引領(lǐng)工業(yè)4.0的預(yù)防性革命,市場潛力無限
人工智能大模型在醫(yī)療健康領(lǐng)域的深度應(yīng)用
覆蓋10大醫(yī)療應(yīng)用場景!國產(chǎn)AI大模型應(yīng)用典型案例盤點
智能問診大模型的構(gòu)筑:編織健康智慧的經(jīng)緯
基于大數(shù)據(jù)老年多重慢性病風(fēng)險預(yù)測模型構(gòu)建探究
健康管理視域下養(yǎng)老機構(gòu)老年人分級照護模型研究
用生成式AI改善運動健康,夸父大模型揭秘基礎(chǔ)設(shè)施秘籍
網(wǎng)址: 大模型時代下智能故障診斷如何發(fā)展,清華綜述《大規(guī)模基礎(chǔ)模型在預(yù)測和健康管理(PHM)中的應(yīng)用》 http://m.u1s5d6.cn/newsview588262.html
推薦資訊
- 1發(fā)朋友圈對老公徹底失望的心情 12775
- 2BMI體重指數(shù)計算公式是什么 11235
- 3補腎吃什么 補腎最佳食物推薦 11199
- 4性生活姿勢有哪些 盤點夫妻性 10425
- 5BMI正常值范圍一般是多少? 10137
- 6在線基礎(chǔ)代謝率(BMR)計算 9652
- 7一邊做飯一邊躁狂怎么辦 9138
- 8從出汗看健康 出汗透露你的健 9063
- 9早上怎么喝水最健康? 8613
- 10五大原因危害女性健康 如何保 7826