Felix Liljefors

Tidsberoende modellering av turboladdarfel med hjälp av maskininlärning

Sammanfattning

Datadrivet prediktivt underhåll av fordon kan potentiellt minska riskerna för kostsamma fordonsstopp, skadad last, samt ökade utsläpp till följd av felande komponenter. Att generera prediktiva underhållsplaner med datadrivna metoder som också är kostnadseffektiva är dock inte enkelt. Detta examensarbete presenterar en metod för prediktion av turboladdarfel i lastbilar. Metoden kombinerar tillämpad maskininlärning med teori från det statistiska området överlevnadsanalys, och har fått namnet Survival-PLSTM. Survival-PLSTM använder ett Recurrent Neural Network (RNN) för att modellera tidsseriedata insamlad från lastbilar i drift. Givet en lastbils insamlade data producerar Survival-PLSTM en uppskattad diskret kumulativ fördelningsfunktion som uttrycker sannolikhet för turbofel över tid. Metoden tar hänsyn till flera utmaningar relaterade till modellering av komponentfel i lastbilar, såsom högercensurerad data, klassimbalans och icke-informativa variabler. Underhållsplanen som Survival-PLSTM genererar visas vara mer kostnadseffektiv än en avhjälpande underhållsplan (corrective maintenance), under rimliga förhållanden. Survival-PLSTM kan användas för att prediktera turboladdarfel som ett binärt utfall inom ett givet tidsfönster. På denna uppgift har Survival-PLSTM jämförbar sensitivitet och specificitet som Random Survival Forest (RSF), vilket är en datadriven metod som tidigare använts i liknande syfte. Kostnadseffektiviteten av en modellgenererad underhållsplan visas bero på kvoten mellan kostnaden för falsk-negativa respektive falsk-positiva prediktioner, $\beta :=\frac{\text{falsk-negativ kostnad}}{\text{falsk-positiv kostnad}}$. Survival-PLSTM visas producera en kostnadseffektivare underhållsplan när $\beta > 3.5$, medan RSF visas vara bättre då $1 \leq \beta \leq 3.5$. Båda modellerna producerar underhållsplaner som är mer kostnadseffektiva än en avhjälpande underhållsplan.