Sarah Berenji Ardestani

Anomaliupptäckning i tidsserier och osäkerhetsestimering med hjälp av LSTM Autoencoders

Sammanfattning

Målet med den här uppsatsen är att implentera ett verktyg för anomaliupp- täckning med hjälp av LSTM autoencoders och applicera en ny metod för osäkerhetsestimering med hjälp av Bayesian Neural Networks (BNN) baserat på en artikel från Uber research group. Pålitliga verktyg för att upptäcka anomalier och att göra precisa osäkerhetsestimeringar är kritiskt i många fält. På Telia kan ett sådant verktyg användas för många olika datadomäner, som i enhetsloggar för att upptäcka abnormalt beteende. Vår metod använder en autoencoder för att extrahera viktiga egenskaper och lära sig den kodade re- presentationen av tidsserierna. Detta tillvägagångssätt hjälper till med att ta in testdatapunker som kommer in från olika grundmängder. Sedan tränas en förutsägelsemodell baserad på encoderns representation av datan. För att upp- skatta modellens osäkerhet används en uppskattningsalgoritm som delar upp osäkerheten till tre olika källor. Dessa tre källor är: modellosäkerhet, felspe- ciferad model, och naturligt brus. För att få de första två används en Monte Carlo dropout approach som är lätt att implementera och enkel att skala. För den tredje delen används en enkel anfallsvikel som uppskattar brusnivån med hjälp av felkvadratsumman av valideringsdatan. Som ett resultat kunde vi se att vår föreslagna model kan göra bättre förutsägelser än våra benchmarks. Även om skillnaden inte är stor så visar det att att använda autoencoderrepresenta- tion för att göra förutsägelser är mer noggrant. Resulaten för anomaliupptäck- ningen baserat på dessa förutsägelser visar också att vår föreslagna modell har bättre prestanda än benchmarken. Det betyder att användning av autoencoders kan förbättra både förutsägelser och anomaliupptäckning. Utöver det kan vi dra slutsatsen att användning av djupa neurala nätverk skulle visa en större förbättring om datan hade mer komplexitet.