Carl Nordling

Anomalidetektion i kreditkortstransaktioner med användning av Autoencoders

Sammanfattning

Under 2018 förlorades ungefär 27,85 miljarder dollar världen över i kreditkortsbedrägerier. Med hjälp av maskininlärning och anomalidetektion kan detektering av bedrägeri utföras med målet att lösa detta problem.

Dennna avhandling undersöker om Autoencoders kan användas för att upptäcka bedrägerier i kreditkortstransaktioner och om de presterar bättre än Random Forest-modeller evaluerat med AUROC.

Tre olika modeller skapades: Random Forest, Vanilla Autoencoder och LSTM Autoencoder. Alla modeller tränades på två olika dataset, ett genuint dataset och en syntetisk. LSTM Autoencoder tränades på två olika varianter av Dataset-2. Ett där data sorterades efter tid och ett där data sorterades efter användare. En tredje modell skapades sedan genom att kombinera de två LSTM Autoencoder-modellerna. Alla modeller utvärderades med hjälp av accuracy, recall och AUROC. AUROC var den primära metriken.

Random Forest-modellen överträffade Autoencoder-modellerna på båda dataseten i AUROC-poäng. AUROC-poängen var ganska lika på Dataset-1 för alla modeller, där Random Forest-modellen fick den högsta AUROC-poängen på 0,9258. För Dataset-2 fick Random Forest-modellen en AUROC-poäng på 0,8508 medan Autoencoder-modellerna fick lägre AUROC-poäng mellan 0,6447 och 0,7791. Autoencoder-modellerna som skapats i denna avhandling kan användas för detektion av avvikelser i kreditkortstransaktioner, men fungerar nödvändigtvis inte bra. Detta är beroende på vilken data som används.