Henry Eklind

Hierarkisk kategorisering av transaktioner med kraftig kategori-obalans och subjektiv data

Sammanfattning

I detta examensarbete undersöker vi olika modeller för att förutsäga transaktionskategorisering, och om det skulle vara möjligt att överträffa den tidigare modellen som användes för samma uppgift. Vårt tillvägagångssätt består i att utvärdera flera feed-forward neurala nätverk med tecken n-gram tokenisering; klass obalansjusteringar och en ny hierarkisk förlustfunktion. Resultaten visar att matematikmodulmodeller i stort sett överträffar både baslinjens SVM-modell, men också den tidigare modellen. Klassens obalansjusteringsteknik verkar generellt sämre i allmänhet; Hjälpfunktionerna visade inte någon skillnad i prestanda och hierarkisk förlustfunktion påverkar inte prestanda på något väsentligt sätt. Den bästa modellen med endast transaktionsbeskrivningar och en kategorisk kors-entropi-förlustfunktion uppnår en ökning med 0,05 för både makro- och mikrof1-poäng och en ökning av respektive 0,08 och 0,06 PRC AUC-mikro och makro jämfört med den gamla modellen.