Johan Litsfeldt

Klassificering av e-post

En undersökning av handledda klassificeringsmetoder.

Sammanfattning

Denna rapport behandlar metoder för automatisk klassificering av e-post d.v.s. kategorisering av brev med avseende på deras innehåll. Metoder för klassificering beskrivs i rapporten för ett godtyckligt antal kategorier men speciellt för det binära fallet. Algoritmerna analyseras även genom implementation och utvärdering av ett spamfilter baserat på dessa metoder. Utöver klassificeringsalgoritmer innehåller även rapporten språkanalys av e-postbrev, viktningsprinciper och en genomgång av moderna spamtekniker.