Jens Arvidsson & Simon Ström

Automatisk klassificering av åsikter

Sammanfattning

Internet är fullt av åsikter, och för en människa är det en enkel sak att läsa en recension eller ett blogginlägg och få en bild av författarens åsikt. För en dator är det dock en annan historia, och i den här rapporten undersöker författarna huruvida ett system kan skapas som automatiskt kan hämta avkoda filmrecensioner från internet och översätta dem till ett numeriskt betyg för filmen. Författarna testar tre olika maskininlärningsalgoritmer för denna uppgift, och jämför deras resultat med numeriska betyg som hämtas från Internet Movie Database, IMDb. Algoritmen Voted Perceptron är den som fungerar bäst med denna mätmetod, och betygen som sätts av systemet hamnar mycket nära IMDb-betygen. Den kompletta källkoden till programmet kan hittas på github.