Kan man lära datorer att läsa?

Abstract

En undersökning av olika typer av klustringsalgoritmer har genomförts. Undersökningen behandlar en intressant probleminstans, teckenigenkänning. Det som är intressant med att använda klustring för teckenigenkänning är att klustring är en metod som bygger på oövervakad inlärning och det som utmärker oövervakade inlärningsmetoder är att sådana metoder ej känner till vilken klass ett objekt tillhör i upplärningsfasen. Detta skiljer sig markant från vanliga teckenigenkänningsmetoder, där man ofta tränar genom att titta vilka egenskaper som finns för varje klass av objekt.

De klustringsalgoritmer som undersökts är K-means, Xmeans, hiearkisk klustring och till dessa har olika avståndsberäkningar använts , Euklidskt avstånd, Cosinusmått och Manhattan avstånd.

Syftet med undersökningen är att ta reda på om det går att använda klustringsalgoritmer för att utföra teckenigenkänning och undersöka vilka förutsättningar som behövs för att lyckas.

Slutsatsen är att det går att använda klustring i detta syfte, om man har möjlighet att påverka vilka parametrar som används. I denna undersökning så har teckenparametrar som är mer direkt relaterade till hur bilden på tecknet ser ut visat sig fungera bra. För att mer nogrannt avgöra vad som utmärker en bra parameter behövs en mer omfattande undersökning.

Författare: Niklas Lundborg