Christoffer Janson & Carl Landefjord

Fyra-i-rad med förstärkt inlärning

Sammanfattning

Maskininlärning täcker de områden inom artificiell intelligens som handlar om en typ av inlärningsalgoritmer där program ska lära sig att utföra uppgifter utifrån de givna förutsättningarna. Förstärkt inlärning är ett område inom maskininlärningen som syftar på att programmet ska lära sig vad som är en bra handling genom att handlingarna belönas.

En algoritm som bygger på förstärkt inlärning är Q-learning. Den använder sig av en tabell med ett värde för varje tillstånd. Tabellen uppdaterar sina värden när nya belöningar blir utdelade på grund av beslut i miljön. Denna rapport beskriver hur Q-learning kan implementeras och hur implementationen beter sig mot tre olika artificiella motspelare.

Syftet med denna rapport är att undersöka hur Q-learnings inlärningsvariabel α påverkar inlärningshastigheten och för vilka värden en implementation kan tänkas fungera som bäst. Vårt bästa resultat fick vi då α=0.9.