Maskininlärning täcker de områden inom artificiell intelligens som
handlar om en typ av inlärningsalgoritmer där program ska lära sig att
utföra uppgifter utifrån de givna förutsättningarna. Förstärkt inlärning
är ett område inom maskininlärningen som syftar på att programmet ska
lära sig vad som är en bra handling genom att handlingarna belönas.
En algoritm som bygger på förstärkt inlärning är Q-learning. Den
använder sig av en tabell med ett värde för varje tillstånd. Tabellen
uppdaterar sina värden när nya belöningar blir utdelade på grund av
beslut i miljön. Denna rapport beskriver hur Q-learning kan
implementeras och hur implementationen beter sig mot tre olika
artificiella motspelare.
Syftet med denna rapport är att undersöka hur Q-learnings
inlärningsvariabel α påverkar inlärningshastigheten och för vilka värden
en implementation kan tänkas fungera som bäst. Vårt bästa resultat fick
vi då α=0.9.