Edvin Ekblad

Oskar Werkelin Ahlin

Implementation av Q-learning för fyra-i-rad

Sammanfattning

Maskininlärning är ett forskningsområde inom datalogi som blivit av större vikt de senaste åren. Det används i många vardagliga sammanhang, såsom röstigenkänning i mobiltelefoner, ansiktsigenkänning i bildbehandlingssammanhang och mycket mer. Ett delområde inom området är belöningsbaserad inlärning, som är ett försök till att efterlikna intelligens i den verkliga världen, det bygger på den enkla idén att om man tidigare tjänat på att göra något bör man göra det igen. Q-learning är en algoritm som bygger på denna teknik, och i detta projekt implementerar vi den för det enkla brädspelet fyra-i-rad. Spelets tillståndsmängd visar sig vara för stor för att uppnå bra allmänna resultat, men hållbara resultat fås ändå genom att ett problem formuleras som minskar tillståndsmängden kraftigt.

Implementation of Q-learning for Connect Four

Abstract

Machine learning is a field of research in computer science which has gained importance lately. It is used in several everyday products, for features such as voice recognition in cell phones and face recognition in photography equipment. A subtopic of machine learning is reinforcement learning, which is an attempt att mimicking real-life intelligence. Reinforcement learning is built around the idea that if a positive reaction is received from a certain action, this action should be repeated. Q-learning is an algorithm which is built upon this technique, and it is implemented in this project for the board game Connect Four. The amount of individual states of the game proves to be too large to acquire good general results, however acceptable results are still produced by the problem being formulated in a way which greatly reduces the amount of states.