André Gräsman, Rasmus Göransson

Automatisk bildanalys av foton på Rubiks kub

Sammanfattning

Dokumentet behandlar olika tekniker som används i samband med automatisk bildanalys. Innehållets syfte är att ge en överblick på tekniker som används för att extrahera information ur bilder, med ett konkret exempel. Dokumentet beskriver hur ett program extraherar information från två fotografier på Rubiks kub för att fastställa tillståndet hos kuben. Programmets arbete delas upp i avgränsade steg där varje steg förklaras individuellt. Tekniker som berörs är bland andra kantigenkänning, formkategorisering av polygoner, vitbalansering och jämförelse av färger.

En viktig del av arbetet bygger på förståelsen om hur ostrukturerad information kan processas till strukturerad data. Processen gör antaganden och uppskattningar så informationen kan struktureras och användas i nästkommande steg. Dokumentet visar hur information om det analyserade objektet kan användas för att upptäcka felaktigheter i de antaganden och uppskattningar som har gjorts. Till exempel kan etiketter inte ha färger som resulterar i fysiskt omöjliga bitar på kuben. Dokumentet innehåller en resultatdel där programmet demonstreras för foton av olika kvalité.