bild
Skolan för
datavetenskap
och kommunikation
KTH / CSC / Kurser / 2D1431 / mi06 / Kursanalys

Maskininlärning, Kursanalys 2006

Kursdata

  • Kursbeteckning:
    Maskininlärning, 2D1431, 4 poäng
  • Läsperiod:
    Period 2, HT2006
  • Lärare:
    • Kursledare och föreläsare: Örjan Ekeberg
    • Extra föreläsare: Daniça Kragic
    • Kursassistent: Johannes Hjorth
    • Handledare: Staffan Ekvall, Örjan Åkerborg, Mikael Huss
  • Schemalagd tid:
    • Föreläsningar: 26 timmar
    • Laborationer: 16 timmar (4 timmar/redovisningspass)
  • Antal registrerade studenter: 42
  • Kurslitteratur:
    • Kursbok Mitchell: Machine Learning McGraw-Hill, 1997 ISBN: 0-07-115467-1
    • Laborationsanvisningar
      • Labb 1: Concept Learning and Decision Trees
      • Labb 2: Bayes Classifier and Boosting
      • Labb 3: Reinforcement Learning
      • Labb 4: Genetic algorithms
    • Utdelade artiklar m.m.
      • Schapire: A brief introduction to boosting
      • Quinlan: Bagging, boosting, and C4.5
  • Examination:
    Kursen examineras genom fyra obligatoriska laborationsuppgifter (2 poäng) samt en tentamen (2 poäng).
  • Resultat:
    Av de 42 studenter som registrerat sig på kursen har 31 gått upp på ordinarie tentamen och 33 har gjort någon laboration. Totalt är 27 klara med tentan (efter ett tentatillfälle) och 30 klara med labbkursen.
  • Prestationsgrad: (27*2+30*2)/(33*4) = 86%
  • Examinationsgrad: 24/33 = 70%

Mål

Maskininlärning handlar om hur datorprogram automatiskt kan förbättra sitt beteende genom att utnyttja sina tidigare erfarenheter. Ämnet ligger i gränslandet mellan artificiell intelligens, statistik, informationsteori, biologi och reglerteknik. Målet med kursen är att ge grundläggande kännedom om de teorier och algoritmer som används inom området.

Sammanfattning

Kursen är mycket uppskattad bland studenterna. Laborationerna utgör en viktig del av kursen och kräver en ordentlig arbetsinsats från studenternas sida. Vi behöver se över laborationsanvisningarna så att studenterna inte fastnar, eftersom tiden för individuell handledning är mycket begränsad.

Undervisningen

Undervisningen har bestått av 13 tvåtimmarsföreläsningar som var och en har haft ett tydligt tema, t.ex. en algoritm eller en grupp av relaterade metoder. Daniça Kragic har varit föreläsare på de tre föreläsningar som behandlar statistiska inlärningsmetoder medan Örjan Ekeberg har hållit i de övriga föreläsningarna. Dessutom har studenterna arbetat med fyra obligatoriska laborationer.

Examination

Kursen examineras genom muntlig redovisning av de fyra laborationerna samt en skriftlig tentamen. Laborationsredovisningen sker genom att studenterna anmäler sig via ett webb-baserat bokningssystem för ett 20-minuters redovisningspass. En handledare går igenom laborationen, med tonvikt på de frågor som finns i labbanvisningen, tillsammans med studenterna.

Tentamen består av ett antal frågor som testar förståelsen för hur de olika metoderna fungerar och vad de har för speciella egenskaper. Betyget sätts efter tentaresultatet men ett generöst bonussystem gör att de som redovisat alla laborationer i tid får lättare att få ett högre betyg.

Kurslitteratur

Kursboken (Mitchell) definierar ganska väl kursinnehållet. Boken är förvånansvärt dyr. En annan nackdel med boken är att den är ganska gammal (1997), vilket naturligtvis inte är bra i ett område som utvecklas så snabbt som detta.

Teknikerna bagging och boosting beskrivs inte i boken och vi har därför kompletterat med några allmänna artiklar som beskriver dessa metoder.

Studentsynpunkter

Vid kursens slut gjordes en enkät som besvarades av 10 studenter. Resultatet finns här. De flesta tycker att det är en rolig kurs och är också nöjda med själva genomförandet. Föreläsningarna är uppskattade och den kritik som framförts är genomgående positiv.

När det gäller laborationerna är studenterna också genomgående nöjda. Laboration 1 får kommentarer om att den är lite för lätt (det är nästan ingen egen programmering i den) medan den andra labben upplevs som lite väl svår.

Kursens belastning för studenterna

Allt tyder på att belastningen för studenterna är "lagom".

Förkunskaper

Studenterna har varierande förkunskaper men det verkar ändå som att de flesta har kunnat tillgodogöra sig kursinnehållet. Nästan alla anger i enkäten att de hade tillräckliga förkunskaper.

Ett speciellt förkunskapsproblem är språket. Föreläsningarna hålls på svenska men allt annat material är på engelska. Vid ordinarie tentamen finns frågorna på både svenska och engelska. Vi har varje år en handfull studenter som inte förstår svenska, men som ändå följer kursen.

Planerade förändringar

I laboration 4 används ett modellsystem som är onödigt komplicerat. Det gör att studenterna tvingas ägna onödigt mycket tid och energi åt att förstå detta istället för den egentliga algoritmen. Vi bör undersöka ifall vi kan förenkla problemet utan att för den skull göra uppgiften trivial.

Vi bör fortsätta att utreda ifall det finns en nyare och billigare kursbok som passar för kursen.

Copyright © Sidansvarig: Örjan Ekeberg <orjan@nada.kth.se>
Uppdaterad 2007-05-24