bild
Skolan för
datavetenskap
och kommunikation
KTH / CSC / Kurser / DD2431 / mi07 / Kursanalys

Maskininlärning DD2431, Kursanalys 2007/2008

Kursdata

  • Kursbeteckning:
    Maskininlärning, DD2431, 6 högskolepoäng
  • Läsperiod:
    Period 2, HT2007
  • Lärare:
    • Kursledare och föreläsare: Örjan Ekeberg
    • Extra föreläsare: Hedvig Kjellström
    • Handledare: Jenny Tigerholm, Simon Benjaminsson
  • Schemalagd tid:
    • Föreläsningar: 26 timmar
    • Laborationer: 16 timmar (4 timmar/redovisningspass)
  • Antal registrerade studenter: 26
  • Kurslitteratur:
    • Kursbok Mitchell: Machine Learning McGraw-Hill, 1997 ISBN: 0-07-115467-1
    • Laborationsanvisningar
      • Labb 1: Concept Learning and Decision Trees
      • Labb 2: Bayes Classifier and Boosting
      • Labb 3: Reinforcement Learning
      • Labb 4: Genetic algorithms
    • Utdelade artiklar m.m.
      • Schapire: A brief introduction to boosting
      • Quinlan: Bagging, boosting, and C4.5
  • Examination:
    Kursen examineras genom fyra obligatoriska laborationsuppgifter (3 poäng) samt en tentamen (3 poäng).
  • Resultat:
    Av de 26 studenter som registrerat sig på kursen har 21 gått upp på ordinarie tentamen och 23 har gjort någon laboration. Totalt är 19 klara med tentan (efter ett tentatillfälle) och 17 klara med labbkursen.
  • Prestationsgrad: (19×3+17×3)/(23×6) = 78%
  • Examinationsgrad: 15/23 = 65%

Mål

Maskininlärning handlar om hur datorprogram automatiskt kan förbättra sitt beteende genom att utnyttja sina tidigare erfarenheter. Ämnet ligger i gränslandet mellan artificiell intelligens, statistik, informationsteori, biologi och reglerteknik. Målet med kursen är att ge grundläggande kännedom om de teorier och algoritmer som används inom området.

Sammanfattning

Kursen är mycket uppskattad bland studenterna. Laborationerna utgör en viktig del av kursen och kräver en ordentlig arbetsinsats från studenternas sida.

Undervisningen

Undervisningen har bestått av 13 tvåtimmarsföreläsningar som var och en har haft ett tydligt tema, t.ex. en algoritm eller en grupp av relaterade metoder. Hedvig Kjellström har varit föreläsare på de tre föreläsningar som behandlar statistiska inlärningsmetoder medan Örjan Ekeberg har hållit i de övriga föreläsningarna. Dessutom har studenterna arbetat med fyra obligatoriska laborationer.

Nytt för i år var att föreläsningarna gavs på engelska. Detta berodde dels på att flera studenter bad om detta innan kursstart, och dels på att kursen planeras ingå i internationella mastersprogram. Studenterna var antingen positiva eller neutrala till att föreläsningarna var på engelska. Som lärare upplever jag att språket i viss mån kan ha dämpat diskussioner och frågor något.

Examination

Kursen examineras genom muntlig redovisning av de fyra laborationerna samt en skriftlig tentamen. Laborationsredovisningen sker genom att studenterna anmäler sig via ett webb-baserat bokningssystem för ett 10-minuters redovisningspass. En handledare går igenom laborationen, med tonvikt på de frågor som finns i labbanvisningen, tillsammans med studenterna.

Tentamen består av ett antal frågor som testar förståelsen för hur de olika metoderna fungerar och vad de har för speciella egenskaper. Betyget sätts efter tentaresultatet men ett generöst bonussystem gör att de som redovisat alla laborationer i tid får lättare att få ett högre betyg.

Betygsättning

Nytt för i år var att betygen sätts på skalan A-F med mål definierade för verje betygsnivå. Tentamen delades upp i två delar där den första behandlade grundläggande kunskaper som krävs för godkänt medan den andra delen användes för att avgöra betygsnivån.

På den första tentadelen användes flervalsfrågor och för godkänt krävdes att alla svar skulle vara rätt. Den till synes höga kravnivån motiveras av att alla frågorna var av grundläggande karaktär som inte borde utgöra något problem för den som tillgodogjort sig kursinnehållet. Vid rättningen infördes dock en "slarvmarginal" så att ett fel fortfarande gav godkänt. De tentander som missade två av frågorna fick betyget Fx med möjlighet att muntligt komplettera.

Andra tentadelen bestod av mer traditionella problemlösnings- och utredningsfrågor av varierande svårighetsgrad. Poängtalet avgjorde betyget på kursen. Även de tentander som kompletterat från Fx fick betyg baserat på poängtalet på andra tentadelen.

Kurslitteratur

Kursboken (Mitchell) definierar ganska väl kursinnehållet. Boken är förvånansvärt dyr. En annan nackdel med boken är att den är ganska gammal (1997), vilket naturligtvis inte är bra i ett område som utvecklas så snabbt som detta.

Teknikerna bagging och boosting beskrivs inte i boken och vi har därför kompletterat med några allmänna artiklar som beskriver dessa metoder.

Studentsynpunkter

Vid kursens slut gjordes en enkät som besvarades av 9 studenter. Resultatet finns här. De flesta tycker att det är en rolig kurs och är också nöjda med själva genomförandet. Föreläsningarna är uppskattade och den kritik som framförts är genomgående positiv.

När det gäller laborationerna är studenterna också genomgående nöjda. Laboration 1 får kommentarer om att den är lite för lätt (det är nästan ingen egen programmering i den) medan den andra labben upplevs som lite väl svår.

Kursens belastning för studenterna

Allt tyder på att belastningen för studenterna är "lagom".

Förkunskaper

Studenterna har varierande förkunskaper men det verkar ändå som att de flesta har kunnat tillgodogöra sig kursinnehållet. Alla anger i enkäten att de hade tillräckliga förkunskaper.

Planerade förändringar

Vi bör fortsätta att utreda ifall det finns en nyare och billigare kursbok som passar för kursen.

Copyright © Sidansvarig: Örjan Ekeberg <orjan@nada.kth.se>
Uppdaterad 2008-05-14