bild
Skolan för
datavetenskap
och kommunikation
KTH / CSC / Kurser / DD2431 / mi08 / Course Analysis
Maskininlärning DD2431, Kursanalys 2008/2009

Maskininlärning DD2431, Kursanalys 2008/2009

Kursdata

  • Kursbeteckning:
    Maskininlärning, DD2431, 6 högskolepoäng
  • Läsperiod:
    Period 2, HT2008
  • Lärare:
    • Kursledare och föreläsare: Örjan Ekeberg
    • Extra föreläsare: Hedvig Kjellström
    • Handledare: Simon Benjaminsson, Jenny Tigerholm, David Silverstein, Johannes Hjorth
  • Schemalagd tid:
    • Föreläsningar: 22 timmar
    • Laborationer: ej schemalagda
  • Antal registrerade studenter: 76
  • Kurslitteratur:
    • Kursbok Mitchell: Machine Learning McGraw-Hill, 1997 ISBN: 0-07-115467-1
    • Laborationsanvisningar
      • Labb 1: Concept Learning and Decision Trees
      • Labb 2: Bayes Classifier and Boosting
      • Labb 3: Reinforcement Learning
      • Labb 4: Support Vector Machines
    • Utdelade artiklar m.m.
      • Schapire: A brief introduction to boosting
      • Quinlan: Bagging, boosting, and C4.5
  • Examination:
    Kursen examineras genom fyra obligatoriska laborationsuppgifter (3 poäng) samt en tentamen (3 poäng).
  • Resultat:
    Av de 76 studenter som registrerat sig på kursen har 66 gått upp på ordinarie tentamen och 66 har gjort någon laboration. Totalt är 63 klara med tentan (efter två tentatillfällen) och 61 klara med labbkursen.
  • Prestationsgrad: (63×3+61×3)/(66×6) = 94%
  • Examinationsgrad: 52/66 = 79%

Mål

Maskininlärning handlar om hur datorprogram automatiskt kan förbättra sitt beteende genom att utnyttja sina tidigare erfarenheter. Ämnet ligger i gränslandet mellan artificiell intelligens, statistik, informationsteori, biologi och reglerteknik. Målet med kursen är att ge grundläggande kännedom om de teorier och algoritmer som används inom området.

Sammanfattning

Antalet studenter tredubblades jämfört med förra årets kursomgång vilket ansträngde den bantade kursadministrationen och labbhandledningen. Kursboken är gammal och dyr och det är angeläget att hitta ett alternativ.

Undervisningen

Undervisningen har bestått av 11 tvåtimmarsföreläsningar som var och en har haft ett tydligt tema, t.ex. en algoritm eller en grupp av relaterade metoder. Hedvig Kjellström har varit föreläsare på de två föreläsningar som behandlar statistiska inlärningsmetoder medan Örjan Ekeberg har hållit i de övriga föreläsningarna. Dessutom har studenterna arbetat med fyra obligatoriska laborationer.

Antalet föreläsningstimmar minskades för kursen jämfört med föregående år. Dessutom ersattes laborationen om genetiska algoritmer med en laboration om supportvektor-maskiner som tidigare ingått i den nu nedlagda kursen DD2433 (ANNfk).

Kursen ges sedan förra året på engelska vilket gjort att vi i år har fått många studenter från de internationella mastersprogrammen. Studenterna är generellt vana vid undervisning på engelska och har förståelse för blandningen av svenska och internationella studenter. Som lärare upplever jag att det främmande språket kan dämpa diskussioner och frågor något.

Examination

Kursen examineras genom muntlig redovisning av de fyra laborationerna samt en skriftlig tentamen. Laborationsredovisningen sker genom att studenterna anmäler sig via ett webb-baserat bokningssystem för ett 10-minuters redovisningspass. Studenterna ska muntligt presentera sina resultat och insikter för en handledare, och förväntas vara förberedda med diagram o.dyl. på papper. Tanken med detta redovisningssätt är att flytta fokus från programmen till de resultat och insikter laborationen givit studenterna,

Tentamen består av ett antal frågor som testar förståelsen för hur de olika metoderna fungerar och vad de har för speciella egenskaper. Betyget sätts efter tentaresultatet men ett generöst bonussystem gör att de som redovisat alla laborationer i tid får lättare att få ett högre betyg.

Betygsättning

Betygen sätts på skalan A-F med mål definierade för varje betygsnivå. Tentamen delades upp i två delar där den första behandlade grundläggande kunskaper som krävs för godkänt medan den andra delen användes för att avgöra betygsnivån.

På den första tentadelen användes flervalsfrågor och för godkänt krävdes att fem (av sex) svar skulle vara rätt. Den till synes höga kravnivån motiveras av att alla frågorna var av grundläggande karaktär som inte borde utgöra något problem för den som tillgodogjort sig kursinnehållet. De tentander som missade två av frågorna fick betyget Fx med möjlighet att muntligt komplettera.

Andra tentadelen bestod av mer traditionella problemlösnings- och utredningsfrågor av varierande svårighetsgrad. Poängtalet avgjorde betyget på kursen. Även de tentander som kompletterat från Fx fick betyg baserat på poängtalet på andra tentadelen.

Kurslitteratur

Kursboken (Mitchell) definierar ganska väl kursinnehållet, med undantag för avsnittet om supportvektor-maskiner som är nytt från i år. Boken är förvånansvärt dyr. En annan nackdel med boken är att den är ganska gammal (1997), vilket naturligtvis inte är bra i ett område som utvecklas så snabbt som detta.

Teknikerna bagging och boosting beskrivs inte i boken och vi har därför kompletterat med några allmänna artiklar som beskriver dessa metoder.

Studentsynpunkter

Vid kursens slut gjordes en enkät som besvarades av 18 studenter. Resultatet finns här. Studenterna är generellt nöjda med kursen, både när det gäller innehållet och genomförandet. Bristen på handledning kommer fram i några svar, vilket inte är förvånande med tanke på den plötsliga uppgången av antalet studenter.

Kursboken får kritik för att vara dyr och att den inte täcker in alla kursmomenten. Några anser att kursen går igenom alltför många begrepp alltför ytligt, men andra uppskattar den översikt kursen ger.

Laborationerna upplevs som en viktig del av kursen. Vissa anser att programmeringsinslagen borde vara mer utmanande (mindre andel färdig kod) medan andra har fått jobba mycket med uppgifterna.

Kursens belastning för studenterna

Allt tyder på att belastningen för studenterna är "lagom".

Förkunskaper

Studenterna har varierande förkunskaper men det verkar ändå som att de flesta har kunnat tillgodogöra sig kursinnehållet. De flesta anger i enkäten att de hade tillräckliga förkunskaper.

Planerade förändringar

För att bättre passa de aktuella studentgruppernas schema kommer kursen nästa år att flyttas till period 4. Då laborationerna utgör en så viktig del av kursen finns det anledning att se över dem ytterligare.

Author: Örjan Ekeberg <orjan@nada.kth.se>

Date: 2009/05/12 12:51:18 PM

Copyright © Sidansvarig: Örjan Ekeberg <orjan@nada.kth.se>
Uppdaterad 2009-05-12