bild
Skolan för
elektroteknik
och datavetenskap

Språkteknologi

Informationssökning

Magnus Rosell

Innehåll

Hur funkar en sökmotor? Är sökmotorer bra?
  • Indexering
    • Term-dokument-matrisen
    • stopplistor
    • tf och idf
    • normalisering
  • Likhetsmått
  • Evaluering
    • Precision
    • Täckning (recall)
  • Google och Page Rank
  • Användaraspekter

Kurslitteratur

Mer litteratur

Exempel på tentafråga

Fråga

Ge exempel på två skilda bruk av informationssökningssystem där det kan vara motiverat att i det ena fallet optimera precision och i det andra täckning.

Svar

Hög täckning: Forskare som söker efter material till en rapport eller jurister som söker efter prejudikat till ett rättsfall behöver i stort sett allt som skrivits om någonting tidigare. De är nog beredda att tröska igenom en del skräp för att vara säkra på det.

Hög precision: Journalister eller uppsatskrivande skolelever behöver ett par tre översikter - om ens det - för att kunna utföra sin uppgift. De tål nog inte att leta efter sina texter över flera skärmsidor dokumentreferenser.

Copyright © Sidansvarig: Magnus Rosell <rosell@csc.kth.se>
Uppdaterad 2009-09-21