Språkteknologi
Informationssökning
Magnus Rosell
Innehåll
Hur funkar en sökmotor? Är sökmotorer bra?
- Indexering
- Term-dokument-matrisen
- stopplistor
- tf och idf
- normalisering
- Likhetsmått
- Evaluering
- Precision
- Täckning (recall)
- Google och Page Rank
- Användaraspekter
Kurslitteratur
Mer litteratur
Exempel på tentafråga
Fråga
Ge exempel på två skilda bruk av informationssökningssystem
där det kan vara motiverat att i det ena fallet optimera precision
och i det andra täckning.
Svar
Hög täckning: Forskare som söker efter material till en rapport eller jurister som söker efter prejudikat till ett rättsfall behöver i stort sett allt som skrivits om någonting tidigare. De är nog beredda att tröska igenom en del skräp för att vara säkra på det.
Hög precision: Journalister eller uppsatskrivande skolelever behöver ett par tre översikter - om ens det - för att kunna utföra sin uppgift. De tål nog inte att leta efter sina texter över flera skärmsidor dokumentreferenser.