next up previous
Next: Problemformulering Up: Bakgrund Previous: Bakgrund

Kort om taggning

Taggning innebär att man ger varje ord i en text en ''tagg'', vilket är en samling värden som beskriver egenskaper hos ordet. En tagg kan t.ex. se ut som ''bilen <lemma=bil, wc=nn, num=sin, spec=def>'', vilket innebär att ordet ''bilen'' är ett substantiv i bestämd from singular och att grundformen är ordet ''bil''.

Vid taggning av text finns i huvudsak två angreppssätt, regelbaserad taggning och statistisk taggning. Regelbaserad taggning innebär att man ställer upp ett antal regler för vilken tagg ett ord ska tilldelas, medan statistiska metoder innebär att man första analyserar stora mängder text och lagrar statistik, t.ex. över vilka ord som brukar få vilken tagg.



Jonas Sjöbergh 2001-10-15