Next: Problemformulering
Up: Bakgrund
Previous: Bakgrund
Taggning innebär att man ger varje ord i en text en ''tagg'', vilket
är en samling värden som beskriver egenskaper hos ordet. En tagg kan
t.ex. se ut som ''bilen <lemma=bil, wc=nn, num=sin, spec=def>'',
vilket innebär att ordet ''bilen'' är ett substantiv i bestämd from
singular och att grundformen är ordet ''bil''.
Vid taggning av text finns i huvudsak två angreppssätt, regelbaserad
taggning och statistisk taggning. Regelbaserad taggning innebär att man
ställer upp ett antal regler för vilken tagg ett ord ska tilldelas,
medan statistiska metoder innebär att man första analyserar stora
mängder text och lagrar statistik, t.ex. över vilka ord som brukar få
vilken tagg.
Jonas Sjöbergh
2001-10-15