bild
Skolan för
elektroteknik
och datavetenskap

Språkteknologi

Laboration 2:
Grammatikkontroll

Syfte
Syftet med laborationen är att förstå uppbyggnaden av ett grammatikkontrollprogram genom att själv experimentera med det och skriva egna regler.
Uppgift
Uppgiften är att skriva regler som beskriver en rad språkliga felaktigheter eller problem och testa dem på en längre text.
Material
Beskrivning av Granskas regelspråk, exempelregel, demotext, fil med felexempel, testtext.
Hjälp
Om du behöver ytterligare hjälp; skicka e-post till knutsson@csc.kth.se
Redovisning
Redovisa på den ordinarie terminalövningen eller skicka dina lösningar till knutsson@csc.kth.se

Datormiljö

Laborationen kommer att genomföras med webbversionen av Granska. På webbsidan kan du skriva egna regler som antingen körs självständigt eller tillsammans med Granskas regler. Här finns en exempelregel

Deluppgift 1: Testa Granska

För att bekanta dig med reglerna och Granska ska du testköra programmet med en given regelsamling. Om du på webbsidan kryssar i rutan med texten: Använd våra exempelmeningar med många fel i och väljer Sänd iväg kommer du att få en bra överblick över vilka feltyper Granska klarar. Undersök resultatet, vad tycker du om granskningsresultatet? Vilka ytterligare fel borde ha hittats?

 

Allmän instruktion till deluppgifterna nedan

Formulera regler som beskriver de feltyper som omtalas i deluppgifterna nedan. Reglerna ska vara så generella som möjligt utan att ge upphov till för många falska alarm. Det går oftast inte att beskriva felen/problemen fullständigt med reglerna. Ibland kanske inte alla fel täcks av regeln eller också ger regeln upphov till falska alarm. Gör en avvägning mellan täckning och precision för att hitta en bra balans. Skriv gärna in egna exempel. Kommentera när du anser att en regel inte har tillräcklig täckning. Försök också komma på exempel som ger upphov till falska alarm. Varje deluppgift ska redovisas med:
  • Regel eller regler.
  • Kommentarer. Vilken typ av fel ska regeln/reglerna detektera? Allmänna kommentarer om regelspråk, granskningsfunktion och lexikon (inte obligatorisk).
  • Falska alarm: Hur många falska alarm uppstod i testtexten? I vilka andra språkliga situationer kommer falska alarm att uppstå? Hur ska de falska alarmen minimeras?
  • Uppskattning av regelns användbarhet: bra-ok-dålig.

Deluppgift 2: Fasta uttryck

Enligt Svenska skrivregler § 100 (se Svenska språknämnden) har sammanskrivning hävd i till exempel följande fall: förutom, häromdagen, häromkvällen, tillbaka och ibland. Särskrivning har hävd i till exempel följande fall: före detta, rent ut och så pass. Att komma ihåg när vanliga fasta uttryck skall vara sammanskrivna eller inte är ofta svårt. Din uppgift blir därför att skriva regler som detekterar och korrigerar följande fel (reglerna behöver inte klara några andra fall):

Exempel:
1. Lottas krog är ett trevligt ställe, för utom menyn som innehåller många felaktiga särskrivningar.
2. Härom dagen gick jag till baka och sa vad jag tyckte rentut.
3. I bland blir det fel i menyn, såpass många som härom kvällen är dock ovanligt, förklarar en föredetta anställd.

Kopiera här: Lottas krog är ett trevligt ställe, för utom menyn som innehåller många felaktiga särskrivningar. Härom dagen gick jag till baka och sa vad jag tyckte rentut. I bland blir det fel i menyn, såpass många som härom kvällen är dock ovanligt, förklarar en föredetta anställd.

Deluppgift 3: Subjektsform efter preposition

I dagens språkbruk blir det allt vanligare att skriva subjektsform efter preposition i stället för objektsform, särskilt framför ordet som. Vissa tycker att detta är en styggelse. Försök att hitta regler för följande exempel.

Exempel:
1. Han ondgör sig över de som skriver subjektsform efter preposition.
2. Dom gav en present till han på födelsedan.
3. De frågade han om han hade en tändsticka.

Kopiera här: Han ondgör sig över de som skriver subjektsform efter preposition. Dom gav en present till han på födelsedan. De frågade han om han hade en tändsticka.

Deluppgift 4: Dubbelsupinum

Dubbla supinum förekommer i talat språk men anses fel i skrivet språk.

Exempel:
1. Jag har inte kunnat sovit på hela veckan.
2. Han har inte hunnit åkt skidor en enda gång i år.

Kopiera här: Jag har inte kunnat sovit på hela veckan. Han har inte hunnit åkt skidor en enda gång i år.

Deluppgift 5: Kommer utan att

Kommer utan att börjar bli så vanligt att många inte längre anser att det är fel. Andra vill fortfarande undvika att skriva så.

Exempel:
1. Han kommer lista ut svaret på gåtan.
2. Nä, han kommer inte göra det.
3. Kommer han inte göra det?
4. Den man som kommer gillar jag inte.

Kopiera här: Han kommer lista ut svaret på gåtan. Nä, han kommer inte göra det. Kommer han inte göra det? Den man som kommer gillar jag inte.

Frivillig uppgift: Inkongruens i substantivfraser

Inte bara språkbrukare med svenska som andra språk gör böjningsfel som: en hus, den lilla huset. Många fall uppstår också som ordbehandlingseffekter, det kan till exempel vara tangentbordsfel eller när skribenten använder ersättfunktionen. Det går att åstadkomma inkongruens i nominalfraser på väldigt många sätt. Börja med att skriva regler för exemplen nedan.

Exempel:
1. Den gamla damen bor i ett rött villa.
2. Den nya dator som vi köpt är ett ganska värdelös maskin.
3. Jag drömmer om att bo i ett rött hus vid ett liten sjö.

Kopiera här: Den gamla damen bor i ett rött villa. Den nya dator som vi köpt är ett ganska värdelös maskin. Jag drömmer om att bo i ett rött hus vid ett liten sjö.

Teoretisk uppgift

Till varje laboration finns en teoriuppgift knuten. Syftet är att uppmuntra till tidigare inläsning av stoffet. Varje teoriuppgift skall redovisas på papper (ca. 100 ord) vid aktuellt labbtillfälle. Hur bonuspoängen fungerar beskrivs i KursPM. Teoriuppgifterna är inte obligatoriska utan skall ses som ett stöd för att utveckla de teoretiska kunskaperna i språkteknologi.

Fråga:Varför fokuserar man på speciella feltyper inom grammatikkontroll, och inte alla tänkbara fel? Motivera ditt svar.
Copyright © Sidansvarig: Johan Boye <jboye@nada.kth.se>
Uppdaterad 2011-09-01