bild
Skolan för
elektroteknik
och datavetenskap

Utbytesformat för ordboksresurser i projektet Nordisk nätordbok

Viggo Kann har i samråd med övriga projektmedlemmar utarbetat ett XML-format för utbyte av ordboksresurser inom projektet. Formatet bygger på TEI, och är en förenklad version av TEI dictionary base tag set.

Enda utvidgningarna jämfört med TEI är för elementen def, som tillåts innehålla trans-element, och index, som tillåts ha innehåll, nämligen textsträngar och gramGrp-element.

De flesta element i formatet är valfria. Obligatoriska data är title, principal, källspråk och uppslagsord.

Den som skapar egna resurser i XML-formatet måste validera att kodningen överensstämmer med definitionen. Med programmet xmllint validerar man till exempel minfil.xml med kommandot

xmllint --noout --dtdvalid ordbog.dtd minfil.xml

^ Upp till Nordisk nätordbok - Tvärslå och Tvärsök.

Sidansvarig: Viggo Kann <viggo@nada.kth.se>
Uppdaterad 2006-06-20