# coding: iso-8859-1 # Filter som kodar en termlista som XML enligt netordbogsformatet. # Version 1.1 # Skrivet av Viggo Kann viggo@kth.se 2005-11-27 # Uppdaterat av Viggo 2006-06-20 med hantering av kommateckensavskiljare # Fungerar i Python version 2.3.2 eller senare. # Indataformat: # Skriv termlistans namn på rad 1. # Skriv ditt namn på rad 2. # Skriv sedan termlistan med tabbtecken mellan de olika språken. # Första raden i termlistan ska bestå av språkkoderna (tabbskilda). # Exempel: # Skandinaviskt testlexikon # Mitt Namn # da no sv # avis avis tidning # dreje sig om dreie seg om handla om # import string import sys import datetime parts = {} words = {} langs = {} langtexts = {} langtexts['sv'] = 'svenska' langtexts['da'] = 'danska' langtexts['no'] = 'norska' langtexts['fi'] = 'finska' langtexts['is'] = 'isländska' langtexts['en'] = 'engelska' langtexts['nno'] = 'nynorsk' langtexts['fo'] = 'färöiska' print '' print '' print '' print '' print '' print ' ' print ' ' print ' '+sys.stdin.readline().strip()+'' print ' '+sys.stdin.readline().strip()+'' print ' ' print ' ' print ' ' print ' ' parts = sys.stdin.readline().strip().split(' '); nlangs = 0 for t in parts: if len(t)>0: langs[nlangs] = t nlangs += 1 for i in range(0,nlangs): if langs[i] in langtexts: langtext = langtexts[langs[i]] else: langtext = langs[i] sys.stderr.write('Språkkoden '+langs[i]+' är inte en av standardkoderna '); for t in langtexts: sys.stderr.write(t+' ') sys.stderr.write('\n') print ' '+langtext+'' print ' ' print ' ' print '' print '' print '' for line in sys.stdin: if len(line.strip())>0: parts = line.strip().split(' ') i = 0 print ' ' for t in parts: words = t.strip('"').split(',') # tar bort eventuella omgivande citattecken och bryter vid kommatecken for tt in words: if len(tt)>0: if i==0: print '
' print ' '+tt+'' print '
' else: print ' '+tt+'' i = i + 1 print '
' print '' print '
' print '
'