Språkteknologi
Kursbunt och läsanvisningar för sprakt10
Kursbunten kommer i år att endast vara elektronisk.
Papper som delas ut under kursens gång kommer att finnas i en hylla
utanför studentexpeditionen.
Kursbuntens innehåll
- Två exempeltentor.
2009 års tenta.
2008 års tenta.
Och dessutom En exempeltenta finns här
- Artiklar och utdrag ur böcker
- Carlberger, J., Domeij, R., Kann, V. & Knutsson, O. (2006, submitted). The development and performance of a grammar checker for Swedish: A language engineering perspective (pdf).
- Dahl, Ö. (1982). Nominalfraser, sid. 28-42 ur Grammatik, Studentlitteratur. (Delas ut)
- Dalianis, H. (2000). SweSum - A Swedish Text Summarizer (pdf) Technical report TRITA-NA-P0015, IPLab-174, KTH Nada.
- Hassel, M. (2004). Summaries and the process of summarization. Utdrag ur kapitel 1 i Martin Hassels licentiatavhandling "Evaluation of Automatic Text Summarization. A practical implementation.", KTH Nada.
- Kann, J., Domeij, R., Hollman, J. & Tillenius, M. (1998). Implementation aspects and applications of a spelling correction algorithm (pdf). NADA report TRITA-NA-9813, KTH Nada.
-
Nerbonne, J. (2003). Computer-Assisted Language Learning and Natural Language Processing In R. Mitkov (Ed.), Handbook of Computational Linguistics (pp. 670-698): Oxford University Press.
- Nivre, J. (2002). On Statistical Methods in Natural Language Processing . In Bubenko, J. & Wangler, B. (eds) Promote IT. Second Conference for the Promotion of Research in IT at New Universities and University Colleges in Sweden. University of Sk?vde, 684-694.
- Rosell, M. (2009). Introduction to Information Retrieval and Text Clustering, Magnus Rosell, utdrag ur Magnus Rosells doktorsavhandling, kurshäfte KTH CSC.
- Sahlgren, M. (2005). An Introduction to Random Indexing (pdf) Paper presented at Methods and
Applications of Semantic Indexing Workshop at the 7th International
Conference on Terminology and Knowledge Engineering, TKE 2005, August
16, Copenhagen, Denmark.
- Artiklar som ej inkluderas i kursbunten men som är relevanta för kursen
- Karlgren, J. (2000). Information retrieval: Statistics and linguistics. A short introduction to textual information retrieval. (ps) Första delen i Jussi Karlgrens doktorsavhandling "Stylistic experiments in Information Retrieval", Institutionen för lingvistik, Stockholms universitet.
- Karlström, P., Cerratto Pargman, T. och Ramberg, R. (2004). Tools, Language Technology and Communication in Computer Assisted Language Learning, Kapitel i antologin Writing and digital media.
- Knutsson, O. (2001). Granskas regelspråk (pdf)
- Hovy, E.H. & Lin, C. (1999). Automated Text Summarization in SUMMARIST I I. Mani and M. Maybury (eds.), Advances in Automated Text Summarization. MIT Press.
- Brin, S. & Page, L. (1998).
The Anatomy of a Large-Scale Hypertextual Web Search Engine Om sökmotorn Google.
- Steinbach, M., Karypsis, G. & Kumar, V. (2000).
A Comparison of Document Clustering Techniques. KDD-2000 Workshop on Text Mining, Boston, USA.
- Laborationsanvisningar (delas ut under kursens gång).
- Föreläsningsanteckningar (delas ut under kursens gång).
Läsanvisningar för kursbok och kursbunt kopplade till föreläsningar
(Kursbunten kompletterar kursboken se nedan). Kursbokshänvisningarna är ännu så länge endast till den äldre upplagan.
Föreläsning |
Kapitel i kursboken |
Artikel i kursbunten |
Introduktion till språkteknologi |
1 |
  |
Formella språk och syntaxanalys |
2, 12.1-12.2, 13.1, 16.1 |
  |
Morfologi, morfologisk analys, särdrag och lexikon |
3 |
  |
Språkstatistik 1: ordfrekvenser |
Inledning till kap. 4 samt 4.1. och 4.8 |
  |
Språkstatistik 2: informationsteori och markovmodeller |
Avsnitt 4.2-4.6 (utom 4.5.2-4.5.3), 4.10-4.11, 6.1-6.4. |
  |
Stavningskontroll |
3.10-3.11 |
Kann, J., Domeij, R., Hollman, J. & Tillenius, M. (1998). |
Syntax |
12 |
  |
Parsning |
13 |
  |
Datorstöd för skrivande och grammatikkontroll |
6.6 (äldre upplagan), sid. 461 (nya) |
Carlberger, J., Domeij, R., Kann, V. & Knutsson, O. (2006, submitted). |
Informationssökning |
17.3-17.5 (äldre) 23, 23.1, 20.7 (nya) |
Rosell, M. (2009). Kapitel 2. |
Semantik |
16 (äldre), 19 (nya) |
  |
Statistisk lexikal semantik |
20, 20.7 (nya) |
Sahlgren, M. (2005). |
Textkategorisering och klustring |
17 (äldre), 20.2 och 20.10 (nya) |
Rosell, M. (2006).Kapitel 3.
|
Diskurs |
18 |
  |
Språkgenerering |
20 |
  |
Textsammanfattning |
17.4 (äldre) 23.3-23.7 (nya) |
Dalianis, H. (2000).
|
Utvärdering av språkteknologiska system |
Olika "Methodology boxes" |
Hassel, M. (2004). |
Automatisk utvärdering |
Olika "Methodology boxes" |
  |
Språkinlärning: mänsklig och datorstödd |
Området ej beskrivet i boken |
Nerbonne, J (2003). |
Språkstatistik 3: Ordtaggning och probabilistisk parsning |
8, 12 (äldre) kap. 5 (nya) |
  |
Språkinlärning: maskinell |
8.5-8.6, 17.2, 4.5 (äldre) 5.5, 5.6, 20, 22 (nya) |
Nivre, J. (2002). |
Lokalisering och internationalisering |
tba |
  |
Maskinöversättning |
21 (äldre) 25 (nya) |
  |
Dialogsystem |
19 (äldre) 24 (nya) |
  |
Talteknologi |
7(äldre) 7-11 (nya) |
  |
|