Språkteknologi
Kursbunt och läsanvisningar för sprakt08
Kursbunten kan köpas på CSC studentexpedition. Pris 60 kr.
Papper som delas ut under kursens gång kommer att finnas i en hylla
utanför studentexpeditionen.
Kursbuntens innehåll
- Två exempeltentor.
- Artiklar och utdrag ur böcker
- Carlberger, J., Domeij, R., Kann, V. & Knutsson, O. (2006, submitted). The development and performance of a grammar checker for Swedish: A language engineering perspective (pdf).
- Dahl, Ö. (1982). Nominalfraser, sid. 28-42 ur Grammatik, Studentlitteratur.
- Dalianis, H. (2000). SweSum - A Swedish Text Summarizer (html) Technical report TRITA-NA-P0015, IPLab-174, KTH Nada.
- Hassel, M. (2004). Summaries and the process of summarization. Utdrag ur kapitel 1 i Martin Hassels licentiatavhandling "Evaluation of Automatic Text Summarization. A practical implementation.", KTH Nada.
- Kann, J., Domeij, R., Hollman, J. & Tillenius, M. (1998). Implementation aspects and applications of a spelling correction algorithm (pdf). NADA report TRITA-NA-9813, KTH Nada.
- Karlström, P., Cerratto Pargman, T. och Ramberg, R. (2004). Tools, Language Technology and Communication in Computer Assisted Language Learning, Kapitel i antologin Writing and digital media.
- Nivre, J. (2002). On Statistical Methods in Natural Language Processing . In Bubenko, J. & Wangler, B. (eds) Promote IT. Second Conference for the Promotion of Research in IT at New Universities and University Colleges in Sweden. University of Sk?vde, 684-694.
- Rosell, M. (2006). Introduction to Information Retrieval and Text Clustering, Magnus Rosell, utdrag ur Magnus Rosells licentiatavhandling, kurshäfte KTH CSC.
- Sahlgren, M. (2005). An Introduction to Random Indexing (pdf) Paper presented at Methods and
Applications of Semantic Indexing Workshop at the 7th International
Conference on Terminology and Knowledge Engineering, TKE 2005, August
16, Copenhagen, Denmark.
- Artiklar som ej inkluderas i kursbunten men som är relevanta för kursen
- Karlgren, J. (2000). Information retrieval: Statistics and linguistics. A short introduction to textual information retrieval. (ps) Första delen i Jussi Karlgrens doktorsavhandling "Stylistic experiments in Information Retrieval", Institutionen för lingvistik, Stockholms universitet.
- Knutsson, O. (2001). Granskas regelspråk (pdf)
- Hovy, E.H. & Lin, C. (1999). Automated Text Summarization in SUMMARIST I I. Mani and M. Maybury (eds.), Advances in Automated Text Summarization. MIT Press.
- Brin, S. & Page, L. (1998).
The Anatomy of a Large-Scale Hypertextual Web Search Engine Om sökmotorn Google.
-
Nerbonne, J. (2003). Computer-Assisted Language Learning and Natural Language Processing In R. Mitkov (Ed.), Handbook of Computational Linguistics (pp. 670-698): Oxford University Press.
- Steinbach, M., Karypsis, G. & Kumar, V. (2000).
A Comparison of Document Clustering Techniques. KDD-2000 Workshop on Text Mining, Boston, USA.
- Laborationsanvisningar (delas ut under kursens gång).
- Föreläsningsanteckningar (delas ut under kursens gång).
Läsanvisningar för kursbok och kursbunt kopplade till föreläsningar
(Kursbunten kompletterar kursboken se nedan)
Föreläsning |
Kapitel i kursboken |
Artikel i kursbunten |
Introduktion till språkteknologi |
1 |
  |
Formella språk och syntaxanalys |
2, 9.1, 10.1-10.3 |
  |
Morfologi, morfologisk analys, särdrag och lexikon |
3 |
  |
Språkstatistik 1: ordfrekvenser |
6.1 |
  |
Språkstatistik 2: informationsteori och markovmodeller |
6 |
  |
Stavningskontroll |
5 |
Kann, J., Domeij, R., Hollman, J. & Tillenius, M. (1998). |
Syntax |
9 och 12.4 |
  |
Parsning |
10 |
  |
Datorstöd för skrivande och grammatikkontroll |
6.6 |
Carlberger, J., Domeij, R., Kann, V. & Knutsson, O. (2006, submitted). |
Informationssökning |
17 |
Rosell, M. (2006). Kapitel 2. |
Semantik |
16 |
  |
Statistisk lexikal semantik |
17 |
Sahlgren, M. (2005). |
Textkategorisering och klustring |
17 |
Rosell, M. (2006).Kapitel 3.
|
Diskurs |
18 |
  |
Språkgenerering |
20 |
  |
Textsammanfattning |
17.4 |
Dalianis, H. (2000).
|
Utvärdering av språkteknologiska system |
Olika "Methodology boxes" |
Hassel, M. (2004). |
Automatisk utvärdering |
Olika "Methodology boxes" |
  |
Språkinlärning: mänsklig och datorstödd |
Området ej beskrivet i boken |
Karlström, P., Cerratto Pargman, T. och Ramberg, R. (2004). |
Språkstatistik 3: Ordtaggning och probabilistisk parsning |
8, 12 |
  |
Språkinlärning: maskinell |
8.5-8.6, 17.2, 4.5 |
Nivre, J. (2002). |
Lokalisering och internationalisering |
tb |
  |
Maskinöversättning |
21 |
  |
Dialogsystem |
19 |
  |
Talteknologi |
7 |
  |
|