Språkteknologi
Textklustring och -kategorisering
Magnus Rosell
Innehåll
Att automatiskt gruppera texter i på förhande bestämda
kategorier (kategorisering)
och att för en textmängd automatiskt hitta lämpliga kategorier (klustring).
- Klustring
- Representation: Term-dokument-matrisen
- Textklustringsalgoritmer
- Evaluering
- Kategorisering
- Vad är en genre? Vad menas med en kategori?
- Representation
- Inlärningsalgoritmer
- Stilmått
Kurslitteratur
Mer litteratur
- A Comparison of Document Clustering Techniques, Michael Steinbach, George Karypsis and Vipin Kumar, 2000.
-
Scatter/Gather: A Cluster-based Approach to Browsing Large Document Collections, Douglass R. Cutting, David R. Karger, Jan O. Pedersen, John W. Tukey, 1992.
-
Web Document Clustering: A Feasibility Demonstration, Oren Zamir, Oren Etzioni, 1998.
-
Projections for Efficient Document Clustering, Hinrich Schütze, Craig Silverstein, 1997.
- Introduction to Information Retrieval Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Cambridge University Press. 2008.
|