www-ai.cs.tu-dortmund.de/LEHRE/VORLESUNGEN/KDD/SS09/5DMVsvm3_4p.pdf
5DMVsvm3_4p
(F-measure)
Lerner TF/IDF repr. Original repr.
Apriori 63.35 30.24 J4.8 99.22 81.21 Naive Bayes 51.8 45.41 mySVM 97.95 16.06
37 von 46
LS 8 Informatik Computergestützte Statistik Technische Universität Dortmund [...] Textkategorisierung
Katharina Morik, Claus Weihs
LS 8 Informatik Computergestützte Statistik
Technische Universität Dortmund
9.6.2009
1 von 46
LS 8 Informatik Computergestützte Statistik Technische Universität [...] Bewährte Repräsentation:
TFIDF (wi, D) = TF (wi, d)IDF (wi, D)
√ ∑
j [TF (wj , d)IDF (wj , D)]2
8 von 46
LS 8 Informatik Computergestützte Statistik Technische Universität Dortmund
Web Mining Textklassifikation …