www-ai.cs.tu-dortmund.de/LEHRE/VORLESUNGEN/KDD/SS11/FOLIEN/5MLVsvm3.pdf
Vorlesung Maschinelles Lernen - SVM – Textkategorisierung
(F-measure)
Lerner TF/IDF repr. Original repr. Apriori 63.35 30.24 J4.8 99.22 81.21 Naive Bayes 51.8 45.41 mySVM 97.95 16.06
37 von 46
LS 8 Informatik Computergestützte Statistik Technische Universität Dortmund [...] Textkategorisierung
Katharina Morik, Claus Weihs
LS 8 Informatik Computergestützte Statistik
Technische Universität Dortmund
24.5.2011
1 von 46
LS 8 Informatik Computergestützte Statistik Technische U [...] Bewährte Repräsentation:
TFIDF (wi, D) = TF (wi, d)IDF (wi, D)√∑ j [TF (wj , d)IDF (wj , D)]2
8 von 46
LS 8 Informatik Computergestützte Statistik Technische Universität Dortmund
Web Mining Textklassifikation …