Typ problému: Klasifikácia textu (v anglickom
jazyku)
Projekt, ktorý plánujem vypracovať je zameraný
na klasifikáciu filmových recenzií, ktoré sú reprezentované
textovými dokumentmi vyššie spomenutého pôvodu. Súčasťou
práce bude vhodné predspracovanie dokumentov, ich analýza a
následná extrakcia atribútov, ktoré budú tvoriť reprezentáciu
dát pripravených pre aplikáciu klasifikačnej metódy. Budem
porovnávať úspešnosť klasifikácie viac než jednej metódy
klasifikácie, spolu s kombináciou klasifikačných modelov modelov.
Taktiež budem porovnávať rôzne extrakcie atribútov a ich vplyv
na úspešnosť klasifikácie. Na záver je možnosť porovnať
výsledky klasifikácií s klasifikáciou triviálnu heuristiku
(napr. prítomnosť vulgarizmov v texte).
[PDF]
[PDF]