pondelok 2. decembra 2013

Strojové učenie: Návrh projektu

Typ problému: Klasifikácia textu (v anglickom jazyku)
Projekt, ktorý plánujem vypracovať je zameraný na klasifikáciu filmových recenzií, ktoré sú reprezentované textovými dokumentmi vyššie spomenutého pôvodu. Súčasťou práce bude vhodné predspracovanie dokumentov, ich analýza a následná extrakcia atribútov, ktoré budú tvoriť reprezentáciu dát pripravených pre aplikáciu klasifikačnej metódy. Budem porovnávať úspešnosť klasifikácie viac než jednej metódy klasifikácie, spolu s kombináciou klasifikačných modelov modelov. Taktiež budem porovnávať rôzne extrakcie atribútov a ich vplyv na úspešnosť klasifikácie. Na záver je možnosť porovnať výsledky klasifikácií s klasifikáciou triviálnu heuristiku (napr. prítomnosť vulgarizmov v texte).

[PDF]

streda 16. mája 2012

Správa XI

Venoval som sa písaním textu 3. kapitoly týkajucej sa návrhu a 4. kapitoly. Pripravil som predbeznú formu prezentácie, ktorú odprezentujem na bakalárskom semináry.

streda 9. mája 2012

Správa X

Venoval som sa realizácii experimentov s porovnaním nástrojov a písaním príslušných textov 4. kapitoly o realizácii experimentu. Výsledkom čoho som si zvolil nástroj určený pre data mining RapidMiner. Kedže v prezentácii experimentu nebudem sa zameriavať na MSE ale na celkovú úspešnosť klasifikácie spomenutý nástroj je najviac vyhovujúci.

streda 2. mája 2012

Sprava IX

Tento týždeň som sa venoval písaniu a čisteniu textov v teoretickej časti.

Src: http://1.bp.blogspot.com/-9F-l1ML9j1Y/TZDQ3fvLDvI/AAAAAAAAAII/F_UMfZoId3I/s1600/neuron-network.jpg

streda 25. apríla 2012

Sprava VIII

Tento týždeň som venoval experimentu s feedforward sietou s použitím 3rd party java implementacie na realnych datach. Konkrétne dáta z bc. práce Mareka Mardiaka z 2008, pre porovnanie výsledkov, kde výsledky sú porovnateľé avšak priemerná chyba pre testovaciu množinu sa blížila 20% čo pre neurónovú sieť nie je ideálne. Avšak berúc do úvahy fakt, že úloha dolovania je predpoveď zemetrsení na zaklade polohy, hlbky a počtu stanic ktoré udalosť zaznamenali, je pravdepodobné že lepšie výsledky sa použitá metóda klasického backpropagation lepšie výsledky nedosiahne.


Uvediem ilustračný graf závislosti priemernej chyby od počtu epoch.
Konfiguracia:
- 4 vstupy (long., lat., depth, no. of stations)
- 1 výstup
- 3 vrstvový perceptron
- plne prepojený
- skryté vrstvy logistická aktivačna funkcia
- výstupná vrstva linearna aktivačna funkcia
- trenovanie 2000 epoch



streda 18. apríla 2012

Správa VII

V tohto tíždňovej správe zverejním predbežný obsah mojej bakalárskej práce. Rád by som zdôraznil slovo "predbežný". Obsah bude učite dopĺňovaný a nazvy budú upravované, aby lepšie vystihli myšlienku. Budem ho tíždenne aktualizovať v prípade zmeny. Zverejnená bude časť medzi úvodom a záverom, zvýšok považujte za samozrejmosť.


    Úvod
  1. Datamining
    1. Pojem datamining
    2. Historický vývoj
    3. Dátové sklady
    4. Pred-spracovanie
    5. Metódy a nástroje
    6. Využitie a budúcnosť
  2. Klasifikácia
    1. Využtie error backpropagation-learningu pri klasifikácii
    2. Model neurónu
    3. Perceptron
      1. Jedno-vrstvový perceptron
      2. Viac-vrstvový perceptron
    4. Učenie
    5. Pred-spracovanie
    6. Budúcnosť
  3. Navrh
    1. Charakteristika problému
    2. Návrh riešenia
  4. Experiment na reálnych dátach
    1. Popis datasetu
    2. Predspracovanie
    3. Výber nástroja
    4. Konfigurácia a realizácia
  5. Diskusia
    1. Porovnanie výsledkov experimentu
        Záver


Čo sa týka pokroku v práci úspešne pokračujem v písaní témy obsiahnutéj v 2. kapitole. Prišlo mi na um zopakovať experiment z bakalarskej práce Mareka Mardiaka z 2008, ktorý ho realizoval rozhodovacími stromami. Ja ho zrealizujem s pomocou backpropagation a tak budem vediet urobiť porovnanie.

streda 11. apríla 2012

Správa VI

Začal som vypracovávať drafty bakalarskej práce. Konkrétne sa mi podarilo vypracovať solídny základ teórie o data miningu a klasifikácii, ktoré už budú len upravované alebo doplňované podla potreby a začlenené do príslušných kapitol. Spoznámkoval som taktiež kľúčové poznatky o backpropagation učení pre viac vrstvový perceptron. Ďalej pokračujem písanim draftov o klasifikacii pomocou backpropagation.