Strojno učenje pravila za klasifikaciju dokumenata

Sažetak na hrvatskom: Klasifikacija dokumenata je jedan od osnovnih i najvažnijih problema analize tekstnih dokumenata. Najčešće metode se baziraju na vektorskoj reprezentaciji vreće riječi karakteristične dokumentu i vrlo su učinkovite. Međutim, način rada takvih strojno učenih modela je obično izr...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:45224/Details
Glavni autor: Glavina, Stjepan (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, S. Glavina, 2014.
Predmet:
LEADER 02356na a2200241 4500
003 HR-ZaFER
005 20160516012012.0
008 160221s2014 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid983 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Glavina, Stjepan  |9 35513 
245 |a Strojno učenje pravila za klasifikaciju dokumenata :  |b završni rad /  |c Stjepan Glavina ; [mentor Jan Šnajder]. 
246 1 |a Machine Learning of Document Classification Rules  |i Naslov na engleskom:  
260 |a Zagreb,  |b S. Glavina,  |c 2014. 
300 |a 28 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2014-06-13, datum završetka: 2014-07-14 
520 3 |a Sažetak na hrvatskom: Klasifikacija dokumenata je jedan od osnovnih i najvažnijih problema analize tekstnih dokumenata. Najčešće metode se baziraju na vektorskoj reprezentaciji vreće riječi karakteristične dokumentu i vrlo su učinkovite. Međutim, način rada takvih strojno učenih modela je obično izrazito težak za tumačenje i ručno uređivanje. Zbog toga se predlaže drugi pristup klasifikaciji, a to je uz pomoć pravila. Prednost pravila jer što ih korisnik može lako interpretirati i uređivati. Rad se bavi klasifikacijom uz pomoć pravila u kombinaciji sa strojnim učenjem te uspoređuje učinkovitost sa klasifikatorom baziranim na SVM-u.  
520 3 |a Sažetak na engleskom: Document classification is one of basic and most important problems of textual document analysis. Most common methods are based on vector representation of words (bag of words) and are very effective. However, trained models developed by machine learning are difficult to interpret and edit by hand. Therefore, a different approach is suggested, namely, rule based classification. The advantage of rules is their simplicity; they are easy to interpret and edit. This paper discusses rule based classification in combination with machine learning and compares its effectiveness with an SVM based classifier.  
653 1 |a strojno učenje, klasifikacija dokumenata, RIPPER, SVM, pravila, lematizacija 
653 1 |a machine learning, document classification, RIPPER, SVM, rules, lemmatization 
700 1 |a Šnajder, Jan  |4 ths  |9 19016 
942 |c Z  |2 udc 
999 |c 45224  |d 45224