Postupci strojnog učenja za popravljanje točnosti klasifikacije manjinskih klasa kod nebalansiranih skupova podataka

Sažetak na hrvatskom: Ovaj rad uspoređuje utjecaj postupaka za popravljanje točnosti i njihovih kombinacija na klasifikaciju manjinskih klasa kod nebalansiranih skupova podataka. Za potrebe eksperimentalnog vrednovanja razvijena je web aplikacija. Na temelju rezultata eksperimentalnog vrednovanja don...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:51157/Details
Glavni autor: Josipović, Marko (-)
Ostali autori: Jović, Alan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, M. Josipović, 2019.
Predmet:
LEADER 03034na a2200229 4500
003 HR-ZaFER
008 160221s2019 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid7074 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Josipović, Marko  |9 18008 
245 1 0 |a Postupci strojnog učenja za popravljanje točnosti klasifikacije manjinskih klasa kod nebalansiranih skupova podataka :  |b završni rad /  |c Marko Josipović ; [mentor Alan Jović]. 
246 1 |a Machine Learning Methods for Improving Classification Accuracy of Minority Classes on Unbalanced Datasets  |i Naslov na engleskom:  
260 |a Zagreb,  |b M. Josipović,  |c 2019. 
300 |a 19 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2019-06-14, datum završetka: 2019-07-12 
520 3 |a Sažetak na hrvatskom: Ovaj rad uspoređuje utjecaj postupaka za popravljanje točnosti i njihovih kombinacija na klasifikaciju manjinskih klasa kod nebalansiranih skupova podataka. Za potrebe eksperimentalnog vrednovanja razvijena je web aplikacija. Na temelju rezultata eksperimentalnog vrednovanja donesen je zaključak da odabir postupaka za popravljanje točnosti ovisi o karakteristikama skupa nad kojim se obavlja klasifikacija. Postupci ponovnog uzorkovanja koji su postigli najbolje rezultate nad skupovima podataka odabranima za vrednovanje su: SMOTE te kombinacije SMOTE+ADASYN, SMOTE+Random Under, SMOTE+ADASYN+NearMiss, SMOTE+ADASYN+Random Under, SMOTE+NearMiss+Random Under i kombinacija sva 4 postupka. Osim postupaka ponovnog uzorkovanja uspoređena su dva algoritma klasifikacije, rezultati pokazuju da je za klasifikaciju nebalansiranih skupova podataka ansambl klasifikatora balansirane slučajne šume prikladniji od algoritma knajbližih susjeda. 
520 3 |a Sažetak na engleskom: This paper compares the influence of methods and combinations of methods for improving classification accuracy of minority classes on unbalanced datasets. Web application has been developed for the purpose of experimental evaluation. Based on the results of the experimental evaluation, it was concluded that the choice of methods depends heavily on the characteristics of datasets on which the classification was performed. Resamplingmethodsthatachievedthebestresultsare: SMOTEandcombinations SMOTE+ADASYN, SMOTE+Random Under, SMOTE+ADASYN+NearMiss, SMOTE+ADASYN+RandomUnder,SMOTE+NearMiss+RandomUnderandthecombination of all 4 methods. In addition to resampling methods, the paper compares two classification algorithms. The results show that Balanced Random Forest ensemble is better suited for classification of unbalanced datasets than k Nearest Neighbors classifier. 
653 1 |a poduzorkovanje  |a naduzorkovanje  |a ansambl klasifikatora  |a matrica zabune  |a mjera F1 
653 1 |a undersampling  |a oversampling  |a ensemble of classifiers  |a confusion matrix  |a F1 score 
700 1 |a Jović, Alan  |4 ths  |9 33614 
942 |c Z 
999 |c 51157  |d 51157