|
|
|
|
LEADER |
03034na a2200229 4500 |
003 |
HR-ZaFER |
008 |
160221s2019 ci ||||| m||| 00| 0 hr d |
035 |
|
|
|a (HR-ZaFER)ferid7074
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Josipović, Marko
|9 18008
|
245 |
1 |
0 |
|a Postupci strojnog učenja za popravljanje točnosti klasifikacije manjinskih klasa kod nebalansiranih skupova podataka :
|b završni rad /
|c Marko Josipović ; [mentor Alan Jović].
|
246 |
1 |
|
|a Machine Learning Methods for Improving Classification Accuracy of Minority Classes on Unbalanced Datasets
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b M. Josipović,
|c 2019.
|
300 |
|
|
|a 19 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b preddiplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2019-06-14, datum završetka: 2019-07-12
|
520 |
3 |
|
|a Sažetak na hrvatskom: Ovaj rad uspoređuje utjecaj postupaka za popravljanje točnosti i njihovih kombinacija na klasifikaciju manjinskih klasa kod nebalansiranih skupova podataka. Za potrebe eksperimentalnog vrednovanja razvijena je web aplikacija. Na temelju rezultata eksperimentalnog vrednovanja donesen je zaključak da odabir postupaka za popravljanje točnosti ovisi o karakteristikama skupa nad kojim se obavlja klasifikacija. Postupci ponovnog uzorkovanja koji su postigli najbolje rezultate nad skupovima podataka odabranima za vrednovanje su: SMOTE te kombinacije SMOTE+ADASYN, SMOTE+Random Under, SMOTE+ADASYN+NearMiss, SMOTE+ADASYN+Random Under, SMOTE+NearMiss+Random Under i kombinacija sva 4 postupka. Osim postupaka ponovnog uzorkovanja uspoređena su dva algoritma klasifikacije, rezultati pokazuju da je za klasifikaciju nebalansiranih skupova podataka ansambl klasifikatora balansirane slučajne šume prikladniji od algoritma knajbližih susjeda.
|
520 |
3 |
|
|a Sažetak na engleskom: This paper compares the influence of methods and combinations of methods for improving classification accuracy of minority classes on unbalanced datasets. Web application has been developed for the purpose of experimental evaluation. Based on the results of the experimental evaluation, it was concluded that the choice of methods depends heavily on the characteristics of datasets on which the classification was performed. Resamplingmethodsthatachievedthebestresultsare: SMOTEandcombinations SMOTE+ADASYN, SMOTE+Random Under, SMOTE+ADASYN+NearMiss, SMOTE+ADASYN+RandomUnder,SMOTE+NearMiss+RandomUnderandthecombination of all 4 methods. In addition to resampling methods, the paper compares two classification algorithms. The results show that Balanced Random Forest ensemble is better suited for classification of unbalanced datasets than k Nearest Neighbors classifier.
|
653 |
|
1 |
|a poduzorkovanje
|a naduzorkovanje
|a ansambl klasifikatora
|a matrica zabune
|a mjera F1
|
653 |
|
1 |
|a undersampling
|a oversampling
|a ensemble of classifiers
|a confusion matrix
|a F1 score
|
700 |
1 |
|
|a Jović, Alan
|4 ths
|9 33614
|
942 |
|
|
|c Z
|
999 |
|
|
|c 51157
|d 51157
|