Utjecaj značajki podatkovnog skupa na rezultate prediktivne dubinske analize podataka
Sažetak na hrvatskom: Tema ovog rada je ispitivanje utjecaja značajki podatkovnog skupa na rezultate prediktivne analize podataka. U tu svrhu izabrana su tri skupa podataka s različitim značajkama te je nad njima provedena dubinska analiza podataka s pomoću algoritama za izgradnju stabla odlučivanja...
Permalink: | http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:48281/Details |
---|---|
Glavni autor: | Bregar, Dijana (-) |
Ostali autori: | Banek, Marko (Thesis advisor) |
Vrsta građe: | Drugo |
Impresum: |
Zagreb,
D. Bregar,
2015.
|
Predmet: |
dubinska analiza podataka
> klasifikacija
> stabla odlučivanja
> mjere podjele atributa
> podrezivanje stabla
> ID3
> C4.5
> CART
> evaluacija
> točnost
> Weka
data mining
> classification
> decision trees
> splitting criterion
> pruning
> ID3
> CART
> C4.5
> evaluation
> accuracy
> Weka
|
LEADER | 03024na a2200229 4500 | ||
---|---|---|---|
003 | HR-ZaFER | ||
008 | 160221s2015 ci ||||| m||| 00| 0 hr d | ||
035 | |a (HR-ZaFER)ferid4551 | ||
040 | |a HR-ZaFER |b hrv |c HR-ZaFER |e ppiak | ||
100 | 1 | |a Bregar, Dijana | |
245 | 1 | 0 | |a Utjecaj značajki podatkovnog skupa na rezultate prediktivne dubinske analize podataka : |b diplomski rad / |c Dijana Bregar ; [mentor Marko Banek]. |
246 | 1 | |a Influence of Dataset Characteristics on Predictive Data Mining Analysis Results |i Naslov na engleskom: | |
260 | |a Zagreb, |b D. Bregar, |c 2015. | ||
300 | |a 60 str. ; |c 30 cm + |e CD-ROM | ||
502 | |b diplomski studij |c Fakultet elektrotehnike i računarstva u Zagrebu |g smjer: Telekomunikacije i informatika, šifra smjera: 53, datum predaje: 2015-02-06, datum završetka: 2015-02-11 | ||
520 | 3 | |a Sažetak na hrvatskom: Tema ovog rada je ispitivanje utjecaja značajki podatkovnog skupa na rezultate prediktivne analize podataka. U tu svrhu izabrana su tri skupa podataka s različitim značajkama te je nad njima provedena dubinska analiza podataka s pomoću algoritama za izgradnju stabla odlučivanja. Na početku rada dan je uvod u dubinsku analizu podataka te je definiran osnovni pojam klasifikacije i stabla odlučivanja. Objašnjen je postupak izgradnje stabla odlučivanja i opisane su neke od najčešćih mjera odabira atributa koje se pri tome koriste. Prikazani su i mogući problemi u modeliranju metodom stabla odlučivanja s naglaskom na pretreniranost stabla te su opisane najčešće metode za podrezivanje. U nastavku je prikazan način evaluacije dobivenog modela te usporedbe rezultata dobivenih evaluacijom različitih modela. U završnom dijelu rada dan je kratki opis programskog alata Weka te su prikazani rezultati analize provedene nad odabranim skupovima podataka. | |
520 | 3 | |a Sažetak na engleskom: The purpose of this thesis was to investigate the influence of the data set features on the results of predictive data analysis. Three data sets with different features were chosen and data mining algorithms for building decision trees were used. Firstly, an introduction to data mining is given and the basic concepts of classification and decision trees are explained. Decision tree induction and some of the most commonly used splitting criteria are described. A possible problems in the building the decision trees with an emphasis on overfitting are presented and the most common pruning methods are described. Next, the model evaluation and results comparison methods are explained. The last chapter gives a description of the data mining software Weka and shows the results of the data mining analysis. | |
653 | 1 | |a dubinska analiza podataka |a klasifikacija |a stabla odlučivanja |a mjere podjele atributa |a podrezivanje stabla |a ID3 |a C4.5 |a CART |a evaluacija |a točnost |a Weka | |
653 | 1 | |a data mining |a classification |a decision trees |a splitting criterion |a pruning |a ID3 |a CART |a C4.5 |a evaluation |a accuracy |a Weka | |
700 | 1 | |a Banek, Marko |4 ths | |
942 | |c Y | ||
999 | |c 48281 |d 48281 |