Usporedba algoritama za strojno učenje u procesu izgradnje prediktivnih modela za predviđanje odlaska klijenata

Sažetak na hrvatskom: Privlačenje novog korisnika u telekom industriji je vrlo skupo, do nekoliko puta skuplje nego zadržavanje postojećeg. Zbog toga se telekom operateri okreću dubinskoj analizi podataka kako bi se iz podataka o korištenju usluga pokušalo predvidjeti da li će neki korisnik prijeći...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:50413/Details
Glavni autor: Tunjić, Aleksandar (-)
Ostali autori: Vrdoljak, Boris (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, A. Tunjić, 2016.
Predmet:
LEADER 02473na a2200229 4500
003 HR-ZaFER
008 160221s2016 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid4468 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Tunjić, Aleksandar 
245 1 0 |a Usporedba algoritama za strojno učenje u procesu izgradnje prediktivnih modela za predviđanje odlaska klijenata :  |b diplomski rad /  |c Aleksandar Tunjić ; [mentor Boris Vrdoljak]. 
246 1 |a Comparison of machine learning algorithms in the process of predictive model creation for client churn prediction  |i Naslov na engleskom:  
260 |a Zagreb,  |b A. Tunjić,  |c 2016. 
300 |a 80 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 54, datum predaje: 2016-07-01, datum završetka: 2016-09-29 
520 3 |a Sažetak na hrvatskom: Privlačenje novog korisnika u telekom industriji je vrlo skupo, do nekoliko puta skuplje nego zadržavanje postojećeg. Zbog toga se telekom operateri okreću dubinskoj analizi podataka kako bi se iz podataka o korištenju usluga pokušalo predvidjeti da li će neki korisnik prijeći konkurenciji. Postoji više metoda dubinske analize podataka, a razlikuju se po pristupu u složenosti. U ovom radu je provedena analiza i čišćenje podataka telekom operatera, te su izgrađeni i uspoređeni sljedeći modeli: logistička regresija, PLS, slučajne šume i GBM. Također, provedena je i usporedba navedenih algoritama nad izvedenim podacima dobivenim generatorom varijabli. 
520 3 |a Sažetak na engleskom: Attaining a new customer in telecom industry is a few times more expensive than retaining an existing customer. This is why telecom operators use data mining approach to try predict if a customer is going to stop using its services and become a client of a competing telecom. There are few data mining methods and they all differ in approach and complexity. In this thesis the process of data analysis and cleaning was done followed by building models: logistic regression, PLS, random forests and GBM. A comparison of results was done on data attained from original and generated variables. 
653 1 |a Dubinska analiza podataka  |a telekomunikacijska industrija  |a prediktivni algoritmi 
653 1 |a Data mining  |a telecom industry  |a predictive algorithms  |a churn 
700 1 |a Vrdoljak, Boris  |4 ths 
942 |c Y 
999 |c 50413  |d 50413