Detekcija anomalija u okruženju velikih podataka

Sažetak na hrvatskom: Anomalije su pojave koje su neobične i odstupaju od zakonitosti, pravila i uobičajenog. Detekcija anomalija ima primjenu u mnogim područjima, između ostalog i u kontekstu detekcije prijevara. U okruženju velikih podataka otvaraju se novi problemi koji se ne mogu riješiti primje...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:48406/Details
Glavni autor: Dundović, Ivan (-)
Ostali autori: Pintar, Damir (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, I. Dundović, 2017.
Predmet:
LEADER 03049na a2200229 4500
003 HR-ZaFER
008 160221s2017 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid4707 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Dundović, Ivan 
245 1 0 |a Detekcija anomalija u okruženju velikih podataka :  |b diplomski rad /  |c Ivan Dundović ; [mentor Damir Pintar]. 
246 1 |a Anomaly Detection in Big Data Environments  |i Naslov na engleskom:  
260 |a Zagreb,  |b I. Dundović,  |c 2017. 
300 |a 37 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 54, datum predaje: 2017-06-29, datum završetka: 2017-07-06 
520 3 |a Sažetak na hrvatskom: Anomalije su pojave koje su neobične i odstupaju od zakonitosti, pravila i uobičajenog. Detekcija anomalija ima primjenu u mnogim područjima, između ostalog i u kontekstu detekcije prijevara. U okruženju velikih podataka otvaraju se novi problemi koji se ne mogu riješiti primjenom tradicionalnih alata i tehnologija. Primjenom tehnologija za rad s velikim podacima, poput Apache Sparka, mnogi takvi problemi postaju rješivi i otvaraju se nove mogućnosti za detekciju anomalija. Prije svega, omogućuju obradu puno veće količine podataka i samim time pružaju više znanja o podacima. U radu je napravljena detekcija anomalija nad podacima o telefonskim pozivima koristeći Apache Spark. Za detekciju anomalija korištene su dvije metode: z-ocjena i algoritam k-srednjih vrijednosti. Osim Apache Sparka koji je korišten za obradu podataka i detekciju anomalija, korišten je programski jezik R za vizualizaciju i analizu konačnih rezultata.  
520 3 |a Sažetak na engleskom: Anomalies are observations that are unusual and deviate from rules and normal observations. Anomaly detection is applicable in numerous fields, especially in fraud detection.There are many problems in big data environments that cannot be solved using traditional tools and technologies. With the use of big data technologies, such as Apache Spark, many of those problems could be solved and new opportunities for anomaly detection would be made available. Those technologies allow for processing of big data while simultaneously increasing understanding of the data itself. In this thesis anomaly detection is done using Apache Spark on telephone calls data. For anomaly detection two methods have been used: z-score and k-means algorithm. Besides Apache Spark, which is used primarily for data processing and anomaly detection, R programming language is used for visualization and results analysis.  
653 1 |a anomalija  |a detekcija anomalija  |a veliki podaci  |a telekom  |a detekcija prijevara  |a Apache Spark  |a MLlib  |a strojno učenje  |a z-ocjena  |a k-srednjih vrijednosti  |a R 
653 1 |a anomaly  |a anomaly detection  |a big data  |a telecom  |a fraud detection  |a Apache Spark  |a MLlib  |a machine learning  |a z-score  |a k-means  |a R 
700 1 |a Pintar, Damir  |4 ths 
942 |c Y 
999 |c 48406  |d 48406