Procjena performansi usluge YouTube na osnovu analize kriptiranog prometa uporabom tehnike strojnog učenja

Sažetak na hrvatskom: Ovaj rad nastao je u okviru projekta koji se bavi procjenom iskustvene kvalitete usluge YouTube na osnovu analize kriptiranog mrežnog prometa. Tokom projekta, razvijen je sustav YouQ, u svrhu prikupljanja podataka na klijentskom uređaju (Android pametnom telefonu) i u mreži. Su...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:49602/Details
Glavni autor: Oršolić, Irena (-)
Ostali autori: Skorin-Kapov, Lea (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, I. Oršolić, 2016.
Predmet:
LEADER 04490na a2200229 4500
003 HR-ZaFER
008 160221s2016 ci ||||| m||| 00| 0 en d
035 |a (HR-ZaFER)ferid4365 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Oršolić, Irena 
245 1 0 |a Procjena performansi usluge YouTube na osnovu analize kriptiranog prometa uporabom tehnike strojnog učenja :  |b diplomski rad /  |c Irena Oršolić ; [mentor Lea Skorin-Kapov]. 
246 1 |a YouTube performance estimation based on the analysis of encrypted network traffic using machine learning  |i Naslov na engleskom:  
260 |a Zagreb,  |b I. Oršolić,  |c 2016. 
300 |a 85 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Telekomunikacije i informatika, šifra smjera: 53, datum predaje: 2016-07-01, datum završetka: 2016-07-07 
520 3 |a Sažetak na hrvatskom: Ovaj rad nastao je u okviru projekta koji se bavi procjenom iskustvene kvalitete usluge YouTube na osnovu analize kriptiranog mrežnog prometa. Tokom projekta, razvijen je sustav YouQ, u svrhu prikupljanja podataka na klijentskom uređaju (Android pametnom telefonu) i u mreži. Sustav čini i YouQ poslužitelj za obradu i prikaz podataka. Fokus ovoga rada je na drugoj fazi projekta: korištenju algoritama strojnog učenja nad podacima prikupljenim sustavom YouQ kako bi se procjenila klasa iskustvene kvalitete video strujanja. Analizirani skup podataka sastoji se od 343 primjera opisana s 54 značajke mrežnog prometa i klasom iskustvene kvalitete ("high", "medium", "low"). Korištenjem "wrapper" metoda u alatu WEKA odabrani su podskupovi značajki za četiri algoritma strojnog učenja: Naive Bayes, SMO, J48, i Random Forest. Izgrađeni su klasifikacijski modeli korištenjem algoritma OneR i četiri prethodno navedena algoritma. Točnost klasifikacije je procijenjena i raspravljena. Rezultati pokazuju da je najtočniji model onaj stvoren koristeći algoritam Random Forest, s točnošću 74%. Najviše pogrešaka u procjeni dogodilo se između klasa "low" i "medium", u eksperimentima s promjenama mrežne propusnosti. Osim opisa metodologije manipulacije značajkama, izgradnje i evaluacije modela, ovaj rad pruža teoretske informacije o algoritmima strojnog učenja, kratki uvod u korištenje WEKA alata i statističku analizu podataka prikupljenih na klijentskom uređaju i u mreži. Također, kako bi skup podataka korišten za učenje bio što jasniji, opisano je laboratorijsko okruženje i metodologija prikupljanja podataka. 
520 3 |a Sažetak na engleskom: This thesis was completed in the scope of a project focused on YouTube QoE prediction based on encrypted network traffic. During this project, a system called YouQ was developed for the purpose of collecting data both on a client device (Android smartphone) and in the network. The system also includes the YouQ server for processing and visualizing data. This thesis focuses on the second phase of the project: using machine learning algorithms on data collected by the YouQ system to predict QoE classes of each YouTube video streaming session. The dataset that was analysed consists of 343 instances described with 54 network traffic features and a QoE class label ("high", "medium", "low"). The dataset was subset using wrapper methods in the WEKA machine learning tool for four machine learning algorithms: Naive Bayes, SMO, J48, and Random Forest. Classification models were created using OneR and the four listed algorithms. Classification accuracy was assessed and discussed. The results show that the most accurate was the model created using the Random Forest algorithm, with 74% accuracy. Most of the errors happened between classes "low" and "medium" and in the experiments with bandwidth fluctuations. Besides presenting the methodology of feature manipulation, model creation, and evaluation, this thesis provides theoretical information about algorithms, a short guide to using WEKA, and statistic analysis of both application-level and network-level data. Further, to better understand the dataset that was used as an input to machine learning algorithms, the experiment setup and data collection methodology has been described. 
653 1 |a klasifikacija mrežnog prometa  |a strojno učenje  |a iskustvena kvaliteta  |a YouTube 
653 1 |a network traffic classification  |a machine learning  |a Quality of Experience  |a YouTube 
700 1 |a Skorin-Kapov, Lea  |4 ths 
942 |c Y 
999 |c 49602  |d 49602