Raspodijeljeni sustav za preporučivanje na platformi Apache Spark

Sažetak na hrvatskom: U ovom radu izrađen je raspodijeljeni sustav za preporučivanje. Algoritam preporučivanja temeljen je na suradnji korisnika i korištenju matrice sličnosti objekata preporučivanja. Za izračun matrice sličnosti, podržano je nekoliko različitih mjera sličnosti, koje na temelju ulaz...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:49863/Details
Glavni autor: Popić, Filip (-)
Ostali autori: Pripužić, Krešimir (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, F. Popić, 2017.
Predmet:
LEADER 03182na a2200229 4500
003 HR-ZaFER
008 160221s2017 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid4960 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Popić, Filip 
245 1 0 |a Raspodijeljeni sustav za preporučivanje na platformi Apache Spark :  |b diplomski rad /  |c Filip Popić ; [mentor Krešimir Pripužić]. 
246 1 |a A Distributed Recommender System on Apache Spark  |i Naslov na engleskom:  
260 |a Zagreb,  |b F. Popić,  |c 2017. 
300 |a 65 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2017-06-29, datum završetka: 2017-07-11 
520 3 |a Sažetak na hrvatskom: U ovom radu izrađen je raspodijeljeni sustav za preporučivanje. Algoritam preporučivanja temeljen je na suradnji korisnika i korištenju matrice sličnosti objekata preporučivanja. Za izračun matrice sličnosti, podržano je nekoliko različitih mjera sličnosti, koje na temelju ulaznih statistika o korisničkim konzumacijama, računaju sličnost za sve parove objekata. Pri izračunu matrice sličnosti, omogućen je postupak normiranja redaka matrice sličnosti. Za izračun korisničkih preporuka, podržane su tri različite tehnike matričnog množenja u raspodijeljenoj okolini. Postupak predobrade podataka ostvaren je u programskom jeziku C++, dok su sve funkcionalnosti preporučitelja ostvarene u programskom jeziku Scala, uz korištenje programskog okvira Apache Spark koji omogućava raspodijeljeno izvođenje. Testiranje i evaluacija performanci implementiranog algoritma preporučivanja obavljeni su na računalnom grozdu, korištenjem stvarnih podataka iz odabranog studijskog slučaja. 
520 3 |a Sažetak na engleskom: The result of this thesis is a distributed recommender system based on the item-item collaborative filtering. The recommendation algorithm builds an item-item similarity matrix based on the collaboratively collected data on user-item interactions, for all users in the system. The recommendation algorithm supports several similarity measures including a vector normalisation of rows in the matrix. Moreover, the recommendation algorithm supports three different distributed matrix multiplication algorithms. The entire recommender system source code is written in Scala programming language based on Apache Spark. However, the data pre-processing scripts are written in C++ programming language executed in a single-node environment. The tests and performance evaluation of the implemented algorithm were executed on a Cloudera cluster using real dataset obtained from the particular case study. 
653 1 |a sustavi za preporučivanje  |a raspodijeljena obrada  |a suradno filtriranje  |a mjere sličnosti  |a Scala  |a Apache Spark  |a MLlib  |a Breeze  |a rijetke matrične strukture  |a matrično množenje 
653 1 |a recommender systems  |a distributed computing  |a collaborative filtering  |a similarity measures  |a Scala  |a Apache Spark  |a MLlib  |a Breeze  |a sparse matrix representations  |a matrix multiplication 
700 1 |a Pripužić, Krešimir  |4 ths 
942 |c Y 
999 |c 49863  |d 49863