Primjena grafova u klasifikaciji i grupiranju dokumenata

Sažetak na hrvatskom: Cilj je ovog rada demonstrirati primjenu reprezentacije teksta grafovima kako bismo povećali preciznost klasifikacije i grupiranju teksta. U prvom dijelu objašnjava se kako tekst pretvoriti u graf. Predstavljeni su i algoritmi za izračun sličnosti grafova koji su korišteni u če...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:49622/Details
Glavni autor: Obadić, Leo (-)
Ostali autori: Burić, Tomislav (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, L. Obadić, 2018.
Predmet:
LEADER 02497na a2200229 4500
003 HR-ZaFER
008 160221s2018 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid5707 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Obadić, Leo 
245 1 0 |a Primjena grafova u klasifikaciji i grupiranju dokumenata :  |b završni rad /  |c Leo Obadić ; [mentor Tomislav Burić]. 
246 1 |a Application of Graphs in Document Classification and Grouping  |i Naslov na engleskom:  
260 |a Zagreb,  |b L. Obadić,  |c 2018. 
300 |a 28 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2018-06-15, datum završetka: 2018-07-13 
520 3 |a Sažetak na hrvatskom: Cilj je ovog rada demonstrirati primjenu reprezentacije teksta grafovima kako bismo povećali preciznost klasifikacije i grupiranju teksta. U prvom dijelu objašnjava se kako tekst pretvoriti u graf. Predstavljeni su i algoritmi za izračun sličnosti grafova koji su korišteni u četiri obrađivane metode strojnog učenja (k-srednjih vrijednosti, k-reprezentanata, k-najbližih susjeda i kombinacija k-srednjih vrijednosti i k-najbližih susjeda). U drugom dijelu navedeni su eksperimentalni rezultati dobiveni u okviru programskog jezika Python. 
520 3 |a Sažetak na engleskom: In this paper we are trying to demonstrate application of graph models in machine learning, specifically in natural language analysis through basic clustering and classification methods. Firstly, articles gathered from few websites are preprocessed and converted to graphs and vectors. Then, those data structures are used for clustering and classification. Methods used for clustering are k-means and k-medoids but after small modifications they are also used for classification besides k-nearest neighbours method. Furthermore, new classification method that uses both clustering and k-nearest neighbours method was proposed. Finally, after testing, graphs showed better results due to lower information loss after text to graph conversion. 
653 1 |a strojno učenje  |a klasifikacija  |a grupiranje  |a najveći zajednički podgraf  |a k-srednjih vrijednosti  |a k-reprezentanata  |a k-najbližih susjeda  |a obrada prirodnog jezika 
653 1 |a machine learning  |a classification  |a clustering  |a maximal common subgraph  |a k-medoids  |a k-means  |a k-NN  |a natural language processing 
700 1 |a Burić, Tomislav  |4 ths 
942 |c Z 
999 |c 49622  |d 49622