Pretraživanje hrvatskog leksičkog n-gramskog sustava na Hadoop platformi

Sažetak na hrvatskom: Velike količine podataka zahtijevaju veće brzine obrade podataka, a jedno računalo ne može izvršavati takav posao u prihvatljivom vremenu. Radi toga je paralelna obrada podataka sve više u uporabi, a jedan od tih modela obrade podataka implementiran je u platformi Hadoop. Platf...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:45096/Details
Glavni autor: Marić, Petar (-)
Ostali autori: Randić, Mirko (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, P. Marić, 2014.
Predmet:
LEADER 02675na a2200241 4500
003 HR-ZaFER
005 20160516012009.0
008 160221s2014 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid1094 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Marić, Petar  |9 35598 
245 |a Pretraživanje hrvatskog leksičkog n-gramskog sustava na Hadoop platformi :  |b završni rad /  |c Petar Marić ; [mentor Mirko Randić]. 
246 1 |a Searching Croatian lexical n-gram system on Hadoop platform  |i Naslov na engleskom:  
260 |a Zagreb,  |b P. Marić,  |c 2014. 
300 |a 41 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Telekomunikacije i informatika, šifra smjera: 42, datum predaje: 2014-06-13, datum završetka: 2014-07-14 
520 3 |a Sažetak na hrvatskom: Velike količine podataka zahtijevaju veće brzine obrade podataka, a jedno računalo ne može izvršavati takav posao u prihvatljivom vremenu. Radi toga je paralelna obrada podataka sve više u uporabi, a jedan od tih modela obrade podataka implementiran je u platformi Hadoop. Platforma Hadoop sastoji se od nekoliko komponenti pri čemu svaka obavlja neki posao kao što je mapiranje blokova unutar Hadoop-ovog distribuiranog datotečnog sustava, raspodjela resursa po računalima unutar klastera, upravljanje pokrenutim aplikacijama, itd. Kako hrvatski jezik ima veliku količinu riječi, zadatak - pronalaženje digrama i trigrama unutar velikih količina podataka, moguće je riješiti upotrebom Hadoop platforme što je vidljivo iz rezultata mjerenja prikazanih u ovom radu. 
520 3 |a Sažetak na engleskom: Large amounts of data require greater processing speed, and a computer can not perform such work in eligible time. Therefore the parallel processing increasingly in use, and one of these models of data processing is implemented in Hadoop platform. Hadoop platform consists of several components whereby each performs a job such as mapping of blocks within Hadoop's distributed file system, the allocation of resources by the computers in the cluster, manage running applications, etc. As Croatian language has a large amount of words, task - finding digrams and trigrams within large amounts of data, it is possible to solve using the Hadoop platform which is evident from results of the measurements presented in this work. 
653 1 |a Hadoop, MapReduce, YARN, Mapper, Reducer, Java, Hrvatski leksički n-gramski sustav, Digrami 
653 1 |a Hadoop, MapReduce, YARN, Mapper, Reducer, Java, Croatian lexical n-gram system, Digram 
700 1 |a Randić, Mirko  |4 ths  |9 5665 
942 |c Z  |2 udc 
999 |c 45096  |d 45096