MARC: Pretraživanje hrvatskog leksičkog n-gramskog sustava na Hadoop platformi

Pretraživanje hrvatskog leksičkog n-gramskog sustava na Hadoop platformi

Sažetak na hrvatskom: Velike količine podataka zahtijevaju veće brzine obrade podataka, a jedno računalo ne može izvršavati takav posao u prihvatljivom vremenu. Radi toga je paralelna obrada podataka sve više u uporabi, a jedan od tih modela obrade podataka implementiran je u platformi Hadoop. Platf...

Full description

Permalink:	http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:45096/Details
Glavni autor:	Marić, Petar (-)
Ostali autori:	Randić, Mirko (Thesis advisor)
Vrsta građe:	Drugo
Impresum:	Zagreb, P. Marić, 2014.
Predmet:	Hadoop, MapReduce, YARN, Mapper, Reducer, Java, Hrvatski leksički n-gramski sustav, Digrami Hadoop, MapReduce, YARN, Mapper, Reducer, Java, Croatian lexical n-gram system, Digram


LEADER	02675na a2200241 4500
003	HR-ZaFER
005	20160516012009.0
008	160221s2014 ci \|\|\|\|\| m\|\|\| 00\| 0 hr d
035			\|a (HR-ZaFER)ferid1094
040			\|a HR-ZaFER \|b hrv \|c HR-ZaFER \|e ppiak
100	1		\|a Marić, Petar \|9 35598
245			\|a Pretraživanje hrvatskog leksičkog n-gramskog sustava na Hadoop platformi : \|b završni rad / \|c Petar Marić ; [mentor Mirko Randić].
246	1		\|a Searching Croatian lexical n-gram system on Hadoop platform \|i Naslov na engleskom:
260			\|a Zagreb, \|b P. Marić, \|c 2014.
300			\|a 41 str. ; \|c 30 cm + \|e CD-ROM
502			\|b preddiplomski studij \|c Fakultet elektrotehnike i računarstva u Zagrebu \|g smjer: Telekomunikacije i informatika, šifra smjera: 42, datum predaje: 2014-06-13, datum završetka: 2014-07-14
520	3		\|a Sažetak na hrvatskom: Velike količine podataka zahtijevaju veće brzine obrade podataka, a jedno računalo ne može izvršavati takav posao u prihvatljivom vremenu. Radi toga je paralelna obrada podataka sve više u uporabi, a jedan od tih modela obrade podataka implementiran je u platformi Hadoop. Platforma Hadoop sastoji se od nekoliko komponenti pri čemu svaka obavlja neki posao kao što je mapiranje blokova unutar Hadoop-ovog distribuiranog datotečnog sustava, raspodjela resursa po računalima unutar klastera, upravljanje pokrenutim aplikacijama, itd. Kako hrvatski jezik ima veliku količinu riječi, zadatak - pronalaženje digrama i trigrama unutar velikih količina podataka, moguće je riješiti upotrebom Hadoop platforme što je vidljivo iz rezultata mjerenja prikazanih u ovom radu.
520	3		\|a Sažetak na engleskom: Large amounts of data require greater processing speed, and a computer can not perform such work in eligible time. Therefore the parallel processing increasingly in use, and one of these models of data processing is implemented in Hadoop platform. Hadoop platform consists of several components whereby each performs a job such as mapping of blocks within Hadoop's distributed file system, the allocation of resources by the computers in the cluster, manage running applications, etc. As Croatian language has a large amount of words, task - finding digrams and trigrams within large amounts of data, it is possible to solve using the Hadoop platform which is evident from results of the measurements presented in this work.
653		1	\|a Hadoop, MapReduce, YARN, Mapper, Reducer, Java, Hrvatski leksički n-gramski sustav, Digrami
653		1	\|a Hadoop, MapReduce, YARN, Mapper, Reducer, Java, Croatian lexical n-gram system, Digram
700	1		\|a Randić, Mirko \|4 ths \|9 5665
942			\|c Z \|2 udc
999			\|c 45096 \|d 45096

Pretraživanje hrvatskog leksičkog n-gramskog sustava na Hadoop platformi

Slični primjerci