Implementacija GML izvorišta podataka i tablica u distribuiranom sustavu za procesiranje tokova podataka

Sažetak na hrvatskom: Apache Flink je raspodijeljeni sustav za obradu tokova podataka koji ima veliku otpornost sustava na kvarove te mogućnost obrade podataka u stvarnom vremenu. Karakterizira ga visoka propusnost i niska latencija podataka. Kod same obrada podataka, razlikuju se ograničeni i neog...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:48632/Details
Glavni autor: Golik, Ivan (-)
Ostali autori: Galić, Zdravko (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, I. Golik, 2017.
Predmet:
LEADER 03219na a2200229 4500
003 HR-ZaFER
008 160221s2017 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid4981 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Golik, Ivan 
245 1 0 |a Implementacija GML izvorišta podataka i tablica u distribuiranom sustavu za procesiranje tokova podataka :  |b diplomski rad /  |c Ivan Golik ; [mentor Zdravko Galić]. 
246 1 |a Implementation of GML Data and Table Sources in a Distributed Data Stream Processing System  |i Naslov na engleskom:  
260 |a Zagreb,  |b I. Golik,  |c 2017. 
300 |a 66 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 54, datum predaje: 2017-06-29, datum završetka: 2017-09-20 
520 3 |a Sažetak na hrvatskom: Apache Flink je raspodijeljeni sustav za obradu tokova podataka koji ima veliku otpornost sustava na kvarove te mogućnost obrade podataka u stvarnom vremenu. Karakterizira ga visoka propusnost i niska latencija podataka. Kod same obrada podataka, razlikuju se ograničeni i neograničeni skupovi podataka, te su u skladu sa time moguća dva modela izvršavanja. To su model strujanja tokova podataka i model izvršavanja u serijama koji je poseban slučaj strujanja tokova podataka gdje su skupovi podataka ograničeni, ali se i dalje gledaju kao tok, zbog Flinkove arhitekture strujanja. Skupovi podataka mogu se učitavati u Flinkove strukture podataka iz vanjskih izvora ili kolekcija podataka. Implementirati će se proširenja izvorišta podataka i izvorišta tablica GML formatom zapisa geoprostornih objekata za model izvršavanja u serijama. Za model izvršavanja u serijama, Flink ima dva API-a za koja će biti korištena prilikom izrade rješenja: DataSet i Table API. Izgrađeno rješenje biti će generičko sa više mogućnosti i načina pozivanja, te otvoreno za daljnja proširenja.  
520 3 |a Sažetak na engleskom: Apache Flink is a distributed data stream processing system that has high system failure capability and the ability to process data in real-time. It is characterized by high throughput and low data latency. In data processing, Flink works with bounded and unbounded data sets and as such, has two models of execution : streaming and batch model. Batch model is special case of streaming model where data sets are strictly bounded , but represented as finite stream. Data sets can be loaded into Flink's data structures from external sources or data collections. Data sources and table sources will be extended with GML format for recording geospatial data in batch execution model. For batch execution model, Flink has two APIs that will be used in building the extensions: DataSet and Table API. Solution will be generic and open to further extensions , with many ways different possibilities of using desired result.  
653 1 |a Apache Flink  |a platforma  |a veliki skupovi podataka  |a GML  |a GeoTools,izvorišta podataka,izvorišta tablica 
653 1 |a Apache Flink,platform  |a big data  |a GML,GeoTools,data sources,table sources 
700 1 |a Galić, Zdravko  |4 ths 
942 |c Y 
999 |c 48632  |d 48632