|
|
|
|
LEADER |
04295na a2200229 4500 |
003 |
HR-ZaFER |
008 |
160221s2019 ci ||||| m||| 00| 0 hr d |
035 |
|
|
|a (HR-ZaFER)ferid7128
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Britvec, Darko
|9 40095
|
245 |
1 |
0 |
|a Filtriranje geoprostornog toka podataka korištenjem platforme Apache Spark :
|b završni rad /
|c Darko Britvec ; [mentor Krešimir Pripužić].
|
246 |
1 |
|
|a Filtering of Geospatial Data Streams using Apache Spark Platform
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b D. Britvec,
|c 2019.
|
300 |
|
|
|a 45 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b preddiplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 39, datum predaje: 2019-06-14, datum završetka: 2019-07-12
|
520 |
3 |
|
|a Sažetak na hrvatskom: Cilj ovog rada je stvaranje učinkovitog raspodijeljenog sustava za filtriranje geoprostornog toka podataka korištenjem platforme Apache Spark. Arhitektura korištena u implementaciji programskog rješenja naziva se „objavi-pretplati“. Objave u sustavu predstavljaju poruke formata GeoJSON koje sadrže geoprostornu značajku (točku, liniju, poligon) te dodatne informacije. Pretplate u sustavu predstavljaju poligoni u prostoru uz koje vežemo dodatne značajke. Tok podataka implementiran je pomoću alata Apache Kafka. Za konzumaciju toka podataka koristi se Spark Streaming koji tok obrađuje u dijelovima koji se mogu primiti u određenom vremenskom intervalu (engl. micro-batch). Za filtriranje geoprostornih podataka korištena je programska knjižnica GeoSpark koja dodatno koristi knjižnice Java Topology Suite i Geotools. Učinkovito filtriranje prostornih podataka ostvareno je pomoću particioniranja skupa pretplata pomoću različitih strategija particioniranja. Izlaz sustava je poruka u formatu JSON koja sadrži identifikator objave i pripadne pretplate. U evaluaciji rješenja isprobane su strategije particioniranja pomoću Hilbertove krivulje, KDB-stabla, Q-stabla i R-stabla. Dodatno, za poboljšanje rezultata ispitano je i korištenje geoprostornih indeksa ostvarenih pomoću R-stabla i Q-stabla. U evaluaciji je također ispitan utjecaj korištenja pričuvne memorije za spremanje skupa pretplata.
|
520 |
3 |
|
|a Sažetak na engleskom: The goal of this paper is to create an efficient distributed system for filtering of geospatial dana streams using the Apache Spark platform. Architecture used in the implementation is based on publish-subscribe pattern. Incoming messages in system carry a geospatial feature (eg. point, line or polygon on Earth) and some additional data formatted with GeoJSON specification. Geospatial subscriptions represent a set of polygons on Earth with some additional data. Geospatial data stream is implemented with Apache Kafka tool. Spark Streaming platform is used for consuming the incoming messages. It handles messages in portions (micro-batches) consumed within a time interval. GeoSpark library along with Java Topology Suite and GeoTools are used for processing the geospatial data. The effectiveness of geospatial filtering is improved with partitioning of the subscriptions dataset by using a different partitioning strategies. The system output consists of the identifiers of both messages corresponded subscriptions. Partitioning strategies used in the experiment are ones based on Hilbert curve, KDB-tree, Q-tree and R-tree. Additionally, evaluations examined the impact of using geospatial indexes based on Q-tree and R-tree and also the impact of using the cache functionality for persisting the subscription dataset in the memory of worker processes.
|
653 |
|
1 |
|a raspodijeljeni sustav
|a Apache Spark
|a objavi-pretplati
|a geoprostorni tok
|a GeoJSON
|a Apache Kafka
|a Spark Streaming
|a GeoSpark
|a Java Topology Suite
|a Geotools
|a particioniranje
|a Hilbertova krivulja
|a Voronoijev dijagram
|a R-stablo
|a Q-stablo
|a KDB-stablo
|a prostorni indeks
|
653 |
|
1 |
|a distributed system
|a Apache Spark
|a publish-subscribe
|a geospatial data stream
|a GeoJSON
|a Apache Kafka
|a Spark Streaming
|a GeoSpark
|a Java Topology Suite
|a Geotools
|a partitioning
|a Hilbert curve
|a Voronoi diagram
|a R-tree, Q-tree
|a KDB-tree
|a geospatial index
|
700 |
1 |
|
|a Pripužić, Krešimir
|4 ths
|9 32607
|
942 |
|
|
|c Z
|
999 |
|
|
|c 50826
|d 50826
|