Algoritmi održavanja sumarnih tablica i materijaliziranih pogleda u skladištima podataka

Osvježavanje sumarnih tablica i materijaliziranih pogleda unutar skladišta podataka predstavlja opsežnu tematiku prvenstveno zbog raznolikosti perspektiva i dimenzija iz kojih se mogu promatrati skladišta podataka i u njima definiranih sumarnih objekata. Zbog toga je razvijeno niz algoritama koji...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:29260/Details
Glavni autor: Delaš, Tomislav (-)
Ostali autori: Baranović, Mirta (Thesis advisor)
Vrsta građe: Knjiga
Jezik: hrv
Impresum: Zagreb : T. Delaš ; Fakultet elektrotehnike i računarstva, 2004.
LEADER 05685nam a2200217uu 4500
005 20190322172317.0
008 s2004 ci a |||||||||| ||hrv|d
035 |a HR-ZaFER 33649 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
041 |a hrv 
080 |a 681.3  |h PRECIZNI MEHANIZMI I INSTRUMENTI  |j OPREMA ZA OBRADU PODATAKA  |e 681  |9 1740 
100 1 |9 30656  |a Delaš, Tomislav 
245 |a Algoritmi održavanja sumarnih tablica i materijaliziranih pogleda u skladištima podataka :  |b magistarski rad /  |c Tomislav Delaš ; [mentor Mirta Baranović] 
260 |a Zagreb :  |b T. Delaš ; Fakultet elektrotehnike i računarstva,  |c 2004. 
300 |a 119 str. :  |b ilustr. ;  |c 30 cm. +  |e CD 
520 |a Osvježavanje sumarnih tablica i materijaliziranih pogleda unutar skladišta podataka predstavlja opsežnu tematiku prvenstveno zbog raznolikosti perspektiva i dimenzija iz kojih se mogu promatrati skladišta podataka i u njima definiranih sumarnih objekata. Zbog toga je razvijeno niz algoritama koji se mogu primjenjivati za osvježavanje skladišta podataka. Ovaj rad sistematski analizira različite metode i algoritme za osvježavanje skladišta podataka. Prvo se analiziraju algoritmi za inkrementalno trenutno osvježavanje materijaliziranih pogleda, koji osiguravaju trenutnu konzistentnost i sinkroniziranost stanja skladišta sa izvornim podacima, ali predstavljaju značajno opterećenje na produkcijske aplikacije, koje u sklopu svog redovnog funkcioniranja moraju uključiti i osvježavanje skladišta. Zatim se analiziraju algoritmi za inkrementalno periodičko (npr. dnevno, tjedno, mjesečno) osvježavanje skladišta, koji prikupljene promjene nad izvornim podacima implementiraju nad stanjem skladišta periodički, sa zadrškom. Time se dozvoljava da stanje skladišta ne bude sinkronizirano sa stanjem izvornih podataka, ali u sustavima za podršku poslovnom odlučivanju i statističkim izvještajima u pravilu nije potrebno imati najsvježije stanje skladišta. Treću skupinu algoritama obuhvaćaju algoritmi održavanja skladišta koji za vrijeme izvršavanja svojih transakcija održavanja omogućuju istovremene korisničke upite prema skladištu podataka. To je posebno korisno u primjenama skladišta gdje ne postoji rezervirano vrijeme samo za transakcije održavanja, već konzistentno skladište mora biti dostupno korisnicima za upite 24 sata dnevno. Zatim se posebno analiziraju skladišta podataka koja sadrže materijalizirane poglede koji se mogu samoodržavati, tj. računati svoje novo stanje korištenjem postojećeg stanja i promjena nad izvornim podacima, bez pristupanja izvornim podacima. U svom drugom dijelu, ovaj rad opisuje praktičnu implementaciju i verifikaciju algoritama na jednom produkcijskom modelu skladišta podataka, uz preporuke za korištenje određenih algoritama ovisno o željenom načinu osvježavanja skladišta i tipu definiranih materijaliziranih pogleda unutar skladišta. Ključne riječi: skladište podataka, neposredno održavanje, periodičko održavanje, osvježavanje, materijalizirani pogledi, tablica promjena, algoritam, činjenična tablica, dimenzijske tablice, samoodržavanje. 
520 |a Maintenance of aggregate tables and materialized views inside data warehouses is a large and highlighted subject, primarily due to difference of perspectives and approaches of viewing at data warehouses and their summarized objects. Therefore has been developed a series of algorithms that can be applied to refresh data warehouses. This work systematically analyzes different methods and algorithms for data warehouse maintenance. The algorithms for incremental immediate refresh of materialized views have been first analyzed, which ensure current consistency and synchronization of warehouse content with source data, but incur serious burden on production application systems, which in line of their standard functionality must include warehouse maintenance too. After that are laid out algorithms for incremental periodical (daily, weekly, monthly…) warehouse refreshing, which periodically apply collected changes on source data to warehouses. This way is tolerated the fact that the warehouse state is not up to date and synchronized with source data state, but in business decision support systems and statistical reports the fresh data warehouse content is often not required. Third category of warehouse maintenance algorithms encompasses those, which during executing of their maintenance transactions enable concurrent user queries against data warehouse. This is specially applicable to warehouse implementations where there is no reserved time only for maintenance transactions, but consistent contents of data warehouse must be available to user queries 24 hours a day. Then are separately analyzed data warehouses consisting materialized views which are selfmaintanable: they can do selfmaintainance by means only of their current contents and changes of source data, with no need to access to the source data. In its second part, this work describes practical implementation and verification of algorithms on a production model of data warehouse, with usage recommendation of particular algorithms according to the preffered way of warehouse maintenance and the type of defined materialized views inside data warehouses. Keywords: data warehouse, immediate maintenance, periodical maintenance, refreshing, materialized views, change table, algorithm, fact table, dimension tables, selfmaintenance. 
700 |4 ths  |9 4004  |a Baranović, Mirta 
942 |c M  |2 udc 
990 |a 31455 
999 |c 29260  |d 29260