|
|
|
|
LEADER |
04001nam a2200229uu 4500 |
005 |
20190218091842.0 |
008 |
s2007 ci |||||||||| ||eng|d |
035 |
|
|
|a HR-ZaFER 34617
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
041 |
|
|
|a eng
|
080 |
|
|
|a 004.62
|h Podaci
|j Rukovanje podacima
|e 004.6
|9 2952
|
100 |
1 |
|
|9 30922
|a Banek, Marko
|
245 |
|
|
|a Automating the process of schema integration for heterogeneous data warehouses = Automatizacija procesa integracije shema heterogenih skladišta podataka :
|b doctoral thesis = doktorska disertacija /
|c Marko Banek ; [mentor Boris Vrdoljak, A Min Tjoa]
|
260 |
|
|
|a Zagreb :
|b M. Banek ; Fakultet elektrotehnike i računarstva,
|c 2007.
|
300 |
|
|
|a v, 193 str. :
|b shematski prikazi ;
|c 30 cm. +
|e CD
|
504 |
|
|
|a Bibliografija str. 169-174
|
520 |
|
|
|a U disertaciji se predlaze pristup za automatiziranu integraciju shema heterogenih skladista podataka.
Federativno skladiste podataka je logicka integracija skladista podataka koja se primjenjuje kada je zbog politike privatnosti
ili zakonskih ogranicenja nemoguca fizicka integracija.
Kako bi se omogucilo prevodjenje upita kod federativnog pristupa, potrebno je izvrsiti pronalazenje podudarnosti izmedju federativnog i
lokalnih skladista podataka.
Predlozena procedura integracije shema u stanju je razrijesiti heterogenosti medju strukturama skladista podataka specificnim za
višedimenzionalni konceptualni model: cinjenicama, mjerama, dimenzijama, agregacijskim razinama i dimenzijskim atributima.
Slicnosti medju strukturama shema skladista podataka racunaju se koristenjem semanticke i strukturne usporedbe.
Algoritmi za filtriranje, zasnovani na podudaranju u dvostranim grafovima, koriste izracunate vrijednosti slicnosti za stvaranje
nuznih pridruzivanja medju visedimenzionalnim strukturama.
Za pronalazenje podudarnosti medju agregacijskim razinama predlazu se pravila ogranicenja, s obzirom na nuznost ocuvanja djelomicnog
uredjaja u dimenzijskim hijerarhijama.
Ostvarena je programska izvedba cjelokupnog procesa u svrhu njegove verifikacije, kao i zbog potrebe odredjivanja koji su algoritmi za
filtriranje prikladni za pridruzivanje razlicitih visedimenzijskih struktura.
Kljucne rijeci:
skladiste podataka
integracija skladista podataka
federativno skladiste podataka
pronalazenje podudarnih shema
visedimenzionalni model podataka
semanticka slicnost
slicnost struktura
pridruzivanje
dvostrani grafovi
|
520 |
|
|
|a This doctoral thesis proposes an approach for automated schema integration of heterogeneous data warehouses.
A federated data warehouse is a logical integration of data warehouses applicable when physical integration is impossible due to
privacy policy or legal restrictions.
In order to enable the translation of queries in a federated approach, heterogeneous schemas of the federated and the local warehouses must be matched.
The proposed schema integration procedure is capable of solving heterogeneities among data warehouse structures specific to the
multidimensional conceptual model: facts, measures, dimensions, aggregation levels and dimensional attributes.
Similarities between warehouse schema structures are computed by using semantic and structural comparison.
Filter algorithms, based on bipartite graph matching, use the calculated similarity values for creating necessary mappings between multidimensional structures.
Restriction rules are proposed for aggregation level matching, as the partial order in dimension hierarchies must be preserved.
A software implementation of the entire process is provided in order to perform its verification and to determine the proper
filter algorithms for mapping different multidimensional structures.
Keywords:
data warehouse
data warehouse integration
federated data warehouse
schema matching
multidimensional data model
semantic similarity
structure similarity
mapping
bipartite graphs
|
700 |
|
|
|4 ths
|9 18055
|a Vrdoljak, Boris
|
942 |
|
|
|c D
|2 udc
|
990 |
|
|
|a 32377
|
999 |
|
|
|c 30209
|d 30209
|