Memorijski učinkovita pohrana genotipova

Sažetak na hrvatskom: Razvojem novih i poboljšanih metoda sekvenciranja, te opadanjem cijene sekvenciranja, dolazi se do sve većih skupova genomskih podataka i to sve većom brzinom. Sukladno tome, javlja se problematika memorijski učinkovitog skladištenja takvih podataka. Razvijene su razne metode z...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:51602/Details
Glavni autor: Šandrk, Marko (-)
Ostali autori: Domazet-Lošo, Mirjana (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, M. Šandrk, 2019.
Predmet:
LEADER 03043na a2200229 4500
003 HR-ZaFER
008 160221s2019 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid7319 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Šandrk, Marko  |9 40893 
245 1 0 |a Memorijski učinkovita pohrana genotipova :  |b završni rad /  |c Marko Šandrk ; [mentor Mirjana Domazet-Lošo]. 
246 1 |a Memory-efficient genotype storage  |i Naslov na engleskom:  
260 |a Zagreb,  |b M. Šandrk,  |c 2019. 
300 |a 39 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2019-06-14, datum završetka: 2019-09-17 
520 3 |a Sažetak na hrvatskom: Razvojem novih i poboljšanih metoda sekvenciranja, te opadanjem cijene sekvenciranja, dolazi se do sve većih skupova genomskih podataka i to sve većom brzinom. Sukladno tome, javlja se problematika memorijski učinkovitog skladištenja takvih podataka. Razvijene su razne metode za sažeti prikaz genotipova, od posebnih formata zapisa do algoritama za sažimanje. Ipak, nijedna od dosadašnjih tehnika nije se pokazala dugoročno poželjnom. GenoType Compressor (GTC) novi je algoritam specijaliziran za sažimanje podataka o genotipovima zapisanim u „variant call formatu” (VCF). Prva istraživanja pokazuju njegovu premoć u stupnju kompresije, ali i u vremenu pristupa sažetim podacima nad sličnim algoritmima. U ovom radu implementirana je osnovna verzija algoritma GTC te su analizirane performanse algoritma s obzirom na različite ulazne skupove i parametre. Također, usporedio sam implementaciju ostvarenu u okviru ovog rada s originalnom implementacijom GTC-a.  
520 3 |a Sažetak na engleskom: With the development of new and improved sequencing methods and with the reducing costs of genotype sequencing, more and more data is being collected with increased rates. This leads us to a problem of managing memory-efficient storage of such data. Various different methods of compressed data representation have been developed ranging from special data formats to compression algorithms. However, neither of former methods proved to be sufficiently acceptable in the long term. GenoType Compressor (GTC) is a new algorithm highly specialised for compression of genotype data stored in „variant call format” (VCF). Preliminary research place GTC high above it's competition in terms of compression rate and lower data access times. In this paper, a basic version of GTC algorithm is implemented and its performance is analyzed on different input data sets. Moreover, the implementiation of GTC developed in this thesis is compared with the original implementation of GTC algorithm.  
653 1 |a kompresija genotipova, variant call format, GenoType Compressor, GTC algoritam, SNP 
653 1 |a genotype compression, GenoType Compressor, GTC algorithm, variant call format, SNP 
700 1 |a Domazet-Lošo, Mirjana  |4 ths  |9 31117 
942 |c Z 
999 |c 51602  |d 51602