Računalne metode za poboljšanje i validaciju sastavljenih genoma

Sažetak na hrvatskom: Sekvenciranje jest postupak kojim se unutar odred¯ene sekvence utvrd¯uje tocˇan redoslijed pojedinih baza. Kako genome nije mogu´ce sekvencirati u cijelosti služimo se razliˇcitim raˇcunalnim postupcima (algoritmima) kako bi rekonstruirali (sastavili) polazni genom. Zadnji kora...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:45407/Details
Glavni autor: Županović, Vanessa (-)
Ostali autori: Šikić, Mile (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, V. Županović, 2014.
Predmet:
LEADER 04299na a2200241 4500
003 HR-ZaFER
005 20160516012017.0
008 160221s2014 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid1762 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Županović, Vanessa  |9 35425 
245 |a Računalne metode za poboljšanje i validaciju sastavljenih genoma :  |b diplomski rad /  |c Vanessa Županović ; [mentor Mile Šikić]. 
246 1 |a Computational approaches for refinement and validation of genome assemblies  |i Naslov na engleskom:  
260 |a Zagreb,  |b V. Županović,  |c 2014. 
300 |a 65 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2014-06-30, datum završetka: 2014-07-07 
520 3 |a Sažetak na hrvatskom: Sekvenciranje jest postupak kojim se unutar odred¯ene sekvence utvrd¯uje tocˇan redoslijed pojedinih baza. Kako genome nije mogu´ce sekvencirati u cijelosti služimo se razliˇcitim raˇcunalnim postupcima (algoritmima) kako bi rekonstruirali (sastavili) polazni genom. Zadnji korak u sastavljanju genoma predstavlja skafolding koji se u osnovi može svesti na problem utvrd¯ivanja orijentacije te redoslijeda vec´ prethodno djelomiˇcno sastavljenih sekvenci - kontiga, tj. pokušavamo smjestiti kontige u kontekst ˇcitavog genoma, naravno, trenutno ne postoje metode koje bi to uˇcinile sa sto postotnom toˇcnoš´cu, stoga unutar ovoga rada razvijamo više heuristiˇckih postupaka koji bi trebali smanjiti broj pogrešaka pri sastavljanju. Svi razvijeni postupci zasnivaju se na ˇcinjenici da je katkad vrlo teško jednoznaˇcno odrediti toˇcnu poziciju malog kontiga unutar genoma, stoga ga se može smjestiti na više pozicija u genomu bez da se naruši ijedan od uvjeta na bridove skafold grafa. Dakle, ono što ˇcinimo u svakom od razvijenih postupaka jest: detekcija višeznaˇcnih regija i uklanjanje nejednoznaˇcnosti micanjem kontiga koji uzrokuje nejednoznaˇcnost u zaseban skafold. Naravno, prilikom micanja kontiga na njegovoj prvotnoj poziciji stvaramo procjep, stoga je važno da na kraju procesiranja provjerimo je li mogu´ce ponovno popuniti procjepe nastale kao posljedica istog. Implementirane metode validirane su cjevovodom GAGE, a rezultati validacije pokazali su se kao vrlo obe´cavaju´ci , zbog ˇcega ´ce metode zasigurno poslužiti kao osnova za neka budu´ca istraživanje te potencijalna poboljšanja. 
520 3 |a Sažetak na engleskom: Sequencing is the process of determining the right order of nucleotides within the DNA molecule. However, we can not sequence the entire genome of certain organism at once, so we are forced to use different computational approaches (genome assembly methods) in order to reconstruct the initial sequence from the large amount of relatively small sequencing fragments. The last step in genome assembly is called scaffolding. Scaffolding can be visualized as the problem of ordering and orienting contigs and it is a crucial step in the assembly of high-quality draft genomes. Currently, there are no scaffolding methods that can produce 100% accurate scaffolds, so in this work we are introducing different heuristic algorithms which can significantly reduce the number of errors inside the existing scaffolds. All of our approaches are based on the fact that sometimes it is really difficult to correctly place small contigs inside genome which leads us to the problem od ambiguous order that we are trying to slove by detecting ambiguous regions inside scaffolds and removing contigs that are causing the ambiguity. After the removing wrongly scaffolded contigs, we must check if the gap (which was caused by contig removal) can be filled. The developed methods were evaluated using the GAGE pipeline. The results of evaluation seemed to be very promising which led as to the conclusion that our methods would make a good start for some future research and development of other similar approaches. 
653 1 |a GAGE, OPERA, sastavljanje genoma, sekvenciranje, skafolding, skafold graf 
653 1 |a GAGE, OPERA, genome assembly, genome sequencing, scaffolding, scaffold graph 
700 1 |a Šikić, Mile  |4 ths  |9 29535 
942 |c Y  |2 udc 
999 |c 45407  |d 45407