|
|
|
|
LEADER |
03366nam a2200241uu 4500 |
005 |
20190305084539.0 |
008 |
s2006 ci a |||||||||| ||hrv|d |
035 |
|
|
|a HR-ZaFER 34288
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
041 |
|
|
|a hrv
|
080 |
|
|
|a 004.421:57
|h Računalno programiranje. Računalni programi
|j Algoritam s obzirom na biološke procese
|e 004.42
|9 2876
|
100 |
1 |
|
|9 31117
|a Domazet-Lošo, Mirjana
|
245 |
|
|
|a Usporedba postupaka dubinske analize primjenjenih nad biološkim podacima :
|b magistarski rad /
|c Mirjana Domazet-Lošo ; [mentor Mirta Baranović]
|
260 |
|
|
|a Zagreb :
|b M. Domazet-Lošo ; Fakultet elektrotehnike i računarstva,
|c 2006.
|
300 |
|
|
|a 88 str. :
|b graf. prikazi ;
|c 30 cm +
|e CD
|
504 |
|
|
|a Bibliografija str. 82-84.
|
520 |
|
|
|a Biološki procesi opisani su mnoštvom podataka prikupljenih promatranjima i eksperimentima. Kako bi se iz složene strukture bioloških podataka izlučile nove informacije koriste se metode dubinske analize podataka. S obzirom na složenost strukture podataka, prije same dubinske analize podatke je potrebno adekvatno pripremiti. Priprema podataka uključuje pročišćavanje podataka, integraciju i transformaciju podataka. U ovom je radu poseban naglasak stavljen na transformaciji podataka, posebno na metodama smanjivanja dimenzijske složenosti podataka. Podaci korišteni u praktičnom dijelu rada odnose se na gene za koje je potrebno predvidjeti utječu li na promatrani biološki sustav ili ne. S obzirom na problematiku, proučeni su postupci dubinske analize podataka s naglaskom na metode razvrstavanja (klasifikacije) podataka. Uspoređeni su odabrani algoritmi razvrstavanja, te je objašnjeno što je utjecalo na bolje, odnosno lošije rezultate odabranih algoritama. Uočeno je da najbolje rezultate daju algoritam VFI i algoritam 1-razred SVM.
Ključne riječi: dubinska analiza podataka, biološki podaci, smanjivanje dimenzijske složenosti podataka, algoritam razvrstavanja
|
520 |
|
|
|a Biological processes are described using huge amount of data collected through the observation and experiments. Data mining is used for interesting knowledge extraction. Due to data complexity, data mining process should succeed the process of cleaning data, integration of data from different sources and transformation of data. Considering the problems involved with the data set used in this work, the emphasis is set on the transformation of data, especially on the feature selection. Considering the given data set, the goal of the work is to learn a model that can predict whether the particular gene influences the specified biological system. The overview of data mining techniques is given with the special attention to classification algorithms, because the model for the given data set is build using classification algorithms. The comparison of classification algorithms showed that the best results are provided using VFI (Voting Feature Interval) algorithm and one-class SVM (Support Vector Machines) algorithm.
Keywords: data mining, biological data, feature selection, data classification methods
|
650 |
|
7 |
|a 68
|j Computer science {for papers involving machine computations and programs in a specific mathematical area, see section -04 in that area}
|9 5578
|2 msc
|
700 |
|
|
|4 ths
|9 4004
|a Baranović, Mirta
|
942 |
|
|
|c M
|2 udc
|
990 |
|
|
|a 32076
|
999 |
|
|
|c 29885
|d 29885
|