|
|
|
|
LEADER |
04297nam a2200241uu 4500 |
005 |
20190212101259.0 |
008 |
s2008 ci a |||||||||| ||hrv|d |
035 |
|
|
|a HR-ZaFER 37211
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
041 |
|
|
|a hrv
|
080 |
|
|
|a 547.96
|j Proteini. Bjelančevine
|9 3065
|
080 |
|
|
|a 576.5
|j Stanične interakcije. intercelularno, međustanično spajanje. Stanične populacije. Ponašanje stanice u kulturi
|9 3066
|
100 |
1 |
|
|9 29535
|a Šikić, Mile
|
245 |
|
|
|a Računalna metoda za predviđanje mjesta proteinskih interakcija :
|b doktorska disertacija /
|c Mile Šikić ; [mentor Branko Jeren, Kristian Vlahoviček]
|
260 |
|
|
|a Zagreb :
|b M. Šikić ; Fakultet elektrotehnike i računarstva,
|c 2008.
|
300 |
|
|
|a ix, 123 str. :
|b graf.prikazi ;
|c 30 cm. +
|e CD
|
504 |
|
|
|a Bibliografija str. 106-113
|
520 |
|
|
|a Predmet je disertacije predviðanje mjesta proteinske interakcije na osnovi informacija iz slijeda i strukture proteina koji sudjeluju u interakciji. U radu se mjesto interakcije definira kao pomièni prozor od 9 ostataka, u kome je barem središnji ostatak mjesto dodira. Ostatak se definira da je u dodiru ako se njegov najbliži atom nalazi na manje od 6 A od najbližeg atoma ostatka koji pripada susjednom lancu. Na osnovi postojeæeg skupa za uèenje klasifikacija i provjera rezultata provedena je koristeæi metodu sluèajnih šuma i OR metode. OR metode, razvijene u ovom radu se temelje na kombiniranju klasifikatora i poboljšanju F-mjere pri radu s neuravnoteženim podacima. Za predviðanje mjesta interakcije iz prostorne strukture proteina uz slijed upotrijebljena su i ova svojstva: nepolarna ASA, maksimalna ukopanost, srednja ukopanost, minimalna izboèenost i hidrofobnost. Rezultati dobiveni u ovome radu za predviðanje na osnovi samo slijeda su bolji od dosadašnjih, a rezultati na osnovi podataka iz slijeda i prostorne strukture u rangu su rezultata najboljih metoda u ovom podruèju. Kroz analizu na 9 UCI skupova podataka primjena OR metode pokazala je poboljšanje rezultata. Na kraju rada, primjenom metode predviðanja na osnovi slijeda i prostorne strukture, predviðena su mjesta interakcije na Ras i C-Raf proteinima te je metodama prianjanja i molekularne dinamike dobivena struktura Ras-Raf kompleksa.
Kljuène rijeèi: proteinska meðudjelovanja, slijed aminokiselinskih ostataka, prostorna struktura, metoda sluèajnih šuma, klasifikacija, F-mjera, neuravnoteženi podaci, prianjanje
|
520 |
|
|
|a Prediction of protein-protein interaction sites using information from protein sequence and 3D structure is purposed in this thesis. The protein interaction site is defined as a slide window of 9 residues in which at least central residue is in contact with other chains. The aminoacid is in contact if its distance to the nearest heavy atom of a neighbour chain is less then 6 A. In this work it is used an existing non-redundant dataset which is classified using Random Forest and OR method. OR method, purposed in this thesis, is a method based on combining classifiers and improvement of F-measure in cases when data is imbalanced. The predictions are based on sequence alone or combination of sequence and 3D structure features. The following 3D features are used: sequence, non-polar ASA, maximal depth index, average depth index, minimal protrusion and hydrophobicity. The results obtained using prediction based only on sequence information are better for other in the field, while the results based on both sequence and 3D structure information is the rank of results of other authors. In addition OR method was tested on 9 UCI datasets, where it achieves improvement of the results comparing with methods based only on individual classifiers. Furthermore, using the information about the potential binding site determined by above mentioned methods the wild type Ras and the RBD (Ras Binding Domain) of
C-RAF1 were docked (by specifying the predicted binding site as a centre). Finally the obtained complex was energy minimised and subjected to molecular dynamics.
Keywords: protein – protein interactions, sequence, 3D protein structure, Radnom Forest, Classification, F-measure, imbalanced data, protein docking
|
700 |
|
|
|4 ths
|9 8697
|a Jeren, Branko
|
942 |
|
|
|c D
|2 udc
|
990 |
|
|
|a 32845
|
999 |
|
|
|c 32786
|d 32786
|