Praćenje objekata u videosnimkama pomoću dubokih mreža

Sažetak na hrvatskom: Rad analizira dvije metode dubokog učenja i jednu metodu s klasičnim pristupom za praćenje objekata u video zapisu, te moćan alat za održavanje modela izgleda. Metode dubokog učenja su duboka regresijska mreža i potpuno konvolucijska sijamska mreža, koja imaju svoje prednosti i...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:48581/Details
Glavni autor: Milošević, Denis (-)
Ostali autori: Subašić, Marko (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, D. Milošević, 2017.
Predmet:
LEADER 04450na a2200229 4500
003 HR-ZaFER
008 160221s2017 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid5256 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Milošević, Denis 
245 1 0 |a Praćenje objekata u videosnimkama pomoću dubokih mreža :  |b diplomski rad /  |c Denis Milošević ; [mentor Marko Subašić]. 
246 1 |a Object Tracking in Video Sequences Using Deep Networks  |i Naslov na engleskom:  
260 |a Zagreb,  |b D. Milošević,  |c 2017. 
300 |a 47 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2017-06-29, datum završetka: 2017-07-07 
520 3 |a Sažetak na hrvatskom: Rad analizira dvije metode dubokog učenja i jednu metodu s klasičnim pristupom za praćenje objekata u video zapisu, te moćan alat za održavanje modela izgleda. Metode dubokog učenja su duboka regresijska mreža i potpuno konvolucijska sijamska mreža, koja imaju svoje prednosti i ograničenja, ali nude jako dobar pristup rješavanju problema. Metoda klasičnog pristupa je praćenje pomoću kerneliziranih korelacijskih filtera. Radi se o metodi koja koristi teorijska saznanja iz područja obrade signala, te izvodi iznimno brzu metodu učenja temeljnu na linearnoj regresiji koristeći mnogobrojne matematike "trikove", kao što su kernelizacija algoritma i vrlo pametno korištenje svojstava cirkularnih matrica. Metoda pouzdanih sjećanja je metoda održavanja modela izgleda. Rastavlja model izgleda na komponentu dugoročnog i kratkotrajnog pamćenja. Pokazuje koliko brzo se zaboravljaju informacije tijekom online učenja, te nudi soluciju za održavanje informacija za dugoročno pamćenje. Pokazuje se da praćenje sudionika u sportskim događajima predstavlja poveći problem sustavima za praćenje objekata. Objekti koje pratimo (ljudi) u danom kontekstu izgledaju vrlo slično, a uz to imaju ogromnu slobodu gibanja i deformacija što otežava njihovo praćenje. Obrađene metode ipak rade vrlo dobro i u tim situacijama, te predstavljaju state-of-the-art na području praćenja objekata u video zapisima. 
520 3 |a Sažetak na engleskom: This thesis analyses two deep learning methods and one method with a classical approach for tracking object in video sequences, and one powerful tool for maintaining a useful appearance model. The deep learning methods are a deep regression network and a fully convolutional siamese network that have their positives and some limitations, but they still offer good performance. The method with the classic approach does tracking with kernelized correlation filters. This method uses well established theory from the field of signal processing and it derives a fast learning method for linear regression using a plethora of mathematical "tricks", like kernelization of the algorithm and clever usage of the circulant matrix properties. The method proposed for maintaining more a useful appearance model is called Tracking via Reliable Memories. It's a method that divides our appearance model into two components --- long and short term memory. It shows how fast current methods forget information, and it offers a solution to that problem. We also see that tracking participants in sporting events is a big problem for tracking systems, given the similarity between all participants (they are all human, and recordings often aren't of high enough quality) and the wealth of possible movements and deformations humans can do in those circumstances. The described methods still prove very useful for this problem, and they represent the state-of-the-art for tracking objects in video sequences. 
653 1 |a neuronske mreže, duboke mreže, duboki modeli, model izgleda, klasični pristup računalnom vidu, cirkularne matrice, pouzdana sjećanja, Fourierova transformacija, diskretna Fourierova transformacija, sijamska mreža, potpuno konvolucijska funkcija, sportski događaji, priprema podataka, strojno učenje 
653 1 |a neural networks, deep networks, deep models, appearance model, classic approach to computer vision, circulant matrix, reliable memories, Fourier Transformation, Discrete Fourier Transformation, siamese network, fully convolutional functions, sport events, data preparation, machine learning 
700 1 |a Subašić, Marko  |4 ths 
942 |c Y 
999 |c 48581  |d 48581