Praćenje objekata temeljeno na dubokom učenju
Sažetak na hrvatskom: U ovome radu ostvarena je reimplementacija rada Sadeghian et al. (2017), prikazane su komplikacije koje su se pojavile tijekom implementacije te njihova rješenja. Ekstraktor značajki VGG11 zauzimao je previše memorije pa je zamijenjen ResNet-18 koji postiže slične rezultate, a...
Permalink: | http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:50992/Details |
---|---|
Glavni autor: | Kovač, Grgur (-) |
Ostali autori: | Kalafatić, Zoran (Thesis advisor) |
Vrsta građe: | Drugo |
Impresum: |
Zagreb,
G. Kovač,
2019.
|
Predmet: |
duboko učenje
> praćenje više objekata
> gradijentni spust
> LSTM
> CNN
> MOT
> MOTA
> mAP
> detekcija objekata
> YOLO
> VGG
> ResNet
Deep learning
> Multiple Object Tracking
> Gradient descent
> LSTM
> CNN
> MOT
> MOTA
> mAP
> Object detection
> YOLO
> VGG
> ResNet
|
LEADER | 04169na a2200229 4500 | ||
---|---|---|---|
003 | HR-ZaFER | ||
008 | 160221s2019 ci ||||| m||| 00| 0 hr d | ||
035 | |a (HR-ZaFER)ferid6931 | ||
040 | |a HR-ZaFER |b hrv |c HR-ZaFER |e ppiak | ||
100 | 1 | |a Kovač, Grgur |9 40268 | |
245 | 1 | 0 | |a Praćenje objekata temeljeno na dubokom učenju : |b diplomski rad / |c Grgur Kovač ; [mentor Zoran Kalafatić]. |
246 | 1 | |a Object Tracking Based on Deep Learning |i Naslov na engleskom: | |
260 | |a Zagreb, |b G. Kovač, |c 2019. | ||
300 | |a 31 str. ; |c 30 cm + |e CD-ROM | ||
502 | |b diplomski studij |c Fakultet elektrotehnike i računarstva u Zagrebu |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2019-06-28, datum završetka: 2019-07-11 | ||
520 | 3 | |a Sažetak na hrvatskom: U ovome radu ostvarena je reimplementacija rada Sadeghian et al. (2017), prikazane su komplikacije koje su se pojavile tijekom implementacije te njihova rješenja. Ekstraktor značajki VGG11 zauzimao je previše memorije pa je zamijenjen ResNet-18 koji postiže slične rezultate, a zauzima manje memorije. Objašnjeni su detalji oko formiranja klasifikacijskoga skupa za učenje. Nakon što su ostvareni slični rezultati kao u ablacijskim eksperimentima iz Sadeghian et al. (2017), napravljeni su eksperimenti s istom arhitekturom, no s boljim detektorom i dodatnim podatcima. Tim eksperimentom je postignut napredak od $7$ MOTA. Konstruirana je nova podjela snimki zbog procjene da se sa starom podjelom teško može još poboljšati rezultat. Na novoj podjeli napravljeno je još eksperimenata. Nadalje, formirana je nova arhitektura bazirana na sličnim pretpostavkama kao i u Sadeghian et al. (2017). Ona je jednostavnija, a ostvaruje slične rezultate. Na novoj arhitekturi pokrenuti su eksperimenti s dodatno predtreniranim vizualnim ekstraktorom te dodatnim klasifikacijskim glavama. Pokazano je da oba dodatka pridonose rezultatu. Prikazan je zanimljiv problem "praćenja odbljesaka" te kako se taj problem donekle, no ne u potpunosti, može riješiti postprocesiranjem. Također, predstavljena je metoda postprocesiranja koja popunjavanjem trajektorija pomaže kod okluzija. Zaključno, najbolji model evaluiran je i na službenom skupu za testiranje 2DMOT2015 natjecanja na kojem je postigao rezultat 41.8 MOTA. | |
520 | 3 | |a Sažetak na engleskom: In this thesis, a reimplementation of the paper Sadeghian et al. (2017) was achieved. Various complications with implementation were discussed, as well as their solutions. The VGG11 feature extractor was taking up to much memory so it was replaced with ResNet-18. ResNet-18 achieves similar results but takes up considerably less memory. Details regarding the construction of the classification dataset were also discussed. After similar results to those presented in Sadeghian et al. (2017) were achieved, further experiments were conducted with a better detector and additional data. With those experiments, an improvement of 7 MOTA was achieved. Since not much improvement could be gained with the current train/test split, a new split was created. On the new split, additional experiments were run. Furthermore, a new architecture was presented based on similar assumptions as in Sadeghian et al. (2017). It is much simpler and achieves similar results. On the new architecture, experiments were run with pretrained visual feature extractor and additional classification heads. It was demonstrated that both approaches improve the performance. An interesting problem of "tracking reflections" was presented and how it can be partially solved in postprocessing. Furthermore, another postprocessing method was presented that help with occlusion by filling the trajectories. Finally, the best performing model was evaluated on the official 2DMOT2015 test set and achieved the result of 41.8 MOTA. | |
653 | 1 | |a duboko učenje |a praćenje više objekata |a gradijentni spust |a LSTM |a CNN |a MOT |a MOTA |a mAP |a detekcija objekata |a YOLO |a VGG |a ResNet | |
653 | 1 | |a Deep learning |a Multiple Object Tracking |a Gradient descent |a LSTM |a CNN |a MOT |a MOTA |a mAP |a Object detection |a YOLO |a VGG |a ResNet | |
700 | 1 | |a Kalafatić, Zoran |4 ths |9 8062 | |
942 | |c Y | ||
999 | |c 50992 |d 50992 |