|
|
|
|
LEADER |
02555na a2200229 4500 |
003 |
HR-ZaFER |
008 |
160221s2017 ci ||||| m||| 00| 0 hr d |
035 |
|
|
|a (HR-ZaFER)ferid4590
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Čerić, Paolo
|
245 |
1 |
0 |
|a Generiranje realističnih podataka za treniranje modela dubokog učenja :
|b diplomski rad /
|c Paolo Čerić ; [mentor Sven Lončarić].
|
246 |
1 |
|
|a Generating Realistic Data for Training of Deep Learning Models
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b P. Čerić,
|c 2017.
|
300 |
|
|
|a 37 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b diplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2017-06-29, datum završetka: 2017-07-11
|
520 |
3 |
|
|a Sažetak na hrvatskom: U ovome radu ispitali smo mogućnosti treniranja Faster R-CNN duboke neuronske mreže nad generiranim podacima kroz slučaj detekcije i klasifikacije znakova na ispisanim računima. Fokus rada bio je na analizi stvarnih podataka te implementaciji sustava za njihovo automatsko generiranje. Analizom rezultata ustanovljena je visoka sličnost generiranog i stvarnog skupa podataka po pitanju mogućnosti lokalizacije znakova, dok je kod klasifikacije uočen znatniji data mismatch odnosno veća razlika generiranog i stvarnog skupa podataka. Predloženo objašnjenje tog problema jest manjak određenih fontova u generiranom skupu podataka, odnosno neki su fontovi prisutni samo u stvarnom skupu, no ne i u generiranom.
|
520 |
3 |
|
|a Sažetak na engleskom: In this thesis we explored the possibilities of training Faster R-CNN deep neural network on automatically generated dataset, investigating the case of detection and classification of characters on receipts. The focus of the thesis was to analyze real data and to implement a system for its automatic generation. In case of network’s localization capabilities, high similarity between generated and real dataset were detected, meaning low data mismatch was achieved. When it comes to classification, the data mismatch is significantly higher. A proposed explanation of that problem is the lack of certain fonts in the generated dataset, meaning there are some fonts present in the real dataset, but not in the generated one since they are not easily obtainable.
|
653 |
|
1 |
|a generiranje podataka
|a duboko učenje
|a Faster R-CNN
|a data mismatch
|a OCR
|
653 |
|
1 |
|a generated dataset
|a deep learning
|a Faster R-CNN
|a data mismatch
|a OCR
|
700 |
1 |
|
|a Lončarić, Sven
|4 ths
|
942 |
|
|
|c Y
|
999 |
|
|
|c 48453
|d 48453
|