MARC: Generiranje realističnih podataka za treniranje modela dubokog učenja

Generiranje realističnih podataka za treniranje modela dubokog učenja

Sažetak na hrvatskom: U ovome radu ispitali smo mogućnosti treniranja Faster R-CNN duboke neuronske mreže nad generiranim podacima kroz slučaj detekcije i klasifikacije znakova na ispisanim računima. Fokus rada bio je na analizi stvarnih podataka te implementaciji sustava za njihovo automatsko gener...

Full description

Permalink:	http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:48453/Details
Glavni autor:	Čerić, Paolo (-)
Ostali autori:	Lončarić, Sven (Thesis advisor)
Vrsta građe:	Drugo
Impresum:	Zagreb, P. Čerić, 2017.
Predmet:	generiranje podataka > duboko učenje > Faster R-CNN > data mismatch > OCR generated dataset > deep learning > Faster R-CNN > data mismatch > OCR


LEADER	02555na a2200229 4500
003	HR-ZaFER
008	160221s2017 ci \|\|\|\|\| m\|\|\| 00\| 0 hr d
035			\|a (HR-ZaFER)ferid4590
040			\|a HR-ZaFER \|b hrv \|c HR-ZaFER \|e ppiak
100	1		\|a Čerić, Paolo
245	1	0	\|a Generiranje realističnih podataka za treniranje modela dubokog učenja : \|b diplomski rad / \|c Paolo Čerić ; [mentor Sven Lončarić].
246	1		\|a Generating Realistic Data for Training of Deep Learning Models \|i Naslov na engleskom:
260			\|a Zagreb, \|b P. Čerić, \|c 2017.
300			\|a 37 str. ; \|c 30 cm + \|e CD-ROM
502			\|b diplomski studij \|c Fakultet elektrotehnike i računarstva u Zagrebu \|g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2017-06-29, datum završetka: 2017-07-11
520	3		\|a Sažetak na hrvatskom: U ovome radu ispitali smo mogućnosti treniranja Faster R-CNN duboke neuronske mreže nad generiranim podacima kroz slučaj detekcije i klasifikacije znakova na ispisanim računima. Fokus rada bio je na analizi stvarnih podataka te implementaciji sustava za njihovo automatsko generiranje. Analizom rezultata ustanovljena je visoka sličnost generiranog i stvarnog skupa podataka po pitanju mogućnosti lokalizacije znakova, dok je kod klasifikacije uočen znatniji data mismatch odnosno veća razlika generiranog i stvarnog skupa podataka. Predloženo objašnjenje tog problema jest manjak određenih fontova u generiranom skupu podataka, odnosno neki su fontovi prisutni samo u stvarnom skupu, no ne i u generiranom.
520	3		\|a Sažetak na engleskom: In this thesis we explored the possibilities of training Faster R-CNN deep neural network on automatically generated dataset, investigating the case of detection and classification of characters on receipts. The focus of the thesis was to analyze real data and to implement a system for its automatic generation. In case of network’s localization capabilities, high similarity between generated and real dataset were detected, meaning low data mismatch was achieved. When it comes to classification, the data mismatch is significantly higher. A proposed explanation of that problem is the lack of certain fonts in the generated dataset, meaning there are some fonts present in the real dataset, but not in the generated one since they are not easily obtainable.
653		1	\|a generiranje podataka \|a duboko učenje \|a Faster R-CNN \|a data mismatch \|a OCR
653		1	\|a generated dataset \|a deep learning \|a Faster R-CNN \|a data mismatch \|a OCR
700	1		\|a Lončarić, Sven \|4 ths
942			\|c Y
999			\|c 48453 \|d 48453

Generiranje realističnih podataka za treniranje modela dubokog učenja

Slični primjerci