Semantička segmentacija teksta računa

Sažetak na hrvatskom: U ovom radu su se promatrali modeli semantičke segmentacije teksta računa. Riječi očitane s računa se klasificiraju po tri semantičke značajke: proizvod, cijena i ostalo. Razvijena su tri modela: HMM, CRF i LSTM. Najbolje rezultate ostvario je CRF s F1 rezultatom preko 90\% što...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:51383/Details
Glavni autor: Čubelić, Dominik (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, D. Čubelić, 2019.
Predmet:
LEADER 01770na a2200229 4500
003 HR-ZaFER
008 160221s2019 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid7135 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Čubelić, Dominik  |9 40669 
245 1 0 |a Semantička segmentacija teksta računa :  |b završni rad /  |c Dominik Čubelić ; [mentor Jan Šnajder]. 
246 1 |a Semantic Segmentaion of Invoice Text  |i Naslov na engleskom:  
260 |a Zagreb,  |b D. Čubelić,  |c 2019. 
300 |a 22 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2019-06-14, datum završetka: 2019-07-12 
520 3 |a Sažetak na hrvatskom: U ovom radu su se promatrali modeli semantičke segmentacije teksta računa. Riječi očitane s računa se klasificiraju po tri semantičke značajke: proizvod, cijena i ostalo. Razvijena su tri modela: HMM, CRF i LSTM. Najbolje rezultate ostvario je CRF s F1 rezultatom preko 90\% što je uvelike nadmašilo referentni model temeljen na heuristici. 
520 3 |a Sažetak na engleskom: In this thesis, semantic segmentation of invoice text models was observed. Words extracted from invoices are classified on three semantic labels: product, price and other. Three models were developed: HMM, CRF and LSTM. Best results were achieved by CRF with F1 score over 90\% which greatly surpassed the referent model based on heuristics. 
653 1 |a strojno učenje  |a obrada prirodnog jezika  |a HMM  |a CRF  |a LSTM  |a označavanje sljedova  |a računi 
653 1 |a machine learning  |a natural language processing  |a HMM  |a CRF  |a LSTM  |a sequence labelling  |a invoices 
700 1 |a Šnajder, Jan  |4 ths  |9 19016 
942 |c Z 
999 |c 51383  |d 51383