Model za određivanje semantičke kompozicionalnosti višerječnih izraza hrvatskoga jezika

Sažetak na hrvatskom: Automatsko određivanje semantičke kompozicionalnosti višerječnih izraza važno je za niz primjena obrade prirodnog jezika poput strojnog prevođenja i pretraživanja informacija. U ovom radu rješavanju tog problema pristupa se upotrebom distribucijskih semantičkih modela i modela...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:45272/Details
Glavni autor: Almić, Petra (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, P. Almić, 2014.
Predmet:
LEADER 03022na a2200241 4500
003 HR-ZaFER
005 20160516012013.0
008 160221s2014 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid1323 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Almić, Petra  |9 34950 
245 |a Model za određivanje semantičke kompozicionalnosti višerječnih izraza hrvatskoga jezika :  |b diplomski rad /  |c Petra Almić ; [mentor Jan Šnajder]. 
246 1 |a Model for Determining Semantic Compositionality of Croatian Multi-Word Expressions  |i Naslov na engleskom:  
260 |a Zagreb,  |b P. Almić,  |c 2014. 
300 |a 48 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2014-06-30, datum završetka: 2014-07-07 
520 3 |a Sažetak na hrvatskom: Automatsko određivanje semantičke kompozicionalnosti višerječnih izraza važno je za niz primjena obrade prirodnog jezika poput strojnog prevođenja i pretraživanja informacija. U ovom radu rješavanju tog problema pristupa se upotrebom distribucijskih semantičkih modela i modela distribucijske semantičke kompozicije. Izgrađena je zbirka od dvjesto hrvatskih višerječnih izraza s ručnim ocjenama semantičke kompozicionalnosti na kojima su modeli vrednovani. Od distribucijskih semantičkih modela odabran je model latentne semantičke analize, a od modela distribucijske semantičke kompozicije evaluirani su multiplikativni i aditivni modeli. Aditivni modeli s korelacijom od 0,45 nadmašuju multiplikativni model koji postiže korelaciju od -0,19. Rezultati su obećavajući, statistički značajni i u rangu rezultata relevantnih radova. 
520 3 |a Sažetak na engleskom: Automatic identification of semantic compositionality of multi-word expression is very important for many tasks in natural language processing e.g. machine translation and information retrieval. In this thesis that issue is addressed using distributional semantic models and distributional models of semantic composition. Dataset consisting of 200 multi-word expressions was annotated with semantic compositionality scores and it was used to evaluate the model. Distributional semantic model was built using Latent Semantic Analysis (LSA). Several models of semantic composition were evaluated. Results show that additive models outperform multiplicative model. Results are promising, statistically significant and comparable to the relevant related work. 
653 1 |a višerječni izrazi  |a distribucijska semantika  |a distribucijski semantički modeli  |a modeli distribucijske semantičke kompozicionalnosti  |a latentna semantička analiza  |a semantička kompozicionalnost (prozirnost) 
653 1 |a multi-word expressions  |a distributional semantics  |a distributional semantic models  |a compositional distributional semantics  |a latent semantic analysis  |a semantic compositionality (transparency) 
700 1 |a Šnajder, Jan  |4 ths  |9 19016 
942 |2 udc  |c Y 
999 |c 45272  |d 45272