|
|
|
|
LEADER |
03110na a2200241 4500 |
003 |
HR-ZaFER |
005 |
20160516012023.0 |
008 |
160221s2014 ci ||||| m||| 00| 0 hr d |
035 |
|
|
|a (HR-ZaFER)ferid1754
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Zuanović, Leo
|9 35426
|
245 |
|
|
|a Jezični model hrvatskoga jezika zasnovan na povratnim neuronskim mrežama :
|b diplomski rad /
|c Leo Zuanović ; [mentor Jan Šnajder].
|
246 |
1 |
|
|a Recurrent Neural Network Based Language Model of Croatian Language
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b L. Zuanović,
|c 2014.
|
300 |
|
|
|a 87 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b diplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2014-06-30, datum završetka: 2014-07-08
|
520 |
3 |
|
|a Sažetak na hrvatskom: Jezični modeli procjenjuju vjerojatnost pripadanja nekog slieda rieči u neki jezik. Tradicionalni se modeli temelje na prebrojavanju pojavljivanja nizova od n rieči (n-rječja), no ti modeli pate od nedostatka podataka, nemogućnosti modeliranja udaljenih odnosa, nemogućnosti poobćavanja itd. Alternativa su modeli temeljeni na živčanim mrežama koji prikazivanjem rieči pomoću vektora rješavaju glavninu problema tradicionalnih modela. Ti rječni prikazi mogu se izkoristiti i u drugim zadatcima obrade prirodnog jezika. U radu su izrađeni rječni prikazi za hrvatske rieči pomoću naputka word2vec te su izpitani na zadatcima prepoznavanja suznačnica, ocjenjivanja značbene povezanosti i sličnosti, skladnjanih i značbenih nalika te na sustavu za prepoznavanje imenovanih sućaka u hrvatskom jeziku CroNER-u. U svim je slučajevima (osim kod CroNER-a) došlo do znatnog poboljšanja točnosti u odnosu na sustav bez vektorskih prikaza rieči.
|
520 |
3 |
|
|a Sažetak na engleskom: Language models are used to estimate the probability of a word sequence belonging to some language. Traditional models are based on counting the number of occurrences of n-word long sequences (n-grams). These models, however, suffer from insufficient data, inability to model distant relations or to generalize etc. An alternative approach are neural network based models which use vector representations of words to solve most of the traditional model's problems. These word representations can also be used in other natural language processing tasks. In this thesis we built word representations of Croatian words using word2vec software and tested them on the tasks of synonym detection, semantic similarity and relatedness judgment, syntax and semantic analogies and named entity recognition in Croatian using CroNER. In all the cases (except CroNER) we observed significant increase in accuracy as compared to the systems without vector representations of words.
|
653 |
|
1 |
|a obrada prirodnog jezika
|a jezični modeli
|a živčane mreže
|a rječni prikazi
|a hrvatski jezik
|
653 |
|
1 |
|a natural language processing
|a language models
|a neural networks
|a word representations
|a Croatian language
|
700 |
1 |
|
|a Šnajder, Jan
|4 ths
|9 19016
|
942 |
|
|
|c Y
|2 udc
|
999 |
|
|
|c 45615
|d 45615
|