Klasifikacija teksta za hrvatski jezik pomoću prikaza tekstova dobivenih kontekstualiziranim jezičnim modelima

Sažetak na hrvatskom: Učenje prijenosom je novi smjer istraživanja u području obrade prirodnog jezika, posebno zanimljiv zbog impresivnih rezultata u raznim zadacima obrade prirodnog jezika. Tema rada jest primjena različitih pristupa učenja prijenosom na zadatke klasifikacije teksta za hrvatski jez...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:51009/Details
Glavni autor: Krešo, Marin (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, M. Krešo, 2019.
Predmet:
LEADER 02860na a2200229 4500
003 HR-ZaFER
008 160221s2019 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid6703 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Krešo, Marin  |9 40285 
245 1 0 |a Klasifikacija teksta za hrvatski jezik pomoću prikaza tekstova dobivenih kontekstualiziranim jezičnim modelima :  |b diplomski rad /  |c Marin Krešo ; [mentor Jan Šnajder]. 
246 1 |a Text classification for Croatian using Text Embeddings Derived from Contextualized Language Models  |i Naslov na engleskom:  
260 |a Zagreb,  |b M. Krešo,  |c 2019. 
300 |a 46 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2019-06-28, datum završetka: 2019-07-08 
520 3 |a Sažetak na hrvatskom: Učenje prijenosom je novi smjer istraživanja u području obrade prirodnog jezika, posebno zanimljiv zbog impresivnih rezultata u raznim zadacima obrade prirodnog jezika. Tema rada jest primjena različitih pristupa učenja prijenosom na zadatke klasifikacije teksta za hrvatski jezik. U radu su isprobana tri različta pristupa, pri čemu je za ULMFiT metodu bilo potrebno trenirati jezični model ispočetka, dok su za ELMo i FLAIR iskorištena postojeća rješenja. Provedeno je eksperimentalno vrednovanje sva tri pristupa nad zadatkom razrješavanja višeznačnosti riječi te nad zadatkom analize sentimenta u tvitovima, uz statističku analizu značajnosti rezultata. Dobiveni rezultati su uspoređeni s onima iz prethodnih istraživanja. 
520 3 |a Sažetak na engleskom: Transfer learning is a new direction in the field of natural language processing, especially interesting because of the impressive results in the various tasks of natural language processing. The goal of the paper is application of different transfer learning approaches for the text classification tasks for the Croatian language. Three different approaches were examined in this thesis, with the ULMFiT method needed to train the language model from scratch, while ELMo and FLAIR used existing solutions. Experimental evaluation of all three approaches to the task was carried out for both word sense disambiguation task and Tweeter sentiment analysis task, with statistical significance tests of the results. The obtained results were compared with those from previous studies. 
653 1 |a obrada prirodnog jezika  |a jezični model  |a duboko učenje  |a učenje prijenosom  |a povratne neuronske mreže  |a analiza sentimenta  |a razrješavanje višeznačnosti riječi 
653 1 |a natural language processing  |a language model  |a deep learning  |a transfer learning  |a recurrent neural networks  |a sentiment analysis  |a word sense disambiguation  
700 1 |a Šnajder, Jan  |4 ths  |9 19016 
942 |c Y 
999 |c 51009  |d 51009