Sustav za izgradnju afektivnog rječnika za hrvatski jezik zasnovan na društvenim medijima

Sažetak na hrvatskom: U ovom diplomskom radu prikazane su dvije metode izrade afektivnih rječnika na hrvatskom jeziku te su izgrađena dva rječnika. Rječnici su izgrađeni na temelju podataka prikupljenih s društvene mreže Facebook. Stranice s kojih su dohvaćeni podaci su Facebook stranice hrvatskih...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:48981/Details
Glavni autor: Kelava, Josipa (-)
Ostali autori: Podobnik, Vedran (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, J. Kelava, 2018.
Predmet:
LEADER 03003na a2200229 4500
003 HR-ZaFER
008 160221s2018 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid5459 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Kelava, Josipa 
245 1 0 |a Sustav za izgradnju afektivnog rječnika za hrvatski jezik zasnovan na društvenim medijima :  |b diplomski rad /  |c Josipa Kelava ; [mentor Vedran Podobnik]. 
246 1 |a System for creating an affective lexicon for Croatian language based on social media  |i Naslov na engleskom:  
260 |a Zagreb,  |b J. Kelava,  |c 2018. 
300 |a 38 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 54, datum predaje: 2018-06-29, datum završetka: 2018-07-13 
520 3 |a Sažetak na hrvatskom: U ovom diplomskom radu prikazane su dvije metode izrade afektivnih rječnika na hrvatskom jeziku te su izgrađena dva rječnika. Rječnici su izgrađeni na temelju podataka prikupljenih s društvene mreže Facebook. Stranice s kojih su dohvaćeni podaci su Facebook stranice hrvatskih medijskih portala. Programski jezici koji su korišteni za dohvat podataka, obradu istih (lematizacija, uklanjanje zaustavnih riječi itd.) i izgradnju rječnika su skriptni jezici R i Python. Nad prikupljenim objavama se provodi klasifikacija pomoću izgrađenih rječnika te se na temelju rezultata računaju mjere koje pokazuju koliko su dobri rezultati klasifikacije. Od cjelokupnog skupa podataka, 90% podataka uzima se kao skup za treniranje, a 10% kao testni skup. Usporedbom rezultata klasifikacije, metoda normalizirane izglednosti se pokazala kao preciznija metoda, povećavajući preciznost za oko 5% u odnosu na metodu normaliziranih frekvencija. 
520 3 |a Sažetak na engleskom: In this master thesis, two methods for developing affective lexicon in the Croatian language have been presented and two lexicons were created. Lexicons were built on the data collected from the social network Facebook. The pages from which the data was retrieved are Facebook Croatian news portals. Programming languages used for data retrieval, processing (lemmatization, removing stop words, etc.) and building lexicons are scripting languages R and Python. Classification is performed over the collected posts and based on the results, measures are calculated to show how good the classification results are. Of the entire data set, 90% of data is taken as a training set, and 10% as a test set. By comparing the results of the classification, the normalized likelihood method was shown as a more precise method, increasing the precision for about 5% compared to the normalized frequencies method. 
653 1 |a Facebook, rječnik, afekt, klasifikcija, R, Python, reakcija, hrvatski 
653 1 |a Facebook, lexicon, affective , classification, R, Python, reaction, Croatian 
700 1 |a Podobnik, Vedran  |4 ths 
942 |c Y 
999 |c 48981  |d 48981