|
|
|
|
LEADER |
03003na a2200229 4500 |
003 |
HR-ZaFER |
008 |
160221s2018 ci ||||| m||| 00| 0 hr d |
035 |
|
|
|a (HR-ZaFER)ferid5459
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Kelava, Josipa
|
245 |
1 |
0 |
|a Sustav za izgradnju afektivnog rječnika za hrvatski jezik zasnovan na društvenim medijima :
|b diplomski rad /
|c Josipa Kelava ; [mentor Vedran Podobnik].
|
246 |
1 |
|
|a System for creating an affective lexicon for Croatian language based on social media
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b J. Kelava,
|c 2018.
|
300 |
|
|
|a 38 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b diplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 54, datum predaje: 2018-06-29, datum završetka: 2018-07-13
|
520 |
3 |
|
|a Sažetak na hrvatskom: U ovom diplomskom radu prikazane su dvije metode izrade afektivnih rječnika na hrvatskom jeziku te su izgrađena dva rječnika. Rječnici su izgrađeni na temelju podataka prikupljenih s društvene mreže Facebook. Stranice s kojih su dohvaćeni podaci su Facebook stranice hrvatskih medijskih portala. Programski jezici koji su korišteni za dohvat podataka, obradu istih (lematizacija, uklanjanje zaustavnih riječi itd.) i izgradnju rječnika su skriptni jezici R i Python.
Nad prikupljenim objavama se provodi klasifikacija pomoću izgrađenih rječnika te se na temelju rezultata računaju mjere koje pokazuju koliko su dobri rezultati klasifikacije. Od cjelokupnog skupa podataka, 90% podataka uzima se kao skup za treniranje, a 10% kao testni skup. Usporedbom rezultata klasifikacije, metoda normalizirane izglednosti se pokazala kao preciznija metoda, povećavajući preciznost za oko 5% u odnosu na metodu normaliziranih frekvencija.
|
520 |
3 |
|
|a Sažetak na engleskom: In this master thesis, two methods for developing affective lexicon in the Croatian language have been presented and two lexicons were created. Lexicons were built on the data collected from the social network Facebook. The pages from which the data was retrieved are Facebook Croatian news portals. Programming languages used for data retrieval, processing (lemmatization, removing stop words, etc.) and building lexicons are scripting languages R and Python.
Classification is performed over the collected posts and based on the results, measures are calculated to show how good the classification results are.
Of the entire data set, 90% of data is taken as a training set, and 10% as a test set. By comparing the results of the classification, the normalized likelihood method was shown as a more precise method, increasing the precision for about 5% compared to the normalized frequencies method.
|
653 |
|
1 |
|a Facebook, rječnik, afekt, klasifikcija, R, Python, reakcija, hrvatski
|
653 |
|
1 |
|a Facebook, lexicon, affective , classification, R, Python, reaction, Croatian
|
700 |
1 |
|
|a Podobnik, Vedran
|4 ths
|
942 |
|
|
|c Y
|
999 |
|
|
|c 48981
|d 48981
|