|
|
|
|
LEADER |
02875na a2200229 4500 |
003 |
HR-ZaFER |
008 |
160221s2018 ci ||||| m||| 00| 0 hr d |
035 |
|
|
|a (HR-ZaFER)ferid6119
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Ilakovac, Mihovil
|
245 |
1 |
0 |
|a Modeli strojnog učenja za prepoznavanje sarkazma u korisničkim komentarima :
|b završni rad /
|c Mihovil Ilakovac ; [mentor Jan Šnajder].
|
246 |
1 |
|
|a Machine Learning Models for Sarcasm Detection in Users' Comments
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b M. Ilakovac,
|c 2018.
|
300 |
|
|
|a 31 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b preddiplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2018-06-15, datum završetka: 2018-07-13
|
520 |
3 |
|
|a Sažetak na hrvatskom: Jedan od teških problema je zaključiti iz podataka nešto što zapravo nije tamo. Takav problem je problem prepoznavanja sarkazma unutar teksta.
Sarkazam je govorna figura u kojoj osoba govori nešto suprotno od onoga što stvarno misli. Stvarali smo vlastiti skup podataka i razvili tipologiju sarkazma
kako bismo što točnije označili dobivene podatke. Morali smo odustati od stvaranja vlastitog skupa podataka zbog krivo procjene potrebnog vremena za
označavanje. Koristili smo Stanfordov skup podataka SARC koji sadrži samo-označene podatke s Reddita. Problem prepoznavanja sarkazma smo odlučili riješiti
korištenjem strojnog učenja. Odabrali smo tri modela: stroj potpornih vektora, logistička regresija i slučajne šume. Ostvarili smo rezultate koji su bolji
od osnovnog modela, ali ima još prostora za napredak.
|
520 |
3 |
|
|a Sažetak na engleskom: One of hard problems is concluding something based on data that says explicitly one thing but the author meant something different. One of those problems is sarcasm detection inside of texts.
Sarcasm is a speech figure that expresses something opposite to what would a sincere utterance express. We have worked on creating our dataset and developed a sarcasm typology
in order to label the data precisely. We had to stop with the labeling process due to a wrong estimation of the time needed to complete the labeling task. Stanford had published
a self-labeled Reddit dataset called SARC which we used. The problem of sarcasm classification we decided to solve with machine learning. Three models were selected: support vector machine,
logistic regression and random forrest. We have achieved results that are better than the baseline but there is room for progress.
|
653 |
|
1 |
|a obrada prirodnog jezika
|a sarkazam
|a strojno učenje
|a Reddit
|a SARC
|a SVM
|a logistička regresija
|a slučajne šume
|
653 |
|
1 |
|a natural language processing
|a sarcasm
|a machine learning
|a Reddit
|a SARC
|a SVM
|a logistic regression
|a random forrest
|
700 |
1 |
|
|a Šnajder, Jan
|4 ths
|
942 |
|
|
|c Z
|
999 |
|
|
|c 48762
|d 48762
|