Analiza sentimenta u tvitovima na hrvatskome jeziku

Sažetak na hrvatskom: U posljednjih nekoliko godina primjetan je nagli porast korisnički generiranog sadržaja unutar društvenih mreža. Jedna od takvih mreža osobito pogodna za strojnu analizu sentimenta je Twitter, mikro-blogging servis unutar kojega korisnici odašilju kratke poruke - tvitove. Cilj...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:45648/Details
Glavni autor: Krajcar, Luka (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, L. Krajcar, 2014.
Predmet:
LEADER 03037na a2200241 4500
003 HR-ZaFER
005 20160516012024.0
008 160221s2014 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid1517 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Krajcar, Luka  |9 35130 
245 |a Analiza sentimenta u tvitovima na hrvatskome jeziku :  |b diplomski rad /  |c Luka Krajcar ; [mentor Jan Šnajder]. 
246 1 |a Sentiment Analysis in Tweets in Croatian Language  |i Naslov na engleskom:  
260 |a Zagreb,  |b L. Krajcar,  |c 2014. 
300 |a 44 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2014-06-30, datum završetka: 2014-07-08 
520 3 |a Sažetak na hrvatskom: U posljednjih nekoliko godina primjetan je nagli porast korisnički generiranog sadržaja unutar društvenih mreža. Jedna od takvih mreža osobito pogodna za strojnu analizu sentimenta je Twitter, mikro-blogging servis unutar kojega korisnici odašilju kratke poruke - tvitove. Cilj strojne analize sentimenta je automatski odrediti mišljenje, stav ili emociju izraženu u tekstu klasifikacijom u jednu od tri klase: pozitivnu,negativnu ili neutralnu. Zbog nemogućnosti ručnog označavanja velikog broja poruka koristi se model blago nadziranog strojnog učenja. U radu je ispitan utjecaj raznih metoda predobrade podataka te rad nekoliko klasifikacijskih modela poput naivnog Bayesovog klasifikatora, stroja potpornih vektora i logističke regresije. Prikazana je i obrazložena usporedba modela nadziranog i blago nadziranog strojnog učenja. Prikaz agregiranog sentimenta i statistike omogućen je kroz korisničku aplikaciju. 
520 3 |a Sažetak na engleskom: In recent years there has been a sharp rise in user-generated content within social networks. One of these networks particularly suitable for machine analysis of sentiment is Twitter, a micro-blogging service within which users broadcast short messages - tweets. The goal of machine sentiment analysis is to automatically determine the opinion, attitude or emotion expressed in text by classification into one of three categories: positive, negative or neutral. Due to the inability of manual labeling of a large number of messages a model of distant supervised machine learning. This paper investigates the impact of different methods of preprocessing data and effectiveness of several classification models such as naive Bayes classifier, support vector machines and logistic regression. Comparison of supervised and distant supervised machine learning is presented and explained in detail. Representation of aggregate sentiment and statistics is provided via a user application. 
653 1 |a Twitter  |a obrada prirodnog jezika  |a analiza sentimenta  |a strojno učenje  |a hrvatski jezik 
653 1 |a Twitter  |a natural language processing  |a sentiment analysis  |a machine learning  |a croatian language 
700 1 |a Šnajder, Jan  |4 ths  |9 19016 
942 |c Y  |2 udc 
999 |c 45648  |d 45648