Računalna statistička analiza jezika religijskih rasprava na internetskim forumima

Sažetak na hrvatskom: Analiza religijskih pitanja je uvijek vrlo kontroverzna. Religija kod svakog čovjeka predstavlja nešto osobno, a objektivno sagledati religiju je vrlo zahtjevna stvar. Cilj rada je bio analizirati tekstove religijskih rasprava uz pomoć statističke analize. Skup podataka korište...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:50345/Details
Glavni autor: Torić, Josip (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, J. Torić, 2018.
Predmet:
LEADER 02589na a2200229 4500
003 HR-ZaFER
008 160221s2018 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid6158 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Torić, Josip 
245 1 0 |a Računalna statistička analiza jezika religijskih rasprava na internetskim forumima :  |b završni rad /  |c Josip Torić ; [mentor Jan Šnajder]. 
246 1 |a Computational Statistical Analysis of the Language of Religious Discussions on Internet Forums  |i Naslov na engleskom:  
260 |a Zagreb,  |b J. Torić,  |c 2018. 
300 |a 27 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2018-06-15, datum završetka: 2018-09-12 
520 3 |a Sažetak na hrvatskom: Analiza religijskih pitanja je uvijek vrlo kontroverzna. Religija kod svakog čovjeka predstavlja nešto osobno, a objektivno sagledati religiju je vrlo zahtjevna stvar. Cilj rada je bio analizirati tekstove religijskih rasprava uz pomoć statističke analize. Skup podataka korišten u radu smo preuzeli s društvene mreže Reddit. Model smo izgradili koristeći frekvencije riječi i značajke LIWC. Isprobali smo dva modela strojnog učenja, logističku regresiju i stroj potpornih vektora za predviđanje religije. Ostvarili smo rezultate koji su zadovoljavajući te s točnošću od otprilike 65% predviđaju religiju korisnika na temelju njegovih ili njezinih komentara. 
520 3 |a Sažetak na engleskom: Analysis of religion questions is always very controversial. Religion is something personal for every person, and to objectively consider religion is a very demanding thing. The aim of the thesis was to analyze the texts of religious discussions through statistical data analysis. The data set used in this work was downloaded from the Reddit social network. We built the model using word frequencies and LIWC features. We tested two machine learning models, logistic regression and the support vectors machine for predicting religion. We have achieved satisfactory results and with an accuracy of approximately 65% predict the user's religion based on his or her comments. 
653 1 |a obrada prirodnog jezika  |a strojno učenje  |a Reddit  |a logistička regresija  |a stroj potpornih vektora  |a LIWC  |a statistička analiza podatka 
653 1 |a natural language processing  |a machine learning  |a Reddit  |a logistic regression  |a support vector machine  |a LIWC  |a statistical data analysis 
700 1 |a Šnajder, Jan  |4 ths 
942 |c Z 
999 |c 50345  |d 50345