|
|
|
|
LEADER |
03974na a2200229 4500 |
003 |
HR-ZaFER |
008 |
160221s2019 ci ||||| m||| 00| 0 en d |
035 |
|
|
|a (HR-ZaFER)ferid6564
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Volarić Horvat, Leonard
|9 40713
|
245 |
1 |
0 |
|a Računalna stilometrijska analiza transkripata rasprava Hrvatskog sabora :
|b diplomski rad /
|c Leonard Volarić Horvat ; [mentor Jan Šnajder].
|
246 |
1 |
|
|a Computational Stylometry Analysis of Croatian Parliamentary Discussions
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b L. Volarić Horvat,
|c 2019.
|
300 |
|
|
|a 67 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b diplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2019-06-28, datum završetka: 2019-07-08
|
520 |
3 |
|
|a Sažetak na hrvatskom: Jedna od najvažnijih karakteristika svake politički angažirane osobe je retorika koju koristi. Retorika se sastoji od sadržaja i stila: načina na koji se sadržaj prenosi javnosti. Ove dvije komponente retorike često bivaju istraživane u lingvistici, psiholingvistici i političkim znanostima, a zbog napretka računalne obrade prirodnog jezika, alati razvijeni u računalnoj lingvistici se sve češće koriste u ovakvim analizama. Većina prethodnih istraživanja stilskih značajki političkog teksta odnosi se na tekstove na engleskom jeziku. Ovaj rad proučava rasprave Hrvatskog sabora, i to stilometriju prisutnu u transkriptima tih raspravi. Izvlačenje stilskih značajki iz teksta pokazalo se zahtjevnim, budući da je riječ o govornom jeziku, čije stilometrijske karakteristike nisu toliko istražene koliko jesu u pisanom jeziku, a pogotovo za hrvatski jezik. Nakon izvlačenja stilskih značajki i skupljanja dodatnih podataka iz drugih izvora, eksplorativna je analiza ponudila uvid u statističke karakteristike odabranih značajki. Također, koristeći algoritam t-SNE, podatci su iscrtani u dvije dimenzije, što je otkrilo nekoliko grupa među različitim skupovima govornika. Nakon toga, obavljena je regresijska analiza podataka, s ciljem stvaranja modela za procjenu političke orijentacije pojedinog saborskog zastupnika, na temelju dostupnih stilskih značajki.
|
520 |
3 |
|
|a Sažetak na engleskom: Any politician’s main tool is their rhetoric, which consists of content and style – the way that content is transmitted to the public. The two components have been subjected to previous research, primarily in the domain of Linguistics, Psycholinguistics, and Political Science. Due to recent advances in Natural Language Processing, analysis of political text relies more and more on tools developed within Computational
Linguistics. Most previous work in stylometry of political text was done in English. This thesis takes a closer look at the discussions in the Croatian Parliament, by examining the stylometry in the transcripts of said discussions. Extracting stylometric features from the transcripts proved challenging, because analyzing transcripts spoken language is not a task often encountered in the research community, and even less so in
Croatian. After extracting stylometric features, and combining the data with several external data sources, an exploratory analysis was done. Along with basic descriptive statistics, the data was visualized using t-SNE, a dimensionality reduction technique, which revealed several clusters within different subsets of the data. After exploring the data, a regression analysis was performed, with the aim of developing a model for predicting the political orientation of a speaker, based on their stylometric features.
|
653 |
|
1 |
|a stilometrija
|a stilometrijska analiza
|a sabor
|a saborske rasprave
|a transkripti
|a politički jezik
|a javni govor
|
653 |
|
1 |
|a stylometry
|a stylometric analysis
|a parliament
|a parliamentary discussions
|a transcripts
|a political langauge
|a public speech
|
700 |
1 |
|
|a Šnajder, Jan
|4 ths
|9 19016
|
942 |
|
|
|c Y
|
999 |
|
|
|c 51427
|d 51427
|