Ekstrakcija navoda iz novinskih objava na hrvatskome jeziku

Sažetak na hrvatskom: Završni rad opisuje izgradnju sustava za ekstrakciju navoda iz novinskih objava na hrvatskome jeziku. Model za ekstrakciju navoda i povezivanje navoda s entitetima koji su izrekli navod temeljen je na pravilima. Temelj izgrađenih pravila jest potraga za navodima unutar rečenice...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:45228/Details
Glavni autor: Medić, Zoran (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, Z. Medić, 2014.
Predmet:
LEADER 02669na a2200241 4500
003 HR-ZaFER
005 20160516012012.0
008 160221s2014 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid1114 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Medić, Zoran  |9 35619 
245 |a Ekstrakcija navoda iz novinskih objava na hrvatskome jeziku :  |b završni rad /  |c Zoran Medić ; [mentor Jan Šnajder]. 
246 1 |a Quotation Extraction from News Stories in Croatian Language  |i Naslov na engleskom:  
260 |a Zagreb,  |b Z. Medić,  |c 2014. 
300 |a 26 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2014-06-13, datum završetka: 2014-09-10 
520 3 |a Sažetak na hrvatskom: Završni rad opisuje izgradnju sustava za ekstrakciju navoda iz novinskih objava na hrvatskome jeziku. Model za ekstrakciju navoda i povezivanje navoda s entitetima koji su izrekli navod temeljen je na pravilima. Temelj izgrađenih pravila jest potraga za navodima unutar rečenice, predikatom kojim se povezuje navod s imenovanim entitetom, te subjektom koji je prepoznat kao imenovani entitet. Postignuta preciznost izgrađenog sustava iznosi 97%, dok je odziv 72%. Proučeni su i relevantni radovi iz područja ekstrakcije navoda pomoću metoda temeljenih na pravilima i metoda strojnog učenja. Izgrađeno je i jednostavno grafičko korisničko sučelje kojim se pretražuje baza navoda i pripadnih govornika. U sklopu rada predloženi su i brojni načini poboljšanja i proširenja sustava. 
520 3 |a Sažetak na engleskom: Bachelor's thesis describes an implementation of rule-based, news-wire quotation extraction system for Croatian language. Quotation extraction model is based on rules, each of which tries to find a quote inside a sentence, as well as a predicate which is contained in a set of reported speech verbs and a subject labeled as named entity - person. Precision of implemented quotation extraction system is currently equal to 97%, while recall has value of 72%. Different methods based on rules and machine learning have been studied during the work on the thesis. A simple graphical user interface has been created, for user to search through quotes database. Many ways of system improvement and expansion have been suggested as future work ideas. 
653 1 |a Ekstrakcija navoda  |a povezivanje navoda s entitetom  |a ekstrakcija informacija pomoću pravila 
653 1 |a Quotation extraction  |a quote attribution  |a rule-based information extraction 
700 1 |a Šnajder, Jan  |4 ths  |9 19016 
942 |c Z  |2 udc 
999 |c 45228  |d 45228