Identifikacija sudionika u transkriptu razgovora između više osoba uporabom analize teksta

Sažetak na hrvatskom: Identifikacija sudionika u transkriptu razgovora je problem koji je predstavljen kao uvod u veći problem, a to je rudarenje karaktera. Problem se rješava rezolucijom koreferentnosti, ali prijašnjim modelima je tekst u obliku dijaloga bio mana. Model rezolucije koreferentnosti...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:51050/Details
Glavni autor: Brajdić, Karlo (-)
Ostali autori: Pintar, Damir (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, K. Brajdić, 2019.
Predmet:
LEADER 02504na a2200229 4500
003 HR-ZaFER
008 160221s2019 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid6581 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Brajdić, Karlo  |9 40321 
245 1 0 |a Identifikacija sudionika u transkriptu razgovora između više osoba uporabom analize teksta :  |b diplomski rad /  |c Karlo Brajdić ; [mentor Damir Pintar]. 
246 1 |a Identifying Participants in Conversation Transcripts Involving Multiple People Using Text Analysis  |i Naslov na engleskom:  
260 |a Zagreb,  |b K. Brajdić,  |c 2019. 
300 |a 27 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2019-06-28, datum završetka: 2019-07-09 
520 3 |a Sažetak na hrvatskom: Identifikacija sudionika u transkriptu razgovora je problem koji je predstavljen kao uvod u veći problem, a to je rudarenje karaktera. Problem se rješava rezolucijom koreferentnosti, ali prijašnjim modelima je tekst u obliku dijaloga bio mana. Model rezolucije koreferentnosti zasnovan na parovima spominjanja se koristi u ovom radu, koji uz pomoć više tipova značajki grupira spominjanja u koreferentne lance. Sustav nakon toga povezuje entitete s tim lancima pomoću algoritma zasnovanog na glasanju. Ugniježđena unakrsna provjera i nekolicina modela su korištena pri evaluaciji sustava. 
520 3 |a Sažetak na engleskom: Character identification on multiparty conversation is a problem introduced as an intro to a bigger problem called character mining. Usually, the problem is solved using coreference resolution, but coreference resolution models at the time were struggling with data as dialogue. Mention-pair model is used for coreference resolution in this thesis, which links mentions in coreference chains. After that, the system links entities with chains using a voting scheme. Nested cross-validation and a number of models were used during the evaluation of the system. 
653 1 |a analiza teksta  |a identifikacija sudionika  |a strojno učenje  |a procesiranje prirodnog jezika  |a unakrsna provjera  |a rudarenje karaktera  |a rezolucija koreferentnosti  |a povezivanje entiteta 
653 1 |a text analysis  |a character identification  |a machine learning  |a natural language processing  |a cross validation  |a character mining  |a coreference resolution  |a entity linking 
700 1 |a Pintar, Damir  |4 ths  |9 31013 
942 |c Y 
999 |c 51050  |d 51050