Združeni model za ekstrakciju relacija između imenovanih entiteta

Sažetak na hrvatskom: Pojavljivanja imenovanih entiteta (npr., ljudi, organizacija i lokacija) u tekstu često tvore odnose ili relacije, kao što su to prijateljstva, poznanstva, utjecaj, suradnja i mnoge druge. Ekstrakcija relacija među imenovanim entitetima važan je zadatak, posebice s obzirom na t...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:49894/Details
Glavni autor: Radaković, Dino (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, D. Radaković, 2016.
Predmet:
LEADER 03938na a2200229 4500
003 HR-ZaFER
008 160221s2016 ci ||||| m||| 00| 0 en d
035 |a (HR-ZaFER)ferid4402 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Radaković, Dino 
245 1 0 |a Združeni model za ekstrakciju relacija između imenovanih entiteta :  |b diplomski rad /  |c Dino Radaković ; [mentor Jan Šnajder]. 
246 1 |a A Joint Model for Named Entity Relation Extraction  |i Naslov na engleskom:  
260 |a Zagreb,  |b D. Radaković,  |c 2016. 
300 |a 43 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2016-07-01, datum završetka: 2016-07-04 
520 3 |a Sažetak na hrvatskom: Pojavljivanja imenovanih entiteta (npr., ljudi, organizacija i lokacija) u tekstu često tvore odnose ili relacije, kao što su to prijateljstva, poznanstva, utjecaj, suradnja i mnoge druge. Ekstrakcija relacija među imenovanim entitetima važan je zadatak, posebice s obzirom na trenutno dostupne količine teksta pisanog prirodnim jezikom. Najčešće izvedbe temelje se na algoritmima nadziranog učenja, koji zasebno klasificiraju svaki od parova imenovanih entiteta s ciljem zaključivanja relacije među njima. Takvi pristupi ne uzimaju u obzir strukturiranu prirodu relacija u obliku međurelacijskih odnosa i ograničenja prilikom učenja modela, što ponekad djelomično nadoknađuju upotpunjavanjem predikcija globalnom optimizacijom. Aktualna istraživanja u području strukturne predikcije temeljene na pretraživanju pružaju nove mogućnosti za rješavanje problema ekstrakcije relacija. Ovaj rad usmjeren je na jedan algoritam strukturne predikcije temeljene na pretraživanju, SEARN, prilagođen za zadatak ekstrakcije relacija među imenovanim entitetima. Uvodi se novi skup podataka za ekstrakciju relacija na hrvatskom jeziku. Opisuje se model temeljen na pravilima, model temeljen na strojevima potpornih vektora te model temeljen na SEARN-u. Kvaliteta spomenutih modela ocijenjena je na uvedenom skupu podataka, korištenjem F1 mjere. 
520 3 |a Sažetak na engleskom: Occurrences of named entities (i. e. people, organizations, locations, etc.) often appear within text in form of relations, such as acquaintance, influence, collaboration, and various others. Named entity relation extraction is a task of great importance, espe- cially considering the sheer scale of presently availabe text written in natural language. Typical implementations are based on supervised learning algorithms, classifying each pair of named entities individually, in order to determine the relation between the two. However, such approaches do not take into account the structural nature of relations in the form of intra-relational influences and constraints at training time, sometimes com- pensating for the resulting drawbacks by post-processing outputs via global loss opti- mization. Recent research in search-based structured prediction opens new venues for attempting to solve relation extraction. This thesis focuses of a search-based structured prediction algorithm, SEARN, adapted to the task of named entity relation extraction in Croatian language. We introduce a novel dataset for relation extraction in Croatian. We then proceed by describing and implementing a rule-based predictor, a configura- tion of support vector machines, and a SEARN-based model for named entity relation extraction. The models are then compared on the produced dataset, their performance being evaluated in terms of F1 scores and related metrics 
653 1 |a Združeno učenje, SEARN, ekstrakcija relacija, imenovani entitet, hrvatski jezik, obrada prirodnog jezika 
653 1 |a Joint learning, SEARN, relation extraction, named entity, Croatian language, natural language processing 
700 1 |a Šnajder, Jan  |4 ths 
942 |c Y 
999 |c 49894  |d 49894