Ekstrakcija semantičkih relacija između entiteta iz znanstvenih tekstova

Sažetak na hrvatskom: Ekstrakcija relacija je zadatak obrade prirodnog jezika i ekstrakcije informacija čijim rješavanjem omogućavamo sustavima strojnog učenja dublje razumijevanje teksta. Znanstveni radovi sadrže mnogo stručnih informacija koje je ponekad teško sustavno pregledati te se proučavanje...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:48618/Details
Glavni autor: Gluhak, Martin (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, M. Gluhak, 2018.
Predmet:
LEADER 03119na a2200229 4500
003 HR-ZaFER
008 160221s2018 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid5352 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Gluhak, Martin 
245 1 0 |a Ekstrakcija semantičkih relacija između entiteta iz znanstvenih tekstova :  |b diplomski rad /  |c Martin Gluhak ; [mentor Jan Šnajder]. 
246 1 |a Extracting Semantic Relations between Entities from Scientific Texts  |i Naslov na engleskom:  
260 |a Zagreb,  |b M. Gluhak,  |c 2018. 
300 |a 55 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2018-06-29, datum završetka: 2018-07-17 
520 3 |a Sažetak na hrvatskom: Ekstrakcija relacija je zadatak obrade prirodnog jezika i ekstrakcije informacija čijim rješavanjem omogućavamo sustavima strojnog učenja dublje razumijevanje teksta. Znanstveni radovi sadrže mnogo stručnih informacija koje je ponekad teško sustavno pregledati te se proučavanjem problema iz perspektive te domene otvaraju mogućnosti stvaranja alata koji bi olakšali pronalazak ključnih informacija. Bogat vokabular i složene strukture rečenica dodatna su prepreka pri određivanju relacija u tekstovima znanstvenih radova. Implementiran je model temeljen na ručno oblikovanim značajkama, kao i više modela iz područja dubokog učenja. Kako bi se modeli prilagodili specifičnom jeziku znanstvenih radova posebno su naučene vektorske reprezentacije riječi za tu domenu. Isprobane su metode proširenja skupa podataka u području značajka kako bi se riješio problem nebalansiranosti razreda te su primijenjene tehnike preoblikovanja primjera kako bi se eliminirale asimetrične relacije.  
520 3 |a Sažetak na engleskom: Relation extraction is a task related to the fields of natural language processing and information extraction, and by solving this task the machine learning systems gain deeper understanding of the given text. Scientific papers contain many expert information which is sometimes hard to systematically examine and by researching relation extraction, possibilities open for creating tools which will allow easier discovery of key information. Rich vocabulary and complex sentence structure pose an additional obstacle in correctly assessing the relation type specific to this domain of text. Model are implemented based on handcrafted features, aswell as multiple models from the area of deep learning. Custom word embeddings are trained in order to adapt to the specific language of scientific texts. The problem of class imbalance is tackled by data augmentation in feature space and techniques of sample reshaping in order to eliminate asymmetrical relations.  
653 1 |a obrada prirodnog jezika, strojno učenje, ekstrakcija relacija, duboko učenje, SVM, CNN, RNN, word2vec 
653 1 |a natural language processing, machine learning, relation extraction, deep learning, SVM, CNN, RNN, word2vec 
700 1 |a Šnajder, Jan  |4 ths 
942 |c Y 
999 |c 48618  |d 48618