Otkrivanje pogrešaka leksičkog transfera u tekstovima učenika stranog jezika

Sažetak na hrvatskom: Automatizirano ispravljanje pogrešaka važan je zadatak obrade prirodnog jezika. Pogreške leksičkog transfera učestala su kod učenika stranih jezika. Najčešći je uzrok transfera višeznačnost riječi. Cilj ovog rada bio je osmisliti model koji otkriva i ispravlja takve pogreške za...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:48925/Details
Glavni autor: Kačan, Marin (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, M. Kačan, 2016.
Predmet:
LEADER 02648na a2200229 4500
003 HR-ZaFER
008 160221s2016 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid3854 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Kačan, Marin 
245 1 0 |a Otkrivanje pogrešaka leksičkog transfera u tekstovima učenika stranog jezika :  |b završni rad /  |c Marin Kačan ; [mentor Jan Šnajder]. 
246 1 |a Detecting Lexical Transfer Errors of Second Language Learners  |i Naslov na engleskom:  
260 |a Zagreb,  |b M. Kačan,  |c 2016. 
300 |a 38 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2016-06-17, datum završetka: 2016-07-11 
520 3 |a Sažetak na hrvatskom: Automatizirano ispravljanje pogrešaka važan je zadatak obrade prirodnog jezika. Pogreške leksičkog transfera učestala su kod učenika stranih jezika. Najčešći je uzrok transfera višeznačnost riječi. Cilj ovog rada bio je osmisliti model koji otkriva i ispravlja takve pogreške za dva tipa jezičnih relacija: pridjevsko-imeničke i glagolsko-objektne. Implementirana su dva različita modela, od kojih drugi koristi metode nadziranog strojnog učenja, preciznije algoritam regresije pomoću stroja s potpornim vektorima. Jezik implementacije je Python. Ovaj projekt nastao je u suradnji s kineskim sveučilištem Xi'an Jiaotong-Liverpool University, te se oni ustupili skup podataka koji se jednim dijelom koristi u ovome radu. 
520 3 |a Sažetak na engleskom: Automated error correction is an important task of natural language processing. Lexical transfer errors are common with L2-learners. The biggest cause of transfer is word polysemy. The goal of this paper was to come up with a model that can detect and correct such errors for two language relation types: adjective-noun and verb-object. Two different models were implemented, the second of which uses supervised learning methods, more precisely the support vector regression algorithm. The model was implemented in Python. This project is carried out in cooperation with Xi'an Jiaotong-Liverpool University, China, who also make the dataset available, a part of which was used in this paper. 
653 1 |a obrada prirodnog jezika  |a automatizirano ispravljanje pogrešaka  |a leksički transfer  |a višeznačnost  |a relacije  |a stroj s potpornim vektorima  |a regresija 
653 1 |a natural language processing  |a automated error correction  |a lexical transfer  |a polysemy  |a relations  |a support vector machine  |a regression 
700 1 |a Šnajder, Jan  |4 ths 
942 |c Z 
999 |c 48925  |d 48925