Kontekstna provjera pravopisa temeljena na n-gramima

Sažetak na hrvatskom: U ovom radu prikazano je da je, neovisno o složenosti hrvatskog jezika, moguće napraviti sustav za ispravak kontekstnih grešaka. Podjelom sustava na komponente omogućena je jednostavna nadogradnja postojeće implementacije. Korištenjem dobro poznatih klasifikatora i procjenitelj...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:50108/Details
Glavni autor: Srdić, Ivan (-)
Ostali autori: Gledec, Gordan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, I. Srdić, 2017.
Predmet:
LEADER 02005na a2200229 4500
003 HR-ZaFER
008 160221s2017 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid5072 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Srdić, Ivan 
245 1 0 |a Kontekstna provjera pravopisa temeljena na n-gramima :  |b diplomski rad /  |c Ivan Srdić ; [mentor Gordan Gledec]. 
246 1 |a Contextual Spellchecking Based on N-grams  |i Naslov na engleskom:  
260 |a Zagreb,  |b I. Srdić,  |c 2017. 
300 |a 28 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 54, datum predaje: 2017-06-29, datum završetka: 2017-07-07 
520 3 |a Sažetak na hrvatskom: U ovom radu prikazano je da je, neovisno o složenosti hrvatskog jezika, moguće napraviti sustav za ispravak kontekstnih grešaka. Podjelom sustava na komponente omogućena je jednostavna nadogradnja postojeće implementacije. Korištenjem dobro poznatih klasifikatora i procjenitelja frekvencije s manjim optimizacijama i podjelom grešaka u confusion setove dobiven je sustav za kontekstnu provjeru pravopisa koji na primjeru korištenom u radu ima visoki F_1 = 0.95. 
520 3 |a Sažetak na engleskom: In this thesis it was shown that it is possible to create a system for contextual spellchecking regardless of the complexity of the Croatian language. Simple upgrading of the existing implementation was achieved by separating the system into several components. Using a well known classifier and frequency estimator with smaller tweaks and by separating errors into confusion sets resulted in a contextual spellchecking system which had a high score of F_1 = 0.95 on the example examined in the thesis. 
653 1 |a kontekstna provjera pravopisa  |a statistički pristup  |a n-grami 
653 1 |a contextual spellchecking  |a statistical approach  |a n-grams 
700 1 |a Gledec, Gordan  |4 ths 
942 |c Y 
999 |c 50108  |d 50108