MARC: Kontekstna provjera pravopisa temeljena na n-gramima

Kontekstna provjera pravopisa temeljena na n-gramima

Sažetak na hrvatskom: U ovom radu prikazano je da je, neovisno o složenosti hrvatskog jezika, moguće napraviti sustav za ispravak kontekstnih grešaka. Podjelom sustava na komponente omogućena je jednostavna nadogradnja postojeće implementacije. Korištenjem dobro poznatih klasifikatora i procjenitelj...

Full description

Permalink:	http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:50108/Details
Glavni autor:	Srdić, Ivan (-)
Ostali autori:	Gledec, Gordan (Thesis advisor)
Vrsta građe:	Drugo
Impresum:	Zagreb, I. Srdić, 2017.
Predmet:	kontekstna provjera pravopisa > statistički pristup > n-grami contextual spellchecking > statistical approach > n-grams


LEADER	02005na a2200229 4500
003	HR-ZaFER
008	160221s2017 ci \|\|\|\|\| m\|\|\| 00\| 0 hr d
035			\|a (HR-ZaFER)ferid5072
040			\|a HR-ZaFER \|b hrv \|c HR-ZaFER \|e ppiak
100	1		\|a Srdić, Ivan
245	1	0	\|a Kontekstna provjera pravopisa temeljena na n-gramima : \|b diplomski rad / \|c Ivan Srdić ; [mentor Gordan Gledec].
246	1		\|a Contextual Spellchecking Based on N-grams \|i Naslov na engleskom:
260			\|a Zagreb, \|b I. Srdić, \|c 2017.
300			\|a 28 str. ; \|c 30 cm + \|e CD-ROM
502			\|b diplomski studij \|c Fakultet elektrotehnike i računarstva u Zagrebu \|g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 54, datum predaje: 2017-06-29, datum završetka: 2017-07-07
520	3		\|a Sažetak na hrvatskom: U ovom radu prikazano je da je, neovisno o složenosti hrvatskog jezika, moguće napraviti sustav za ispravak kontekstnih grešaka. Podjelom sustava na komponente omogućena je jednostavna nadogradnja postojeće implementacije. Korištenjem dobro poznatih klasifikatora i procjenitelja frekvencije s manjim optimizacijama i podjelom grešaka u confusion setove dobiven je sustav za kontekstnu provjeru pravopisa koji na primjeru korištenom u radu ima visoki F_1 = 0.95.
520	3		\|a Sažetak na engleskom: In this thesis it was shown that it is possible to create a system for contextual spellchecking regardless of the complexity of the Croatian language. Simple upgrading of the existing implementation was achieved by separating the system into several components. Using a well known classifier and frequency estimator with smaller tweaks and by separating errors into confusion sets resulted in a contextual spellchecking system which had a high score of F_1 = 0.95 on the example examined in the thesis.
653		1	\|a kontekstna provjera pravopisa \|a statistički pristup \|a n-grami
653		1	\|a contextual spellchecking \|a statistical approach \|a n-grams
700	1		\|a Gledec, Gordan \|4 ths
942			\|c Y
999			\|c 50108 \|d 50108

Kontekstna provjera pravopisa temeljena na n-gramima

Slični primjerci