|
|
|
|
| LEADER |
02005na a2200229 4500 |
| 003 |
HR-ZaFER |
| 008 |
160221s2017 ci ||||| m||| 00| 0 hr d |
| 035 |
|
|
|a (HR-ZaFER)ferid5072
|
| 040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
| 100 |
1 |
|
|a Srdić, Ivan
|
| 245 |
1 |
0 |
|a Kontekstna provjera pravopisa temeljena na n-gramima :
|b diplomski rad /
|c Ivan Srdić ; [mentor Gordan Gledec].
|
| 246 |
1 |
|
|a Contextual Spellchecking Based on N-grams
|i Naslov na engleskom:
|
| 260 |
|
|
|a Zagreb,
|b I. Srdić,
|c 2017.
|
| 300 |
|
|
|a 28 str. ;
|c 30 cm +
|e CD-ROM
|
| 502 |
|
|
|b diplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 54, datum predaje: 2017-06-29, datum završetka: 2017-07-07
|
| 520 |
3 |
|
|a Sažetak na hrvatskom: U ovom radu prikazano je da je, neovisno o složenosti hrvatskog jezika, moguće napraviti sustav za ispravak kontekstnih grešaka. Podjelom sustava na komponente omogućena je jednostavna nadogradnja postojeće implementacije. Korištenjem dobro poznatih klasifikatora i procjenitelja frekvencije s manjim optimizacijama i podjelom grešaka u confusion setove dobiven je sustav za kontekstnu provjeru pravopisa koji na primjeru korištenom u radu ima visoki F_1 = 0.95.
|
| 520 |
3 |
|
|a Sažetak na engleskom: In this thesis it was shown that it is possible to create a system for contextual spellchecking regardless of the complexity of the Croatian language. Simple upgrading of the existing implementation was achieved by separating the system into several components. Using a well known classifier and frequency estimator with smaller tweaks and by separating errors into confusion sets resulted in a contextual spellchecking system which had a high score of F_1 = 0.95 on the example examined in the thesis.
|
| 653 |
|
1 |
|a kontekstna provjera pravopisa
|a statistički pristup
|a n-grami
|
| 653 |
|
1 |
|a contextual spellchecking
|a statistical approach
|a n-grams
|
| 700 |
1 |
|
|a Gledec, Gordan
|4 ths
|
| 942 |
|
|
|c Y
|
| 999 |
|
|
|c 50108
|d 50108
|