Leksička flektivna baza podataka hrvatskih imena i prezimena

U radu je opisan paradigmatski model, struktura i izrada flektivne baze podataka hrvatskih imena i prezimena (za pisani jezik) te njezina moguća upotreba u sustavima za pretraživanje podataka, sustavima za segmentaciju teksta, korektorima pogrešaka, te sustavima za gramatičku analizu teksta. Bazu po...

Full description

Permalink: http://skupni.nsk.hr/Record/ffzg.KOHA-OAI-FFZG:311034/Details
Matična publikacija: Modeli znanja i obrada prirodnoga jezika
Radovi Zavoda za informacijske studije ; knj. 12
Glavni autori: Boras, Damir (-), Mikelić, Nives (Author), Lauc, Davor
Vrsta građe: Članak
Jezik: hrv
LEADER 02599naa a2200265uu 4500
008 131111s2003 xx hrv|d
020 |a 953175-181-1 
035 |a (CROSBI)132098 
040 |a HR-ZaFF  |b hrv  |c HR-ZaFF  |e ppiak 
100 1 |a Boras, Damir 
245 1 0 |a Leksička flektivna baza podataka hrvatskih imena i prezimena /  |c Boras, Damir ; Mikelić, Nives ; Lauc, Davor. 
246 3 |i Naslov na engleskom:  |a Lexical Inflectional Database of Croatian First and Last Names 
300 |a 219-237  |f str. 
520 |a U radu je opisan paradigmatski model, struktura i izrada flektivne baze podataka hrvatskih imena i prezimena (za pisani jezik) te njezina moguća upotreba u sustavima za pretraživanje podataka, sustavima za segmentaciju teksta, korektorima pogrešaka, te sustavima za gramatičku analizu teksta. Bazu podataka čine sva postojeća osobna imena i prezimena u Republici Hrvatskoj prikupljena iz dostupnih javnih izvora. Iz baze je moguće dobiti sve oblike za određeno ime u skladu s pravilima koja postoje za hrvatski jezik i koja su radi cjelovitosti rada također izložena. Budući da infleksijska baza sadrži i čestotu pojavljivanja određenog imena na području RH, moguće su i različite statističke analize, te upotreba baze kao modula za prepoznavanje osobnih imena u sustavima za pretraživanje punog teksta koji se koriste i vjerojatnosnim modelom prepoznavanja. Stoga su izložena i pravila slaganja osobnih imena s prezimenima. Osim što je u informatičkom smislu to prva takva baza imena i prezimena u nas, a od ostalih se infleksijskih baza riječi hrvatskoga jezika razlikuje i jednostavnijom paradigmatskom strukturom, ona i u lingvističkom smislu predstavlja novost jer donosi niz razrješenja za imena i prezimena kojima pripadajuću nastavačku paradigmu nije bilo moguće odrediti samo na temelju gramatičkih pravila, nego je bilo potrebno ući i u semantiku i etimologiju pojedinih imena i prezimena. 
536 |a Projekt MZOS  |f 0130423 
536 |a Projekt MZOS  |f 0130464 
546 |a HRV 
690 |a 5.04 
693 |a flektivna baza, osobna imena i prezimena, pretraživanje obavijesti  |l hrv  |2 crosbi 
693 |a inflectional database, first and last names, information retrieval  |l eng  |2 crosbi 
700 1 |a Mikelić, Nives  |4 aut 
700 1 |a Lauc, Davor  |4 aut 
773 0 |t Modeli znanja i obrada prirodnoga jezika  |d Zagreb : Zavod za informacijske studije, Filozofski fakultet, 2003  |k Radovi Zavoda za informacijske studije ; knj. 12  |h 272  |n Tuđman, Miroslav  |z 953-175-181-1  |g str. 219-237 
942 |c POG  |t 1.16.1  |u 1  |z Znanstveni 
999 |c 311034  |d 311032