Leksička flektivna baza podataka hrvatskih imena i prezimena
U radu je opisan paradigmatski model, struktura i izrada flektivne baze podataka hrvatskih imena i prezimena (za pisani jezik) te njezina moguća upotreba u sustavima za pretraživanje podataka, sustavima za segmentaciju teksta, korektorima pogrešaka, te sustavima za gramatičku analizu teksta. Bazu po...
Permalink: | http://skupni.nsk.hr/Record/ffzg.KOHA-OAI-FFZG:311034/Details |
---|---|
Matična publikacija: |
Modeli znanja i obrada prirodnoga jezika Radovi Zavoda za informacijske studije ; knj. 12 |
Glavni autori: | Boras, Damir (-), Mikelić, Nives (Author), Lauc, Davor |
Vrsta građe: | Članak |
Jezik: | hrv |
LEADER | 02599naa a2200265uu 4500 | ||
---|---|---|---|
008 | 131111s2003 xx hrv|d | ||
020 | |a 953175-181-1 | ||
035 | |a (CROSBI)132098 | ||
040 | |a HR-ZaFF |b hrv |c HR-ZaFF |e ppiak | ||
100 | 1 | |a Boras, Damir | |
245 | 1 | 0 | |a Leksička flektivna baza podataka hrvatskih imena i prezimena / |c Boras, Damir ; Mikelić, Nives ; Lauc, Davor. |
246 | 3 | |i Naslov na engleskom: |a Lexical Inflectional Database of Croatian First and Last Names | |
300 | |a 219-237 |f str. | ||
520 | |a U radu je opisan paradigmatski model, struktura i izrada flektivne baze podataka hrvatskih imena i prezimena (za pisani jezik) te njezina moguća upotreba u sustavima za pretraživanje podataka, sustavima za segmentaciju teksta, korektorima pogrešaka, te sustavima za gramatičku analizu teksta. Bazu podataka čine sva postojeća osobna imena i prezimena u Republici Hrvatskoj prikupljena iz dostupnih javnih izvora. Iz baze je moguće dobiti sve oblike za određeno ime u skladu s pravilima koja postoje za hrvatski jezik i koja su radi cjelovitosti rada također izložena. Budući da infleksijska baza sadrži i čestotu pojavljivanja određenog imena na području RH, moguće su i različite statističke analize, te upotreba baze kao modula za prepoznavanje osobnih imena u sustavima za pretraživanje punog teksta koji se koriste i vjerojatnosnim modelom prepoznavanja. Stoga su izložena i pravila slaganja osobnih imena s prezimenima. Osim što je u informatičkom smislu to prva takva baza imena i prezimena u nas, a od ostalih se infleksijskih baza riječi hrvatskoga jezika razlikuje i jednostavnijom paradigmatskom strukturom, ona i u lingvističkom smislu predstavlja novost jer donosi niz razrješenja za imena i prezimena kojima pripadajuću nastavačku paradigmu nije bilo moguće odrediti samo na temelju gramatičkih pravila, nego je bilo potrebno ući i u semantiku i etimologiju pojedinih imena i prezimena. | ||
536 | |a Projekt MZOS |f 0130423 | ||
536 | |a Projekt MZOS |f 0130464 | ||
546 | |a HRV | ||
690 | |a 5.04 | ||
693 | |a flektivna baza, osobna imena i prezimena, pretraživanje obavijesti |l hrv |2 crosbi | ||
693 | |a inflectional database, first and last names, information retrieval |l eng |2 crosbi | ||
700 | 1 | |a Mikelić, Nives |4 aut | |
700 | 1 | |a Lauc, Davor |4 aut | |
773 | 0 | |t Modeli znanja i obrada prirodnoga jezika |d Zagreb : Zavod za informacijske studije, Filozofski fakultet, 2003 |k Radovi Zavoda za informacijske studije ; knj. 12 |h 272 |n Tuđman, Miroslav |z 953-175-181-1 |g str. 219-237 | |
942 | |c POG |t 1.16.1 |u 1 |z Znanstveni | ||
999 | |c 311034 |d 311032 |