Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu
U radu se ispituju mogućnosti identificiranja prijevodnih ekvivalenta u Hrvatsko-engleskom paralelnom korpusu sravnjenom (aligned) na razini rečenica koji je sastavljen u Zavodu za lingvistiku Filozofskog fakulteta u Zagrebu. Pozornost je u početku usmjerena na identifikaciju prijevodnih ekvivalenat...
Permalink: | http://skupni.nsk.hr/Record/ffzg.KOHA-OAI-FFZG:305647/Details |
---|---|
Matična publikacija: |
Filologija 38-39 (2002), 38-39 ; str. 247-262 |
Glavni autori: | Tadić, Marko (-), Šojat, Krešimir (Author) |
Vrsta građe: | Članak |
Jezik: | eng |
LEADER | 03171naa a2200253uu 4500 | ||
---|---|---|---|
008 | 131105s2002 xx eng|d | ||
022 | |a 0449-369X | ||
035 | |a (CROSBI)125765 | ||
040 | |a HR-ZaFF |b hrv |c HR-ZaFF |e ppiak | ||
100 | 1 | |a Tadić, Marko | |
245 | 1 | 0 | |a Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu / |c Tadić, Marko ; Šojat, Krešimir. |
246 | 3 | |i Naslov na engleskom: |a Identification of translational equivalents in Croatian-English Parallel Corpus | |
300 | |a 247-262 |f str. | ||
363 | |a 38-39 |b 38-39 |i 2002 | ||
520 | |a U radu se ispituju mogućnosti identificiranja prijevodnih ekvivalenta u Hrvatsko-engleskom paralelnom korpusu sravnjenom (aligned) na razini rečenica koji je sastavljen u Zavodu za lingvistiku Filozofskog fakulteta u Zagrebu. Pozornost je u početku usmjerena na identifikaciju prijevodnih ekvivalenata od po jedne riječi u svakom jeziku. To je postignuto generiranjem svih mogućih prijevodnih parova riječi unutar svake rečenice sravnjene u odnosu 1:1. Na tako generirane parove primijenjen je izračun statističke mjere uzajamne obavijesnosti (mutual information) koja daje podatak od statistički relevantnim supojavljivanjima riječi u takvu paru. Parovi s visokom vrijednošću uzajamne obavijesnosti predstavljaju dobre kandidate za prijevodne ekvivalente. U nastavku se rada provodi identifikacija jedinica sastavljenih od više riječi (multi-word units) u izvornim (hrvatskim) tekstovima i to primjenom iste statističke mjere. Identičan se postupak rabi za ustanovljavanje relevantnog supojavljivanja parova riječi i u jeziku prijevoda (engleski). Kako bi se ustanovili potencijalni kandidati za prijevodne ekvivalente tako dobivenih parova riječi u pojedinom jeziku, u nastavku se izračunavaju i statistički značajna supojavljivanja izvornih i prijevodnih parova riječi. Tako su dobiveni karakteristični prijevodni uzorci jer se pokazalo da postoje parovi riječi u izvornom jeziku koji se redovito prevode istim parom riječi u ciljnome jeziku premda je u svakom od jezika pojedinačno, vrijednost njihove uzajamne obavijesnosti izrazito niska. Radom se želi prikazati kako se korištenjem statističkih postupaka u paralelnim korpusima olakšava pronalaženje kolokacija (mogućih višerječnih termina) i njihovih prijevoda. Istodobno se omogućuje uvid u odgovarajuće ko-tekstualne primjere uporabe riječi u izvornom jeziku i u jeziku prijevoda. Tako priređena građa od nesumnjive je koristi kako dvojezičnim leksikografima kao autorima rječnika, tako i prevoditeljima kao najznatnijoj skupini rječničkih korisnika. | ||
536 | |a Projekt MZOS |f 0130418 | ||
546 | |a ENG | ||
690 | |a 6.03 | ||
693 | |a Hrvatsko-engleski paralelni korpus, višerječne jedinice, prijevodni ekvivalenti, sravnjivanje riječi, uzajamna obavijesnost |l hrv |2 crosbi | ||
693 | |a Croatian-English parallel corpus, multi-word units, translational equivalents, word alignment, mutual information |l eng |2 crosbi | ||
700 | 1 | |a Šojat, Krešimir |4 aut | |
773 | 0 | |t Filologija |x 0449-369X |g 38-39 (2002), 38-39 ; str. 247-262 | |
942 | |c CLA |t 1.01 |u 1 |z Znanstveni - clanak | ||
999 | |c 305647 |d 305645 |