MARC: Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu

Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu

U radu se ispituju mogućnosti identificiranja prijevodnih ekvivalenta u Hrvatsko-engleskom paralelnom korpusu sravnjenom (aligned) na razini rečenica koji je sastavljen u Zavodu za lingvistiku Filozofskog fakulteta u Zagrebu. Pozornost je u početku usmjerena na identifikaciju prijevodnih ekvivalenat...

Full description

Permalink:	http://skupni.nsk.hr/Record/ffzg.KOHA-OAI-FFZG:305647/Details
Matična publikacija:	Filologija 38-39 (2002), 38-39 ; str. 247-262
Glavni autori:	Tadić, Marko (-), Šojat, Krešimir (Author)
Vrsta građe:	Članak
Jezik:	eng


LEADER	03171naa a2200253uu 4500
008	131105s2002 xx eng\|d
022			\|a 0449-369X
035			\|a (CROSBI)125765
040			\|a HR-ZaFF \|b hrv \|c HR-ZaFF \|e ppiak
100	1		\|a Tadić, Marko
245	1	0	\|a Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu / \|c Tadić, Marko ; Šojat, Krešimir.
246	3		\|i Naslov na engleskom: \|a Identification of translational equivalents in Croatian-English Parallel Corpus
300			\|a 247-262 \|f str.
363			\|a 38-39 \|b 38-39 \|i 2002
520			\|a U radu se ispituju mogućnosti identificiranja prijevodnih ekvivalenta u Hrvatsko-engleskom paralelnom korpusu sravnjenom (aligned) na razini rečenica koji je sastavljen u Zavodu za lingvistiku Filozofskog fakulteta u Zagrebu. Pozornost je u početku usmjerena na identifikaciju prijevodnih ekvivalenata od po jedne riječi u svakom jeziku. To je postignuto generiranjem svih mogućih prijevodnih parova riječi unutar svake rečenice sravnjene u odnosu 1:1. Na tako generirane parove primijenjen je izračun statističke mjere uzajamne obavijesnosti (mutual information) koja daje podatak od statistički relevantnim supojavljivanjima riječi u takvu paru. Parovi s visokom vrijednošću uzajamne obavijesnosti predstavljaju dobre kandidate za prijevodne ekvivalente. U nastavku se rada provodi identifikacija jedinica sastavljenih od više riječi (multi-word units) u izvornim (hrvatskim) tekstovima i to primjenom iste statističke mjere. Identičan se postupak rabi za ustanovljavanje relevantnog supojavljivanja parova riječi i u jeziku prijevoda (engleski). Kako bi se ustanovili potencijalni kandidati za prijevodne ekvivalente tako dobivenih parova riječi u pojedinom jeziku, u nastavku se izračunavaju i statistički značajna supojavljivanja izvornih i prijevodnih parova riječi. Tako su dobiveni karakteristični prijevodni uzorci jer se pokazalo da postoje parovi riječi u izvornom jeziku koji se redovito prevode istim parom riječi u ciljnome jeziku premda je u svakom od jezika pojedinačno, vrijednost njihove uzajamne obavijesnosti izrazito niska. Radom se želi prikazati kako se korištenjem statističkih postupaka u paralelnim korpusima olakšava pronalaženje kolokacija (mogućih višerječnih termina) i njihovih prijevoda. Istodobno se omogućuje uvid u odgovarajuće ko-tekstualne primjere uporabe riječi u izvornom jeziku i u jeziku prijevoda. Tako priređena građa od nesumnjive je koristi kako dvojezičnim leksikografima kao autorima rječnika, tako i prevoditeljima kao najznatnijoj skupini rječničkih korisnika.
536			\|a Projekt MZOS \|f 0130418
546			\|a ENG
690			\|a 6.03
693			\|a Hrvatsko-engleski paralelni korpus, višerječne jedinice, prijevodni ekvivalenti, sravnjivanje riječi, uzajamna obavijesnost \|l hrv \|2 crosbi
693			\|a Croatian-English parallel corpus, multi-word units, translational equivalents, word alignment, mutual information \|l eng \|2 crosbi
700	1		\|a Šojat, Krešimir \|4 aut
773	0		\|t Filologija \|x 0449-369X \|g 38-39 (2002), 38-39 ; str. 247-262
942			\|c CLA \|t 1.01 \|u 1 \|z Znanstveni - clanak
999			\|c 305647 \|d 305645

Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu

Slični primjerci