Automatic lip synchronization by speech signal analysis = Automatska sinkronizacija usana pomoću analize govornog signala

Ovaj magistarski rad istražuje automatsku sinkronizaciju usana. To je metoda generiranja odgovarajuće animacije 3D modela ljudskog lica s obzirom na postojeći zvučni signal govora, tako da se dobiva animirani lik koji govori. Postupak je potpuno automatiziran i počinje od zvučnog signala govora. Aut...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:29711/Details
Glavni autor: Zorić, Goranka (-)
Ostali autori: Pandžić, Igor Sunday (Thesis advisor)
Vrsta građe: Knjiga
Jezik: eng
Impresum: Zagreb : G. Zorić ; Fakultet elektrotehnike i računarstva, 2005.
LEADER 03458nam a2200229uu 4500
005 20190312142539.0
008 s2005 ci a |||||||||| ||eng|d
035 |a HR-ZaFER 34110 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
041 |a eng 
080 |a 621.39  |h ELEKTROTEHNIKA  |j TELEKOMUNIKACIJE. TELEUPRAVLJANJE (DALJINSKO)  |e 621.3  |9 1248 
100 1 |9 30985  |a Zorić, Goranka 
245 |a Automatic lip synchronization by speech signal analysis = Automatska sinkronizacija usana pomoću analize govornog signala :  |b master thesis = magistarski rad /  |c Goranka Zorić ; [mentor Igor S. Pandžić] 
260 |a Zagreb :  |b G. Zorić ; Fakultet elektrotehnike i računarstva,  |c 2005. 
300 |a ix, 74 str. :  |b ilustr. ;  |c 30 cm +  |e CD 
504 |a Bibliografija str. 69-72. 
520 |a Ovaj magistarski rad istražuje automatsku sinkronizaciju usana. To je metoda generiranja odgovarajuće animacije 3D modela ljudskog lica s obzirom na postojeći zvučni signal govora, tako da se dobiva animirani lik koji govori. Postupak je potpuno automatiziran i počinje od zvučnog signala govora. Automatska sinkronizacija govora sastoji se od dva dijela: preslikavanja iz ulaznog audio u izlazni vizualni skup parametara i sinteze lica. U radu je predložen i napravljen sistem za automatsku sinkronizaciju usana temeljen samo na govornom signalu. Klasifikacija govornog signala u grupe vizeme izvedena je pomoću neuronskih mreža. Optimalna topologija neuronskih mreža se automatski određuje pomoću genetičkih algoritama. Vizemi, vizualni predstavnici fonema, definirani su u MPEG-4 FA standardu, a koriste se za sintezu lica. Sistem je optimiziran za specifičnosti hrvatskog jezika. Za validaciju sistema korištene su tri različite metode testiranja., a potencijalne primjene ovakvih tehnologija izložene su do detalja. Opisana metoda za sinkronizaciju usana prikladna je za primjene u stvarnom vremenu ali i za offline produkcije. Neovisna je o govorniku i višejezična je. Ključne riječi: sinkronizacija usana, animacija lica, MPEG-4 FBA, virtualni ljudi, obrada govora, neuralne mreže, genetički algoritmi 
520 |a This master thesis investigates automatic lip synchronization. It is a method for generating an animation of 3D human face model where the animation is driven only by a speech signal. The whole process is completely automatic and starts from the speech signal. The automatic lip synchronization consists of two main parts: audio to visual mapping and a face synthesis. The thesis proposes and implements a system for the automatic lip synchronization of synthetic 3D avatars based only on the speech input. The speech signal is classified into viseme classes using neural networks. The topology of neural networks is automatically configured using genetic algorithms. Visual representation of phonemes, viseme, defined in MPEG-4 FA, is used for face synthesis. The system is adopted for specificity of the Croatian language. Detailed system validation based on three different evaluation methods is done and potential applications of these technologies are discussed in details. This method is suitable for real-time and offline applications. It is speaker independent and multilingual. Keywords: lip synchronization, facial animation, MPEG-4 FBA, virtual characters, speech processing, neural networks, genetic algorithms 
700 |4 ths  |9 17967  |a Pandžić, Igor Sunday 
942 |c M  |2 udc 
990 |a 31906 
999 |c 29711  |d 29711