|
|
|
|
LEADER |
03458nam a2200229uu 4500 |
005 |
20190312142539.0 |
008 |
s2005 ci a |||||||||| ||eng|d |
035 |
|
|
|a HR-ZaFER 34110
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
041 |
|
|
|a eng
|
080 |
|
|
|a 621.39
|h ELEKTROTEHNIKA
|j TELEKOMUNIKACIJE. TELEUPRAVLJANJE (DALJINSKO)
|e 621.3
|9 1248
|
100 |
1 |
|
|9 30985
|a Zorić, Goranka
|
245 |
|
|
|a Automatic lip synchronization by speech signal analysis = Automatska sinkronizacija usana pomoću analize govornog signala :
|b master thesis = magistarski rad /
|c Goranka Zorić ; [mentor Igor S. Pandžić]
|
260 |
|
|
|a Zagreb :
|b G. Zorić ; Fakultet elektrotehnike i računarstva,
|c 2005.
|
300 |
|
|
|a ix, 74 str. :
|b ilustr. ;
|c 30 cm +
|e CD
|
504 |
|
|
|a Bibliografija str. 69-72.
|
520 |
|
|
|a Ovaj magistarski rad istražuje automatsku sinkronizaciju usana. To je metoda generiranja odgovarajuće animacije 3D modela ljudskog lica s obzirom na postojeći zvučni signal govora, tako da se dobiva animirani lik koji govori. Postupak je potpuno automatiziran i počinje od zvučnog signala govora. Automatska sinkronizacija govora sastoji se od dva dijela: preslikavanja iz ulaznog audio u izlazni vizualni skup parametara i sinteze lica. U radu je predložen i napravljen sistem za automatsku sinkronizaciju usana temeljen samo na govornom signalu. Klasifikacija govornog signala u grupe vizeme izvedena je pomoću neuronskih mreža. Optimalna topologija neuronskih mreža se automatski određuje pomoću genetičkih algoritama. Vizemi, vizualni predstavnici fonema, definirani su u MPEG-4 FA standardu, a koriste se za sintezu lica. Sistem je optimiziran za specifičnosti hrvatskog jezika. Za validaciju sistema korištene su tri različite metode testiranja., a potencijalne primjene ovakvih tehnologija izložene su do detalja. Opisana metoda za sinkronizaciju usana prikladna je za primjene u stvarnom vremenu ali i za offline produkcije. Neovisna je o govorniku i višejezična je. Ključne riječi: sinkronizacija usana, animacija lica, MPEG-4 FBA, virtualni ljudi, obrada govora, neuralne mreže, genetički algoritmi
|
520 |
|
|
|a This master thesis investigates automatic lip synchronization. It is a method for generating an animation of 3D human face model where the animation is driven only by a speech signal. The whole process is completely automatic and starts from the speech signal. The automatic lip synchronization consists of two main parts: audio to visual mapping and a face synthesis. The thesis proposes and implements a system for the automatic lip synchronization of synthetic 3D avatars based only on the speech input. The speech signal is classified into viseme classes using neural networks. The topology of neural networks is automatically configured using genetic algorithms. Visual representation of phonemes, viseme, defined in MPEG-4 FA, is used for face synthesis. The system is adopted for specificity of the Croatian language. Detailed system validation based on three different evaluation methods is done and potential applications of these technologies are discussed in details. This method is suitable for real-time and offline applications. It is speaker independent and multilingual. Keywords: lip synchronization, facial animation, MPEG-4 FBA, virtual characters, speech processing, neural networks, genetic algorithms
|
700 |
|
|
|4 ths
|9 17967
|a Pandžić, Igor Sunday
|
942 |
|
|
|c M
|2 udc
|
990 |
|
|
|a 31906
|
999 |
|
|
|c 29711
|d 29711
|