Neuralne mreže u izdvajanju govornog signala iz zvučnog zapisa

Sažetak na hrvatskom: U ovom radu dan je pregled trenutnog stanja područja izdvajanja govora i pregled najuspješnijih strategija za izdvajanje govora. Poseban naglasak stavljen je na duboke neuronske mreže. Odabrana je BLSTM-RNN arhitektura neuronske mreže i CURRENNT kao programski paket za rad s to...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:46438/Details
Glavni autor: Henc, Stjepan (-)
Ostali autori: Dembitz, Šandor (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, S. Henc, 2015.
Predmet:
LEADER 02295na a2200241 4500
003 HR-ZaFER
005 20160704093510.0
008 160221s2015 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid2413 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Henc, Stjepan  |9 37311 
245 1 0 |a Neuralne mreže u izdvajanju govornog signala iz zvučnog zapisa :  |b diplomski rad /  |c Stjepan Henc ; [mentor Šandor Dembitz]. 
246 1 |a Neural networks in separation of voice signal from audio record  |i Naslov na engleskom:  
260 |a Zagreb,  |b S. Henc,  |c 2015. 
300 |a 40 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računalno inženjerstvo, šifra smjera: 55, datum predaje: 2015-06-30, datum završetka: 2015-07-09 
520 3 |a Sažetak na hrvatskom: U ovom radu dan je pregled trenutnog stanja područja izdvajanja govora i pregled najuspješnijih strategija za izdvajanje govora. Poseban naglasak stavljen je na duboke neuronske mreže. Odabrana je BLSTM-RNN arhitektura neuronske mreže i CURRENNT kao programski paket za rad s tom mrežom. Uspješnost izdvajanja govora je ispitana na skupu podataka prvog zadatka drugog CHiME natjecanja (engl. CHiME 2nd challenge Task 1) i postignuto je apsolutno poboljšanje točnosti od 25% za prepoznavanje govora sa smetnjama koristeći sustav za prepoznavanje čistog govora s malim opsegom rječnika.  
520 3 |a Sažetak na engleskom: An overview of recent developments in the field of speech extraction is given, including a survey of most successful strategies. A special emphasis is put on approaches based on deep neural networks. The BLSTM-RNN neural network architecture is chosen along with the CURRENNT software package for working with the network. Success of speech extraction is evaluated on Task 1 of the CHiME 2nd challenge, and an absolute improvement in word accuracy of 25% is achieved on a noisy speech recognition task using a small-dictionary ASR system specialised for clean speech. 
653 1 |a izdvajanje govora  |a duboke neuronske mreže  |a RNN  |a BLSTM  |a CUDA  |a CHiME  |a CURRENNT 
653 1 |a speech extraction  |a deep neural networks  |a RNN  |a BLSTM  |a CUDA  |a CHiME  |a CURRENNT  
700 1 |a Dembitz, Šandor  |4 ths  |9 9620 
942 |c Y  |2 udc 
999 |c 46438  |d 46438