Metode razlikovanja govora i glazbe u digitalnim zvučnim zapisima

Sažetak na hrvatskom: U sklopu ovog diplomskog rada obrađen je povijesni pregled na metode razlikovanja govora i glazba te je napravljen pregled različitih čimbenika koji utječu na uspješnost klasifikacije. To su prije svega parametri zvuka, u vremenskoj domeni postotak okvira niske energije i broj...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:46367/Details
Glavni autor: Križanić, Ivan (-)
Ostali autori: Petrinović, Davor (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, I. Križanić, 2015.
Predmet:
LEADER 02926na a2200241 4500
003 HR-ZaFER
005 20160718132709.0
008 160221s2015 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid2483 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Križanić, Ivan  |9 37638 
245 1 0 |a Metode razlikovanja govora i glazbe u digitalnim zvučnim zapisima :  |b diplomski rad /  |c Ivan Križanić ; [mentor Davor Petrinović]. 
246 1 |a Methods for speech and music discrimination in digital soundtracks  |i Naslov na engleskom:  
260 |a Zagreb,  |b I. Križanić,  |c 2015. 
300 |a 71 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Elektroničko i računalno inženjerstvo, šifra smjera: 48, datum predaje: 2015-06-30, datum završetka: 2015-07-10 
520 3 |a Sažetak na hrvatskom: U sklopu ovog diplomskog rada obrađen je povijesni pregled na metode razlikovanja govora i glazba te je napravljen pregled različitih čimbenika koji utječu na uspješnost klasifikacije. To su prije svega parametri zvuka, u vremenskoj domeni postotak okvira niske energije i broj prolaza kroz ništicu, u frekvencijskoj domeni spektralni centroid, spektralni tok, frekvencija većinske spektralne snage te u kepstralnoj domeni modulacijska energija na 4 Hz i modul razlike spektra i rekonstruiranog spektra iz kepstra. Rad se zatim fokusira na različite klasifikatore koje je moguće koristiti u sklopu razlikovanja govora i glazbe te obrađuje četiri različita klasifikatora. Na kraju se diskutiraju dvije različite gotove metode koje se mogu koristiti za klasificiranje govora i glazbe. 
520 3 |a Sažetak na engleskom: In the first part of this Masters' Thesis there is a historical overview of the methods for Speech/Music Discrimination and a survey of various factors that affect the classification performance. These factors consist primarily of parameters of sound. In the time domain, they include percentage of low-energy frames and zero crossing rate, in the frequency domain there are spectral centroid, spectral flux, spectral rolloff point and in the cepstral domain there are 4 Hz modulation energy. The Thesis then focuses on different classifiers that can be used for speech/music discrimination, pinpointing four different classifiers. Finally, two different methods that can be used to classify speech and music are discussed. 
653 1 |a digitalna obrada zvuka  |a razlikovanje govora i glazbe  |a broj prolaza kroz ništicu  |a spektralni tok  |a spektralni centroid  |a MFCC koeficijenti  |a MAP estimator  |a Gaussove mješavine  |a k-d stabla  |a k-NN algoritam 
653 1 |a digital sound processing  |a speech/music discrimination  |a zero-crossing rate  |a spectral flux  |a spectral centroid  |a MFCC coefficients  |a the MAP estimator  |a Gaussian mixtures  |a k-d trees  |a k-NN algorithm 
700 1 |a Petrinović, Davor  |4 ths  |9 13132 
942 |c Y  |2 udc 
999 |c 46367  |d 46367