Rekonstrukcija zvučnih zapisa primjenom metoda strojnog učenja

Sažetak na hrvatskom: Rekonstrukcija zvuka područje je dubokog učenja koje je još uvijek u razvoju. Ovaj se rad bavi generativnim suparničkim mrežama i korištenjem suparničkog treninga na parovima zvuka niske i visoke razlučivosti kako bi se stvorio model za rekonstrukciju zvuka. Detaljno su opisan...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:50975/Details
Glavni autor: Kordiš, Lovro (-)
Ostali autori: Delač, Goran (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, L. Kordiš, 2019.
Predmet:
LEADER 02264na a2200229 4500
003 HR-ZaFER
008 160221s2019 ci ||||| m||| 00| 0 en d
035 |a (HR-ZaFER)ferid6638 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Kordiš, Lovro  |9 40251 
245 1 0 |a Rekonstrukcija zvučnih zapisa primjenom metoda strojnog učenja :  |b diplomski rad /  |c Lovro Kordiš ; [mentor Goran Delač]. 
246 1 |a Reconstruction of Audio Recordings Using Machine Learning Techniques  |i Naslov na engleskom:  
260 |a Zagreb,  |b L. Kordiš,  |c 2019. 
300 |a 44 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2019-06-28, datum završetka: 2019-07-09 
520 3 |a Sažetak na hrvatskom: Rekonstrukcija zvuka područje je dubokog učenja koje je još uvijek u razvoju. Ovaj se rad bavi generativnim suparničkim mrežama i korištenjem suparničkog treninga na parovima zvuka niske i visoke razlučivosti kako bi se stvorio model za rekonstrukciju zvuka. Detaljno su opisane duboke konvolucijske i generativnesuparničke mreže. Implementiran je duboki konvolucijski U-Net suparnički model, te su ispitane dvije funkcije gubitka - Wasserstein i Relativistički gubitak. Model je evaluiran na VCTK skupu podataka. Na kraju su prikazani rezultati i slike spektrograma. 
520 3 |a Sažetak na engleskom: Audio super resolution is still a developing field in deep learning. This paper deals with generative adversarial networks and using the adversarial training on pairs of low and high resolution audios to create a model for audio super resolution. Deep convolutional and generative adversarial networks are described in detail. A deep convolutional U-Net adversarial model is implemented, and two adversarial loss functions are tested - Wasserstein and Relativistic loss. Model is evaluated on VCTK dataset. Finally, the results and spectogram images are presented.  
653 1 |a strojno učenje  |a duboko učennje  |a generativne suparničke mreže  |a rekonstrukcija zvuka 
653 1 |a machine learning  |a deep learning  |a generative adversarial networks  |a audio super resolution 
700 1 |a Delač, Goran  |4 ths  |9 40252 
942 |c Y 
999 |c 50975  |d 50975