Primjena prediktivne analize nad tekstovima i audiološkim karakteristikama pjesama

Sažetak na hrvatskom: U ovom radu napravljena je prediktivna analiza koja postupkom regresije utvrđuje ovisnost godine izdavanja pjesme o njenim audiološkim karakteristikama te često ponavljanim riječima u pjesmi. Podaci o pjesmama su dobiveni iz podatkovnih skupova „The Million Song Dataset“ i „The...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:45226/Details
Glavni autor: Župančić, Mihael (-)
Ostali autori: Banek, Marko (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, M. Župančić, 2014.
Predmet:
LEADER 03126na a2200241 4500
003 HR-ZaFER
005 20160516012012.0
008 160221s2014 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid1761 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Župančić, Mihael  |9 35424 
245 |a Primjena prediktivne analize nad tekstovima i audiološkim karakteristikama pjesama :  |b diplomski rad /  |c Mihael Župančić ; [mentor Marko Banek]. 
246 1 |a Applying predictive data analysis on texts and audio features of songs  |i Naslov na engleskom:  
260 |a Zagreb,  |b M. Župančić,  |c 2014. 
300 |a 51 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 54, datum predaje: 2014-06-30, datum završetka: 2014-07-04 
520 3 |a Sažetak na hrvatskom: U ovom radu napravljena je prediktivna analiza koja postupkom regresije utvrđuje ovisnost godine izdavanja pjesme o njenim audiološkim karakteristikama te često ponavljanim riječima u pjesmi. Podaci o pjesmama su dobiveni iz podatkovnih skupova „The Million Song Dataset“ i „The musiXmatch Dataset“. Objašnjeni i korišteni su različiti analitički i korektivni postupci za dobivanje konačnog regresijskog modela. Najprije je izrađen model za predviđanje godine isključivo na temelju audioloških karakteristika. Konačni model je unakrsno ispitan te su analizom važnosti varijabli modela izvedeni zaključci o odnosima zavisne i nezavisnih varijabli. Potom je napravljen i model za predviđanje godine izdavanja pjesme iz često pojavljivanih riječi u pjesmi te je zavisna varijabla tog modela dodana kao nezavisna varijabla u model odnosa godine i audioloških karakteristika. Novi, kombinirani model je također unakrsno ispitan.  
520 3 |a Sažetak na engleskom: In this thesis predictive analysis by means of regression was made in order to determine possible dependency between the release year of songs and their audio characteristics as well as most frequent words in their lyrics. Data on songs were taken from the Million Song Dataset as well as The musicXmatch Dataset. Analytical and corrective measures have been explained and applied on the data in order to construct the final regression model. The first type of model predicts the release year of a song based exclusively on its audio characteristics. Using cross validation, the model was examined and relationships between the dependent variable and independent variables have been explained. Another model was made to predict the song release year from the count of most frequenty words in the lyrics of a song. The dependent variable of this model was added as an independent variable to the first model type and a cross validation was made for the new, combined model type.  
653 1 |a dubinska analiza podataka  |a linearna regresija  |a korelacija  |a the million song database 
653 1 |a data mining  |a linear regression  |a correlation  |a the million song database 
700 1 |a Banek, Marko  |4 ths  |9 30922 
942 |2 udc  |c Y 
999 |c 45226  |d 45226