|
|
|
|
LEADER |
02763na a2200241 4500 |
003 |
HR-ZaFER |
005 |
20160714132446.0 |
008 |
160221s2015 ci ||||| m||| 00| 0 hr d |
035 |
|
|
|a (HR-ZaFER)ferid2630
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Šafarić, Mihael
|9 37569
|
245 |
1 |
0 |
|a Postupci odabira značajki i prikaza dokumenta za klasifikaciju teksta :
|b diplomski rad /
|c Mihael Šafarić ; [mentor Jan Šnajder].
|
246 |
1 |
|
|a Feature Selection and Document Representation Methods for Text Classification
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b M. Šafarić,
|c 2015.
|
300 |
|
|
|a 33 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b diplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2015-06-30, datum završetka: 2015-07-14
|
520 |
3 |
|
|a Sažetak na hrvatskom: S porastom količine digitalnih informacija raste i potreba za metodama klasifikacije teksta koje su učinkovitinije i u mogućnosti obraditi velike količine podataka. Iz tog razloga pozornost se sve više okreće metodama temeljenim na strojnom učenju. U ovom radu isprobane su metode koje koriste reprezentaciju dokumenta kao vreće riječi koje u prvom koraku rade odabir najznačajnijih značajki. Uz to, isprobane su i metode temeljene na neuronskim mrežama koje za pojedini dokument grade njegovu vektorsku reprezentaciju.Korištenjem tih metoda ostvarili su se bolji rezultati nego korištenjem metoda koje koriste reprezentaciju dokumenta kao vreće riječi. Svi eksperimenti provedeni su nad različitim zbirkama tekstova na hrvatskom i engleskom jeziku.
|
520 |
3 |
|
|a Sažetak na engleskom: With growing amount of online information, there is a growing need for text classification methods that are more efficient and capable to process large amount of data. Therefore, there is increased attention to the methods based on machine learning. This paper experiments with methods that use bag-of-words document representation and feature selection methods. In addition, this paper experiments with a neural network based methods. These methods build vector representation of each document and the results achieved with these methods are better than the results achieved using methods that use bag-of-words document representation. All of the experiments are performed over a few different document collections in Croatian and English.
|
653 |
|
1 |
|a strojno učenje
|a obrada prirodnog jezika
|a klasifikacija teksta
|a odabir značajki
|a word2vec
|a doc2vec
|a reprezentacija dokumenta
|
653 |
|
1 |
|a machine learning
|a natural language processing
|a text classification
|a feature selection
|a word2vec
|a doc2vec
|a document representation
|
700 |
1 |
|
|a Šnajder, Jan
|4 ths
|9 19016
|
942 |
|
|
|c Y
|2 udc
|
999 |
|
|
|c 46677
|d 46677
|