MARC: Postupci odabira značajki i prikaza dokumenta za klasifikaciju teksta

Postupci odabira značajki i prikaza dokumenta za klasifikaciju teksta

Sažetak na hrvatskom: S porastom količine digitalnih informacija raste i potreba za metodama klasifikacije teksta koje su učinkovitinije i u mogućnosti obraditi velike količine podataka. Iz tog razloga pozornost se sve više okreće metodama temeljenim na strojnom učenju. U ovom radu isprobane su meto...

Full description

Permalink:	http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:46677/Details
Glavni autor:	Šafarić, Mihael (-)
Ostali autori:	Šnajder, Jan (Thesis advisor)
Vrsta građe:	Drugo
Impresum:	Zagreb, M. Šafarić, 2015.
Predmet:	strojno učenje > obrada prirodnog jezika > klasifikacija teksta > odabir značajki > word2vec > doc2vec > reprezentacija dokumenta machine learning > natural language processing > text classification > feature selection > word2vec > doc2vec > document representation


LEADER	02763na a2200241 4500
003	HR-ZaFER
005	20160714132446.0
008	160221s2015 ci \|\|\|\|\| m\|\|\| 00\| 0 hr d
035			\|a (HR-ZaFER)ferid2630
040			\|a HR-ZaFER \|b hrv \|c HR-ZaFER \|e ppiak
100	1		\|a Šafarić, Mihael \|9 37569
245	1	0	\|a Postupci odabira značajki i prikaza dokumenta za klasifikaciju teksta : \|b diplomski rad / \|c Mihael Šafarić ; [mentor Jan Šnajder].
246	1		\|a Feature Selection and Document Representation Methods for Text Classification \|i Naslov na engleskom:
260			\|a Zagreb, \|b M. Šafarić, \|c 2015.
300			\|a 33 str. ; \|c 30 cm + \|e CD-ROM
502			\|b diplomski studij \|c Fakultet elektrotehnike i računarstva u Zagrebu \|g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2015-06-30, datum završetka: 2015-07-14
520	3		\|a Sažetak na hrvatskom: S porastom količine digitalnih informacija raste i potreba za metodama klasifikacije teksta koje su učinkovitinije i u mogućnosti obraditi velike količine podataka. Iz tog razloga pozornost se sve više okreće metodama temeljenim na strojnom učenju. U ovom radu isprobane su metode koje koriste reprezentaciju dokumenta kao vreće riječi koje u prvom koraku rade odabir najznačajnijih značajki. Uz to, isprobane su i metode temeljene na neuronskim mrežama koje za pojedini dokument grade njegovu vektorsku reprezentaciju.Korištenjem tih metoda ostvarili su se bolji rezultati nego korištenjem metoda koje koriste reprezentaciju dokumenta kao vreće riječi. Svi eksperimenti provedeni su nad različitim zbirkama tekstova na hrvatskom i engleskom jeziku.
520	3		\|a Sažetak na engleskom: With growing amount of online information, there is a growing need for text classification methods that are more efficient and capable to process large amount of data. Therefore, there is increased attention to the methods based on machine learning. This paper experiments with methods that use bag-of-words document representation and feature selection methods. In addition, this paper experiments with a neural network based methods. These methods build vector representation of each document and the results achieved with these methods are better than the results achieved using methods that use bag-of-words document representation. All of the experiments are performed over a few different document collections in Croatian and English.
653		1	\|a strojno učenje \|a obrada prirodnog jezika \|a klasifikacija teksta \|a odabir značajki \|a word2vec \|a doc2vec \|a reprezentacija dokumenta
653		1	\|a machine learning \|a natural language processing \|a text classification \|a feature selection \|a word2vec \|a doc2vec \|a document representation
700	1		\|a Šnajder, Jan \|4 ths \|9 19016
942			\|c Y \|2 udc
999			\|c 46677 \|d 46677

Postupci odabira značajki i prikaza dokumenta za klasifikaciju teksta

Slični primjerci