|
|
|
|
LEADER |
03161na a2200241 4500 |
003 |
HR-ZaFER |
005 |
20160516012013.0 |
008 |
160221s2014 ci ||||| m||| 00| 0 hr d |
035 |
|
|
|a (HR-ZaFER)ferid1196
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Radaković, Dino
|9 35712
|
245 |
|
|
|a Primjena semantičkih jezgrenih funkcija u klasifikaciji teksta :
|b završni rad /
|c Dino Radaković ; [mentor Jan Šnajder].
|
246 |
1 |
|
|a Applying Semantic Kernel Functions in Text Classification
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b D. Radaković,
|c 2014.
|
300 |
|
|
|a 37 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b preddiplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2014-06-13, datum završetka: 2014-07-14
|
520 |
3 |
|
|a Sažetak na hrvatskom: Klasifikacija teksta temeljem sadržaja jedan je od osnovnih zadataka koji se javljaju u domeni dubinske analize teksta. Često korišteni postupci uključuju predstavljanje dokumenata u vektorskom obliku, korištenjem vreća riječi. Iako su takve metode jednostavne i učinkovite, njima nije moguće modelirati dokument na konceptualnoj razini, što negativno utječe na kvalitetu klasifikatora koji se temelje na istima. Stoga je nedavno predloženo nekoliko različitih pristupa koji se temelje na povezivanju ontološkog znanja s tekstom. P. Wang i C. Domeniconi u svom radu iz 2008. opisuju jedan takav pristup, koji se temelji na korištenju Wikipedije za modeliranje dokumenata na semantičkoj razini, nazivajući ga ,,semantičkom jezgrenom funkcijom''. U okviru ovog rada izvedena su dva klasifikatora temeljena na strojevima potpornih vektora - jedan koji koristi vreće riječi i drugi, koji se temelji na semantičkoj jezgrenoj funkciji. Točnosti klasifikacije oba modela uspoređene su temeljem iscrpnog vrednovanja provedenog na zbirci dokumenata na hrvatskom jeziku.
|
520 |
3 |
|
|a Sažetak na engleskom: Content-based text classification is one of the basic tasks in the domain of text analysis. Popular methods involve mapping text documents to bags of words, represented by vectors. Although quite effective in practice, such methods fail to describe text documents on a conceptual level, which negatively impacts the quality of the implementing classifiers. Several approaches which bind ontological knowledge to text documents have been proposed recently. P. Wang. and C. Domeniconi describe one such approach which relies on Wikipedia to represent documents on a semantic level in their 2008 paper, denoting the resulting model with the term ,,semantic kernel''. Two support vector machine classifiers have been implemented as part of this thesis - one based on the traditional bag of words approach, the other being based on the semantic kernel. The performance of the models is then compared and evaluated by applying them on a collection of Croatian language documents.
|
653 |
|
1 |
|a jezgrena funkcija
|a klasifikacija teksta
|a stroj potpornih vektora
|a Wikipedija
|
653 |
|
1 |
|a kernel function
|a text classification
|a SVM
|a Wikipedia
|
700 |
1 |
|
|a Šnajder, Jan
|4 ths
|9 19016
|
942 |
|
|
|c Z
|2 udc
|
999 |
|
|
|c 45247
|d 45247
|