Primjena semantičkih jezgrenih funkcija u klasifikaciji teksta

Sažetak na hrvatskom: Klasifikacija teksta temeljem sadržaja jedan je od osnovnih zadataka koji se javljaju u domeni dubinske analize teksta. Često korišteni postupci uključuju predstavljanje dokumenata u vektorskom obliku, korištenjem vreća riječi. Iako su takve metode jednostavne i učinkovite, nji...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:45247/Details
Glavni autor: Radaković, Dino (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, D. Radaković, 2014.
Predmet:
LEADER 03161na a2200241 4500
003 HR-ZaFER
005 20160516012013.0
008 160221s2014 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid1196 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Radaković, Dino  |9 35712 
245 |a Primjena semantičkih jezgrenih funkcija u klasifikaciji teksta :  |b završni rad /  |c Dino Radaković ; [mentor Jan Šnajder]. 
246 1 |a Applying Semantic Kernel Functions in Text Classification  |i Naslov na engleskom:  
260 |a Zagreb,  |b D. Radaković,  |c 2014. 
300 |a 37 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2014-06-13, datum završetka: 2014-07-14 
520 3 |a Sažetak na hrvatskom: Klasifikacija teksta temeljem sadržaja jedan je od osnovnih zadataka koji se javljaju u domeni dubinske analize teksta. Često korišteni postupci uključuju predstavljanje dokumenata u vektorskom obliku, korištenjem vreća riječi. Iako su takve metode jednostavne i učinkovite, njima nije moguće modelirati dokument na konceptualnoj razini, što negativno utječe na kvalitetu klasifikatora koji se temelje na istima. Stoga je nedavno predloženo nekoliko različitih pristupa koji se temelje na povezivanju ontološkog znanja s tekstom. P. Wang i C. Domeniconi u svom radu iz 2008. opisuju jedan takav pristup, koji se temelji na korištenju Wikipedije za modeliranje dokumenata na semantičkoj razini, nazivajući ga ,,semantičkom jezgrenom funkcijom''. U okviru ovog rada izvedena su dva klasifikatora temeljena na strojevima potpornih vektora - jedan koji koristi vreće riječi i drugi, koji se temelji na semantičkoj jezgrenoj funkciji. Točnosti klasifikacije oba modela uspoređene su temeljem iscrpnog vrednovanja provedenog na zbirci dokumenata na hrvatskom jeziku. 
520 3 |a Sažetak na engleskom: Content-based text classification is one of the basic tasks in the domain of text analysis. Popular methods involve mapping text documents to bags of words, represented by vectors. Although quite effective in practice, such methods fail to describe text documents on a conceptual level, which negatively impacts the quality of the implementing classifiers. Several approaches which bind ontological knowledge to text documents have been proposed recently. P. Wang. and C. Domeniconi describe one such approach which relies on Wikipedia to represent documents on a semantic level in their 2008 paper, denoting the resulting model with the term ,,semantic kernel''. Two support vector machine classifiers have been implemented as part of this thesis - one based on the traditional bag of words approach, the other being based on the semantic kernel. The performance of the models is then compared and evaluated by applying them on a collection of Croatian language documents. 
653 1 |a jezgrena funkcija  |a klasifikacija teksta  |a stroj potpornih vektora  |a Wikipedija 
653 1 |a kernel function  |a text classification  |a SVM  |a Wikipedia 
700 1 |a Šnajder, Jan  |4 ths  |9 19016 
942 |c Z  |2 udc 
999 |c 45247  |d 45247