Internetski portal za prikaz zajedničkih aktualnih tema s različitih internetskih portala

Sažetak na hrvatskom: Internetski prostor nudi velik broj internetskih portala koji objavljuju aktualne 'vruće' vijesti. Ljudima je lako prepoznati vijesti koje se bave istom tematikom, no uspoređivanje i grupiranje tekstualnih dokumenata računalom traži veliko teorijsko znanje obrade prir...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:46177/Details
Glavni autor: Vukšić, Antonija (-)
Ostali autori: Mekterović, Igor (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, A. Vukšić, 2015.
Predmet:
LEADER 02808na a2200241 4500
003 HR-ZaFER
005 20160715153056.0
008 160221s2015 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid2682 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Vukšić, Antonija  |9 37612 
245 1 0 |a Internetski portal za prikaz zajedničkih aktualnih tema s različitih internetskih portala :  |b diplomski rad /  |c Antonija Vukšić ; [mentor Igor Mekterović]. 
246 1 |a Internet portal showing common current news from different portals  |i Naslov na engleskom:  
260 |a Zagreb,  |b A. Vukšić,  |c 2015. 
300 |a 41 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 54, datum predaje: 2015-06-30, datum završetka: 2015-07-10 
520 3 |a Sažetak na hrvatskom: Internetski prostor nudi velik broj internetskih portala koji objavljuju aktualne 'vruće' vijesti. Ljudima je lako prepoznati vijesti koje se bave istom tematikom, no uspoređivanje i grupiranje tekstualnih dokumenata računalom traži veliko teorijsko znanje obrade prirodnog jezika i pretraživanja informacija. Ovim radom se nudi rješenje za izračun i prikaz zajedničkih vrućih vijesti. Za dohvat članaka korišten je Crawler4j, premda je za kategorizaciju članaka pri dohvatu korišten JSoup. Izračun sličnosti pojednostavljen je korištenjem Lucene knjižnice, a za grupiranje dokumenata korišten je Single linkeage hijerarhijski algoritam. U konačnici, za prikaz grupa vijesti korišten je Spring framework i za lijep izgled stranice korištene su tehnologije CSS i HTML5.  
520 3 |a Sažetak na engleskom: Internet space offers a large number of web sites that publish current ' hot ' news. For people it is easy to recognize news dealing with the same topic, but comparing and grouping text documents with computer requires extensive theoretical knowledge of natural language processing and information retrieval. This paper provides a solution for calculation and display of common hot news. To retrieve articles Crawler4j is used, although the categorization of articles while downloading is made by using JSoup. The calculation of similarity is simplified by using the Lucene library, and for grouping documents Single Linkeage hierarchical algorithm is used. Finally, for displaying the grouped news Spring framework is used and a nice layout is made by using the technologies CSS and HTML5.  
653 1 |a sličnost dokumenata  |a skidanje sadržaja  |a spring  |a zajedničke vijesti  |a portal  |a crawler  |a jsoup 
653 1 |a document similarity  |a content retrieval  |a spring  |a common news  |a portal  |a crawler  |a jsoup 
700 1 |a Mekterović, Igor  |4 ths  |9 30726 
942 |c Y  |2 udc 
999 |c 46177  |d 46177