Automatizirano prikupljanje skupa podataka za ispitivanje sustava preporučivanja knjiga

Sažetak na hrvatskom: Sustav za automatizirano prikupljanje podataka o knjigama sa web stranica. Za izgradnju sustava korišten je Python i njegove knjižnice specijalizirane za izvlačenje podataka. Korištene su knjižnice requests za inicijalni dohvat HTML-a, Selenium WebDriver za dinamičke elemente i...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:50223/Details
Glavni autor: Šimić, Ivica (-)
Ostali autori: Vladimir, Klemo (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, I. Šimić, 2018.
Predmet:
LEADER 01954na a2200229 4500
003 HR-ZaFER
008 160221s2018 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid6015 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Šimić, Ivica 
245 1 0 |a Automatizirano prikupljanje skupa podataka za ispitivanje sustava preporučivanja knjiga :  |b završni rad /  |c Ivica Šimić ; [mentor Klemo Vladimir]. 
246 1 |a Automated Retrieval of Book Recommendations Dataset  |i Naslov na engleskom:  
260 |a Zagreb,  |b I. Šimić,  |c 2018. 
300 |a 10 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2017-06-09, datum završetka: 2018-07-02 
520 3 |a Sažetak na hrvatskom: Sustav za automatizirano prikupljanje podataka o knjigama sa web stranica. Za izgradnju sustava korišten je Python i njegove knjižnice specijalizirane za izvlačenje podataka. Korištene su knjižnice requests za inicijalni dohvat HTML-a, Selenium WebDriver za dinamičke elemente i lxml za parsiranje htmla. Sustav je napravljen tako da se može što jednostavnije primjeniti na različite web stranice uz uvjet da je semantika podataka ista. Podaci su spremljeni u CSV (Excel) i JSON formatu. 
520 3 |a Sažetak na engleskom: Automated retrieval of book data and recommendations. Written in Python and its specialised libraries for web scraping. Used libraries are requests for initial retrieval of HTML, Selenium WebDriver for dynamic elements and lxml for HTML parsing. System is written so that it's easy to scrape different web sites if the semantics of the data are the same. Data is stored in CSV (Excel) and JSON format. 
653 1 |a Python  |a Izvlačenje podataka  |a Automatizirano  |a Web  |a HTML  |a Knjige 
653 1 |a Python  |a Web scraping  |a Automated  |a Web  |a HTML  |a Books 
700 1 |a Vladimir, Klemo  |4 ths 
942 |c Z 
999 |c 50223  |d 50223