Automatsko sustavno pretraživanje web prostora korištenjem Pythona

Sažetak na hrvatskom: Ovaj diplomski rad bavi se temom automatiziranog pretraživanja web prostora i ekstrakcije korisniku korisnog sadržaja iz web stranica. Obrađene su temeljne prakse, potrebna predznanja i demonstrirani napredniji Python alati za izradu programskih rješenja koja ispunjavaju ovu fu...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:51321/Details
Glavni autor: Marić, Domagoj (-)
Ostali autori: Mikuc, Miljenko (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, D. Marić, 2019.
Predmet:
LEADER 02256na a2200229 4500
003 HR-ZaFER
008 160221s2019 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid6761 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Marić, Domagoj  |9 40607 
245 1 0 |a Automatsko sustavno pretraživanje web prostora korištenjem Pythona :  |b diplomski rad /  |c Domagoj Marić ; [mentor Miljenko Mikuc]. 
246 1 |a Crawling and Scraping using Python  |i Naslov na engleskom:  
260 |a Zagreb,  |b D. Marić,  |c 2019. 
300 |a 51 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Obradba informacija, šifra smjera: 51, datum predaje: 2019-06-28, datum završetka: 2019-07-09 
520 3 |a Sažetak na hrvatskom: Ovaj diplomski rad bavi se temom automatiziranog pretraživanja web prostora i ekstrakcije korisniku korisnog sadržaja iz web stranica. Obrađene su temeljne prakse, potrebna predznanja i demonstrirani napredniji Python alati za izradu programskih rješenja koja ispunjavaju ovu funkcionalnost. Opisane su prednosti i nedostatci svakog obrađenog alata te su dva najprikladnija alata iskorištena za izradu programskog rješenja za jednostavno i sveobuhvatno pretraživanje web stranica registriranih na www.hr, "početnoj stranici Hrvatske". 
520 3 |a Sažetak na engleskom: The main subject of this thesis is the automated web browsing and data extraction from the retrieved web sites. These goals are realized by using web crawling and web scraping tools, respectively. In the thesis, I mentioned the main practices of web crawling and web scraping, the basic knowledge prerequisites to start, and demonstrated the four most popular web scraping tools in Python. Considering the main advantages and disadvantages of the tools, I picked two for my main application - a web crawling/scraping application for simple and comprehensive browsing of the web site catalogue on www.hr, the "Croatian Homepage". 
653 1 |a automatsko pretraživanje weba  |a crawling  |a scraping  |a beautifulsoup  |a lxml  |a scrapy  |a selenium 
653 1 |a automated browsing  |a crawling  |a scraping  |a beautifulsoup  |a lxml  |a scrapy  |a selenium 
700 1 |a Mikuc, Miljenko  |4 ths  |9 9211 
942 |c Y 
999 |c 51321  |d 51321