|
|
|
|
LEADER |
02256na a2200229 4500 |
003 |
HR-ZaFER |
008 |
160221s2019 ci ||||| m||| 00| 0 hr d |
035 |
|
|
|a (HR-ZaFER)ferid6761
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Marić, Domagoj
|9 40607
|
245 |
1 |
0 |
|a Automatsko sustavno pretraživanje web prostora korištenjem Pythona :
|b diplomski rad /
|c Domagoj Marić ; [mentor Miljenko Mikuc].
|
246 |
1 |
|
|a Crawling and Scraping using Python
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b D. Marić,
|c 2019.
|
300 |
|
|
|a 51 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b diplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Obradba informacija, šifra smjera: 51, datum predaje: 2019-06-28, datum završetka: 2019-07-09
|
520 |
3 |
|
|a Sažetak na hrvatskom: Ovaj diplomski rad bavi se temom automatiziranog pretraživanja web prostora i ekstrakcije korisniku korisnog sadržaja iz web stranica. Obrađene su temeljne prakse, potrebna predznanja i demonstrirani napredniji Python alati za izradu programskih rješenja koja ispunjavaju ovu funkcionalnost. Opisane su prednosti i nedostatci svakog obrađenog alata te su dva najprikladnija alata iskorištena za izradu programskog rješenja za jednostavno i sveobuhvatno pretraživanje web stranica registriranih na www.hr, "početnoj stranici Hrvatske".
|
520 |
3 |
|
|a Sažetak na engleskom: The main subject of this thesis is the automated web browsing and data extraction from the retrieved web sites. These goals are realized by using web crawling and web scraping tools, respectively. In the thesis, I mentioned the main practices of web crawling and web scraping, the basic knowledge prerequisites to start, and demonstrated the four most popular web scraping tools in Python. Considering the main advantages and disadvantages of the tools, I picked two for my main application - a web crawling/scraping application for simple and comprehensive browsing of the web site catalogue on www.hr, the "Croatian Homepage".
|
653 |
|
1 |
|a automatsko pretraživanje weba
|a crawling
|a scraping
|a beautifulsoup
|a lxml
|a scrapy
|a selenium
|
653 |
|
1 |
|a automated browsing
|a crawling
|a scraping
|a beautifulsoup
|a lxml
|a scrapy
|a selenium
|
700 |
1 |
|
|a Mikuc, Miljenko
|4 ths
|9 9211
|
942 |
|
|
|c Y
|
999 |
|
|
|c 51321
|d 51321
|