Primjena podržanog učenja u simuliranim sustavima

Sažetak na hrvatskom: U ovome radu smo se fokusirali na implementaciji podržanoga agenta koji je bio sposoban se adaptirati u razne simulirane sustave i tim putem predstavili kapacitet i moć podržanog učenja. Osnove dubokog učenja su objašnjene u ovome radu. Koristeći se tensorflow-om smo implementi...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:49255/Details
Glavni autor: Livaja, Vladimir Dragutin (-)
Ostali autori: Pripužić, Krešimir (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, V. Livaja, 2018.
Predmet:
LEADER 02156na a2200229 4500
003 HR-ZaFER
008 160221s2018 ci ||||| m||| 00| 0 en d
035 |a (HR-ZaFER)ferid5173 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Livaja, Vladimir Dragutin 
245 1 0 |a Primjena podržanog učenja u simuliranim sustavima :  |b diplomski rad /  |c Vladimir Dragutin Livaja ; [mentor Krešimir Pripužić]. 
246 1 |a Reinforcement learning in simulated systems  |i Naslov na engleskom:  
260 |a Zagreb,  |b V. Livaja,  |c 2018. 
300 |a 50 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2018-06-29, datum završetka: 2018-07-09 
520 3 |a Sažetak na hrvatskom: U ovome radu smo se fokusirali na implementaciji podržanoga agenta koji je bio sposoban se adaptirati u razne simulirane sustave i tim putem predstavili kapacitet i moć podržanog učenja. Osnove dubokog učenja su objašnjene u ovome radu. Koristeći se tensorflow-om smo implementirali podržanoga agenta. Agent je evaluiran kroz tri različita simulirana scenarija. Pacman iz Atari 2600 i dva scenarija iz igrice zvane "Doom". Sve evaluacije su grafički prikazane. 
520 3 |a Sažetak na engleskom: In this thesis we focused on implementing a reinforcement agent that was able to generalize to various simulated systems and in doing so; showed the ability of the reinforcement learning algorithm to adapt. Fundamentals of deep learning were also described. Using Tensorflow, a reinforcement learning agent was implemented. The agent was evaluated on three different scenarios: Pacman from the Atari 2600 games and two different scenarios of the game Doom. The evaluation results were shown via graphs. 
653 1 |a podržano učenje, neuronske mreže  |a agent  |a okruženje  |a Q vrijednosti  |a vrijednost stanja  |a povratne mreže  |a iskusno ponavljanje 
653 1 |a Reinforcement learning  |a agent  |a environment  |a deep neural networks  |a Q values  |a state values  |a experience replay  |a recurrent networks. 
700 1 |a Pripužić, Krešimir  |4 ths 
942 |c Y 
999 |c 49255  |d 49255