|
|
|
|
LEADER |
02156na a2200229 4500 |
003 |
HR-ZaFER |
008 |
160221s2018 ci ||||| m||| 00| 0 en d |
035 |
|
|
|a (HR-ZaFER)ferid5173
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Livaja, Vladimir Dragutin
|
245 |
1 |
0 |
|a Primjena podržanog učenja u simuliranim sustavima :
|b diplomski rad /
|c Vladimir Dragutin Livaja ; [mentor Krešimir Pripužić].
|
246 |
1 |
|
|a Reinforcement learning in simulated systems
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b V. Livaja,
|c 2018.
|
300 |
|
|
|a 50 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b diplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2018-06-29, datum završetka: 2018-07-09
|
520 |
3 |
|
|a Sažetak na hrvatskom: U ovome radu smo se fokusirali na implementaciji podržanoga agenta koji je bio sposoban se adaptirati u razne simulirane sustave i tim putem predstavili kapacitet i moć podržanog učenja. Osnove dubokog učenja su objašnjene u ovome radu. Koristeći se tensorflow-om smo implementirali podržanoga agenta. Agent je evaluiran kroz tri različita simulirana scenarija. Pacman iz Atari 2600 i dva scenarija iz igrice zvane "Doom". Sve evaluacije su grafički prikazane.
|
520 |
3 |
|
|a Sažetak na engleskom: In this thesis we focused on implementing a reinforcement agent that was able to generalize to various simulated systems and in doing so; showed the ability of the reinforcement learning algorithm to adapt. Fundamentals of deep learning were also described. Using Tensorflow, a reinforcement learning agent was implemented. The agent was evaluated on three different scenarios: Pacman from the Atari 2600 games and two different scenarios of the game Doom. The evaluation results were shown via graphs.
|
653 |
|
1 |
|a podržano učenje, neuronske mreže
|a agent
|a okruženje
|a Q vrijednosti
|a vrijednost stanja
|a povratne mreže
|a iskusno ponavljanje
|
653 |
|
1 |
|a Reinforcement learning
|a agent
|a environment
|a deep neural networks
|a Q values
|a state values
|a experience replay
|a recurrent networks.
|
700 |
1 |
|
|a Pripužić, Krešimir
|4 ths
|
942 |
|
|
|c Y
|
999 |
|
|
|c 49255
|d 49255
|