Potporno učenje za robotske manipulatore

Sažetak na hrvatskom: Set alata za potporno učenje spojen je sa simulatorom fizike kako bi dao cjelovit sustav za simuliranje agenata koji kontroliraju robotičke manipulatore. Vodi se rasprava o teoretskim implikacijama te opisom zadane konstrukcije. Rezultati dokazaju funkcionalnost zamišljenog kon...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:50807/Details
Glavni autor: Baković, Luka (-)
Ostali autori: Petrović, Ivan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, L. Baković, 2019.
Predmet:
LEADER 02088na a2200229 4500
003 HR-ZaFER
008 160221s2019 ci ||||| m||| 00| 0 en d
035 |a (HR-ZaFER)ferid7231 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Baković, Luka  |9 40076 
245 1 0 |a Potporno učenje za robotske manipulatore :  |b završni rad /  |c Luka Baković ; [mentor Ivan Petrović]. 
246 1 |a Reinforcement learning for robotic manipulators  |i Naslov na engleskom:  
260 |a Zagreb,  |b L. Baković,  |c 2019. 
300 |a 21 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Automatika, šifra smjera: 33, datum predaje: 2019-06-14, datum završetka: 2019-07-12 
520 3 |a Sažetak na hrvatskom: Set alata za potporno učenje spojen je sa simulatorom fizike kako bi dao cjelovit sustav za simuliranje agenata koji kontroliraju robotičke manipulatore. Vodi se rasprava o teoretskim implikacijama te opisom zadane konstrukcije. Rezultati dokazaju funkcionalnost zamišljenog koncepta, dva različita algoritma daju konvergentne politike odlučivanja za robota sa zadaćom dolaska na traženo mjesto u prostoru. Daljnja istraživanja su moguća u smjeru uređivanja okoline za potporno učenje i isprobavanje različitih algoritama 
520 3 |a Sažetak na engleskom: A reinforcement learning API is combined with a physics simulator to make a pipeline for simulating agents controlling robotic manipulators. Theoretical implications are discussed, followed by the description of such a construction. Results serve as a proof of concepts, with two different algorithms providing convergent policies for a robot tasked with reaching a target point. Further research is discussed, mostly aimed at further customising the environment and trying out different algorithms. 
653 1 |a umjetna inteligencija  |a robotika  |a manipulatori  |a potporno učenje  |a kinematika 
653 1 |a artificial intelligence  |a robotics manipulators  |a reinforcement learning  |a kinematics 
700 1 |a Petrović, Ivan  |4 ths  |9 5634 
942 |c Z 
999 |c 50807  |d 50807