Skip to the main content

Original scientific paper

Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju

Josip Job ; Faculty of Electrical Engineering, J. J. Strossmayer University of Osijek, Cara Hadrijana bb, 31000 Osijek, Croatia
Franjo Jović ; Faculty of Electrical Engineering, J. J. Strossmayer University of Osijek, Cara Hadrijana bb, 31000 Osijek, Croatia
Časlav Livada ; Faculty of Electrical Engineering, J. J. Strossmayer University of Osijek, Cara Hadrijana bb, 31000 Osijek, Croatia


Full text: croatian pdf 608 Kb

page 529-534

downloads: 868

cite

Full text: english pdf 608 Kb

page 529-534

downloads: 331

cite


Abstract

U ovom radu je predstavljen novi postupak Q-učenja kod kojega agent odluku o sljedećoj akciji donosi na osnovu korisnosti nekog budućeg stanja, a ne na osnovu trenutno optimalne akcije. Implementirana je komunikacija agenata u okolini koji si međusobno javljaju svoje buduće akcije što doprinosi kvalitetnijem odabiru akcija pojedinog agenta. Nova metoda nazvana je Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata. Uspoređeni su rezultati testiranja ovdje predstavljenog algoritma s osnovnim QL algoritmom što je i grafički prikazano te su navedene prednosti novog algoritma. Postignuto je prosječno smanjenje od 40 % sudara tijekom postupka učenja.

Keywords

agent; pojačano učenje; q-učenje; učenje iz nagrade i kazne

Hrčak ID:

86725

URI

https://hrcak.srce.hr/86725

Publication date:

19.9.2012.

Article data in other languages: english

Visits: 2.270 *