Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju

Job, Josip; Jović, Franjo; Livada, Časlav

Technical gazette, Vol. 19 No. 3, 2012.

Original scientific paper

Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju

Josip Job ; Faculty of Electrical Engineering, J. J. Strossmayer University of Osijek, Cara Hadrijana bb, 31000 Osijek, Croatia
Franjo Jović ; Faculty of Electrical Engineering, J. J. Strossmayer University of Osijek, Cara Hadrijana bb, 31000 Osijek, Croatia
Časlav Livada ; Faculty of Electrical Engineering, J. J. Strossmayer University of Osijek, Cara Hadrijana bb, 31000 Osijek, Croatia

Full text: croatian pdf 608 Kb

page 529-534

downloads: 1.042

cite

APA 6th Edition

Job, J., Jović, F. & Livada, Č. (2012). Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju. Tehnički vjesnik, 19 (3), 529-534. Retrieved from https://hrcak.srce.hr/86725

MLA 8th Edition

Job, Josip, et al. "Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju." Tehnički vjesnik, vol. 19, no. 3, 2012, pp. 529-534. https://hrcak.srce.hr/86725. Accessed 8 Jun. 2026.

Chicago 17th Edition

Job, Josip, Franjo Jović and Časlav Livada. "Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju." Tehnički vjesnik 19, no. 3 (2012): 529-534. https://hrcak.srce.hr/86725

Harvard

Job, J., Jović, F., and Livada, Č. (2012). 'Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju', Tehnički vjesnik, 19(3), pp. 529-534. Available at: https://hrcak.srce.hr/86725 (Accessed 08 June 2026)

Vancouver

Job J, Jović F, Livada Č. Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju. Tehnički vjesnik [Internet]. 2012 [cited 2026 June 08];19(3):529-534. Available from: https://hrcak.srce.hr/86725

IEEE

J. Job, F. Jović and Č. Livada, "Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju", Tehnički vjesnik, vol.19, no. 3, pp. 529-534, 2012. [Online]. Available: https://hrcak.srce.hr/86725. [Accessed: 08 June 2026]

Full text: english pdf 608 Kb

page 529-534

downloads: 454

cite

APA 6th Edition

MLA 8th Edition

Chicago 17th Edition

Harvard

Vancouver

IEEE

Abstract

U ovom radu je predstavljen novi postupak Q-učenja kod kojega agent odluku o sljedećoj akciji donosi na osnovu korisnosti nekog budućeg stanja, a ne na osnovu trenutno optimalne akcije. Implementirana je komunikacija agenata u okolini koji si međusobno javljaju svoje buduće akcije što doprinosi kvalitetnijem odabiru akcija pojedinog agenta. Nova metoda nazvana je Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata. Uspoređeni su rezultati testiranja ovdje predstavljenog algoritma s osnovnim QL algoritmom što je i grafički prikazano te su navedene prednosti novog algoritma. Postignuto je prosječno smanjenje od 40 % sudara tijekom postupka učenja.

Keywords

agent; pojačano učenje; q-učenje; učenje iz nagrade i kazne

Hrčak ID:

86725

URI

https://hrcak.srce.hr/86725

Publication date:

19.9.2012.

Article data in other languages: english

Visits: 3.322 *

Login and registration

Technical gazette, Vol. 19 No. 3, 2012.

Abstract

Keywords

Hrčak ID:

URI

Publication date: