Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju

Job, Josip; Jović, Franjo; Livada, Časlav

Tehnički vjesnik, Vol. 19 No. 3, 2012.

Izvorni znanstveni članak

Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju

Josip Job ; Faculty of Electrical Engineering, J. J. Strossmayer University of Osijek, Cara Hadrijana bb, 31000 Osijek, Croatia
Franjo Jović ; Faculty of Electrical Engineering, J. J. Strossmayer University of Osijek, Cara Hadrijana bb, 31000 Osijek, Croatia
Časlav Livada ; Faculty of Electrical Engineering, J. J. Strossmayer University of Osijek, Cara Hadrijana bb, 31000 Osijek, Croatia

Puni tekst: hrvatski pdf 608 Kb

str. 529-534

preuzimanja: 859

citiraj

APA 6th Edition

Job, J., Jović, F. i Livada, Č. (2012). Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju. Tehnički vjesnik, 19 (3), 529-534. Preuzeto s https://hrcak.srce.hr/86725

MLA 8th Edition

Job, Josip, et al. "Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju." Tehnički vjesnik, vol. 19, br. 3, 2012, str. 529-534. https://hrcak.srce.hr/86725. Citirano 25.04.2024.

Chicago 17th Edition

Job, Josip, Franjo Jović i Časlav Livada. "Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju." Tehnički vjesnik 19, br. 3 (2012): 529-534. https://hrcak.srce.hr/86725

Harvard

Job, J., Jović, F., i Livada, Č. (2012). 'Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju', Tehnički vjesnik, 19(3), str. 529-534. Preuzeto s: https://hrcak.srce.hr/86725 (Datum pristupa: 25.04.2024.)

Vancouver

Job J, Jović F, Livada Č. Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju. Tehnički vjesnik [Internet]. 2012 [pristupljeno 25.04.2024.];19(3):529-534. Dostupno na: https://hrcak.srce.hr/86725

IEEE

J. Job, F. Jović i Č. Livada, "Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata u nepoznatom okruženju", Tehnički vjesnik, vol.19, br. 3, str. 529-534, 2012. [Online]. Dostupno na: https://hrcak.srce.hr/86725. [Citirano: 25.04.2024.]

Puni tekst: engleski pdf 608 Kb

str. 529-534

preuzimanja: 327

citiraj

APA 6th Edition

MLA 8th Edition

Chicago 17th Edition

Harvard

Vancouver

IEEE

Sažetak

U ovom radu je predstavljen novi postupak Q-učenja kod kojega agent odluku o sljedećoj akciji donosi na osnovu korisnosti nekog budućeg stanja, a ne na osnovu trenutno optimalne akcije. Implementirana je komunikacija agenata u okolini koji si međusobno javljaju svoje buduće akcije što doprinosi kvalitetnijem odabiru akcija pojedinog agenta. Nova metoda nazvana je Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata. Uspoređeni su rezultati testiranja ovdje predstavljenog algoritma s osnovnim QL algoritmom što je i grafički prikazano te su navedene prednosti novog algoritma. Postignuto je prosječno smanjenje od 40 % sudara tijekom postupka učenja.

Ključne riječi

agent; pojačano učenje; q-učenje; učenje iz nagrade i kazne

Hrčak ID:

86725

URI

https://hrcak.srce.hr/86725

Datum izdavanja:

19.9.2012.

Podaci na drugim jezicima: engleski

Posjeta: 2.240 *

Prijava i registracija

Tehnički vjesnik, Vol. 19 No. 3, 2012.

Sažetak

Ključne riječi

Hrčak ID:

URI

Datum izdavanja: