AlphaZero: strojno učenje podrškom bez domenskog znanja

Bujanović, Zvonimir; Lončar, Jelena

Hrvatski matematički elektronički časopis, Vol. 39 No. 1, 2021.

Stručni rad

AlphaZero: strojno učenje podrškom bez domenskog znanja

Zvonimir Bujanović ; PMF-Matematički odsjek, Sveučilište u Zagrebu
Jelena Lončar ; PMF-Matematički odsjek, Sveučilište u Zagrebu

Puni tekst: hrvatski pdf 868 Kb

str. 1-17

preuzimanja: 213

citiraj

APA 6th Edition

Bujanović, Z. i Lončar, J. (2021). AlphaZero: strojno učenje podrškom bez domenskog znanja. Math.e, 39 (1), 1-17. Preuzeto s https://hrcak.srce.hr/274355

MLA 8th Edition

Bujanović, Zvonimir i Jelena Lončar. "AlphaZero: strojno učenje podrškom bez domenskog znanja." Math.e, vol. 39, br. 1, 2021, str. 1-17. https://hrcak.srce.hr/274355. Citirano 27.12.2024.

Chicago 17th Edition

Bujanović, Zvonimir i Jelena Lončar. "AlphaZero: strojno učenje podrškom bez domenskog znanja." Math.e 39, br. 1 (2021): 1-17. https://hrcak.srce.hr/274355

Harvard

Bujanović, Z., i Lončar, J. (2021). 'AlphaZero: strojno učenje podrškom bez domenskog znanja', Math.e, 39(1), str. 1-17. Preuzeto s: https://hrcak.srce.hr/274355 (Datum pristupa: 27.12.2024.)

Vancouver

Bujanović Z, Lončar J. AlphaZero: strojno učenje podrškom bez domenskog znanja. Math.e [Internet]. 2021 [pristupljeno 27.12.2024.];39(1). Dostupno na: https://hrcak.srce.hr/274355

IEEE

Z. Bujanović i J. Lončar, "AlphaZero: strojno učenje podrškom bez domenskog znanja", Math.e, vol.39, br. 1, str. 1-17, 2021. [Online]. Dostupno na: https://hrcak.srce.hr/274355. [Citirano: 27.12.2024.]

Sažetak

U ovom članku ćemo opisati AlphaZero, algoritam tvrtke DeepMind koji tabula rasa (to jest, bez unaprijed implementirane ikakve strategije igranja osim samih pravila) može postići nadljudski učinak u raznovrsnim izazovnim domenama, poput šaha, shogija (japanskog šaha) i igre Go. Predstavljen u [14], ovaj algoritam je uvjerljivo pobijedio ponajbolje svjetske igrače u navedenim trima igrama, a njegovu su izuzetnost šahovski velemajstori usporedili s igrom kakvu bi prezentirala superiorna vanzemaljska vrsta. Stvaranje algoritma koji tabula rasa stječe nadljudsku vještinu u zahtjevnim domenama bio je dugogodišnji cilj umjetne inteligencije te upravo AlphaZero, svojom sposobnošću prilagođavanja raznolikim pravilima igre, predstavlja njegovo ispunjenje i značajan korak naprijed prema ostvarenju općeg sustava za igranje igara. U članku ćemo izložiti osnovne koncepte algoritma AlphaZero, te demonstrirati rezultate dobivene njegovom implementacijom za igru Connect Four (Četiri u nizu) pomoću programskog jezika Python i njegovih dodatnih biblioteka. Za dodatne pojedinosti čitatelja upućujemo na diplomski rad [10].

Ključne riječi

alpha zero; strojno učenje; učenje s podrškom

Hrčak ID:

274355

URI

https://hrcak.srce.hr/274355

Datum izdavanja:

1.9.2021.

Posjeta: 719 *

Prijava i registracija

Hrvatski matematički elektronički časopis, Vol. 39 No. 1, 2021.

Sažetak

Ključne riječi

Hrčak ID:

URI

Datum izdavanja: