AlphaZero: strojno učenje podrškom bez domenskog znanja

Bujanović, Zvonimir; Lončar, Jelena

Math.e, Vol. 39 No. 1, 2021.

Professional paper

AlphaZero: strojno učenje podrškom bez domenskog znanja

Zvonimir Bujanović ; University of Zagreb, Faculty of Science
Jelena Lončar ; University of Zagreb, Faculty of Science

Full text: croatian pdf 868 Kb

page 1-17

downloads: 213

cite

APA 6th Edition

Bujanović, Z. & Lončar, J. (2021). AlphaZero: strojno učenje podrškom bez domenskog znanja. Math.e, 39 (1), 1-17. Retrieved from https://hrcak.srce.hr/274355

MLA 8th Edition

Bujanović, Zvonimir and Jelena Lončar. "AlphaZero: strojno učenje podrškom bez domenskog znanja." Math.e, vol. 39, no. 1, 2021, pp. 1-17. https://hrcak.srce.hr/274355. Accessed 28 Dec. 2024.

Chicago 17th Edition

Bujanović, Zvonimir and Jelena Lončar. "AlphaZero: strojno učenje podrškom bez domenskog znanja." Math.e 39, no. 1 (2021): 1-17. https://hrcak.srce.hr/274355

Harvard

Bujanović, Z., and Lončar, J. (2021). 'AlphaZero: strojno učenje podrškom bez domenskog znanja', Math.e, 39(1), pp. 1-17. Available at: https://hrcak.srce.hr/274355 (Accessed 28 December 2024)

Vancouver

Bujanović Z, Lončar J. AlphaZero: strojno učenje podrškom bez domenskog znanja. Math.e [Internet]. 2021 [cited 2024 December 28];39(1). Available from: https://hrcak.srce.hr/274355

IEEE

Z. Bujanović and J. Lončar, "AlphaZero: strojno učenje podrškom bez domenskog znanja", Math.e, vol.39, no. 1, pp. 1-17, 2021. [Online]. Available: https://hrcak.srce.hr/274355. [Accessed: 28 December 2024]

Abstract

U ovom članku ćemo opisati AlphaZero, algoritam tvrtke DeepMind koji tabula rasa (to jest, bez unaprijed implementirane ikakve strategije igranja osim samih pravila) može postići nadljudski učinak u raznovrsnim izazovnim domenama, poput šaha, shogija (japanskog šaha) i igre Go. Predstavljen u [14], ovaj algoritam je uvjerljivo pobijedio ponajbolje svjetske igrače u navedenim trima igrama, a njegovu su izuzetnost šahovski velemajstori usporedili s igrom kakvu bi prezentirala superiorna vanzemaljska vrsta. Stvaranje algoritma koji tabula rasa stječe nadljudsku vještinu u zahtjevnim domenama bio je dugogodišnji cilj umjetne inteligencije te upravo AlphaZero, svojom sposobnošću prilagođavanja raznolikim pravilima igre, predstavlja njegovo ispunjenje i značajan korak naprijed prema ostvarenju općeg sustava za igranje igara. U članku ćemo izložiti osnovne koncepte algoritma AlphaZero, te demonstrirati rezultate dobivene njegovom implementacijom za igru Connect Four (Četiri u nizu) pomoću programskog jezika Python i njegovih dodatnih biblioteka. Za dodatne pojedinosti čitatelja upućujemo na diplomski rad [10].

Keywords

alpha zero; strojno učenje; učenje s podrškom

Hrčak ID:

274355

URI

https://hrcak.srce.hr/274355

Publication date:

1.9.2021.

Visits: 719 *

Login and registration

Math.e, Vol. 39 No. 1, 2021.

Abstract

Keywords

Hrčak ID:

URI

Publication date: