Skip to the main content

Professional paper

AlphaZero: strojno učenje podrškom bez domenskog znanja

Zvonimir Bujanović ; University of Zagreb, Faculty of Science
Jelena Lončar ; University of Zagreb, Faculty of Science


Full text: croatian pdf 868 Kb

page 1-17

downloads: 213

cite


Abstract

U ovom članku ćemo opisati AlphaZero, algoritam tvrtke DeepMind koji tabula rasa (to jest, bez unaprijed implementirane ikakve strategije igranja osim samih pravila) može postići nadljudski učinak u raznovrsnim izazovnim domenama, poput šaha, shogija (japanskog šaha) i igre Go. Predstavljen u [14], ovaj algoritam je uvjerljivo pobijedio ponajbolje svjetske igrače u navedenim trima igrama, a njegovu su izuzetnost šahovski velemajstori usporedili s igrom kakvu bi prezentirala superiorna vanzemaljska vrsta. Stvaranje algoritma koji tabula rasa stječe nadljudsku vještinu u zahtjevnim domenama bio je dugogodišnji cilj umjetne inteligencije te upravo AlphaZero, svojom sposobnošću prilagođavanja raznolikim pravilima igre, predstavlja njegovo ispunjenje i značajan korak naprijed prema ostvarenju općeg sustava za igranje igara. U članku ćemo izložiti osnovne koncepte algoritma AlphaZero, te demonstrirati rezultate dobivene njegovom implementacijom za igru Connect Four (Četiri u nizu) pomoću programskog jezika Python i njegovih dodatnih biblioteka. Za dodatne pojedinosti čitatelja upućujemo na diplomski rad [10].

Keywords

alpha zero; strojno učenje; učenje s podrškom

Hrčak ID:

274355

URI

https://hrcak.srce.hr/274355

Publication date:

1.9.2021.

Visits: 719 *