Skoči na glavni sadržaj

Stručni rad

AlphaZero: strojno učenje podrškom bez domenskog znanja

Zvonimir Bujanović ; PMF-Matematički odsjek, Sveučilište u Zagrebu
Jelena Lončar ; PMF-Matematički odsjek, Sveučilište u Zagrebu


Puni tekst: hrvatski pdf 868 Kb

str. 1-17

preuzimanja: 213

citiraj


Sažetak

U ovom članku ćemo opisati AlphaZero, algoritam tvrtke DeepMind koji tabula rasa (to jest, bez unaprijed implementirane ikakve strategije igranja osim samih pravila) može postići nadljudski učinak u raznovrsnim izazovnim domenama, poput šaha, shogija (japanskog šaha) i igre Go. Predstavljen u [14], ovaj algoritam je uvjerljivo pobijedio ponajbolje svjetske igrače u navedenim trima igrama, a njegovu su izuzetnost šahovski velemajstori usporedili s igrom kakvu bi prezentirala superiorna vanzemaljska vrsta. Stvaranje algoritma koji tabula rasa stječe nadljudsku vještinu u zahtjevnim domenama bio je dugogodišnji cilj umjetne inteligencije te upravo AlphaZero, svojom sposobnošću prilagođavanja raznolikim pravilima igre, predstavlja njegovo ispunjenje i značajan korak naprijed prema ostvarenju općeg sustava za igranje igara. U članku ćemo izložiti osnovne koncepte algoritma AlphaZero, te demonstrirati rezultate dobivene njegovom implementacijom za igru Connect Four (Četiri u nizu) pomoću programskog jezika Python i njegovih dodatnih biblioteka. Za dodatne pojedinosti čitatelja upućujemo na diplomski rad [10].

Ključne riječi

alpha zero; strojno učenje; učenje s podrškom

Hrčak ID:

274355

URI

https://hrcak.srce.hr/274355

Datum izdavanja:

1.9.2021.

Posjeta: 719 *