Reinforcement Learning in Games

adavidoaiei · aprilie 3, 2020, 8:49am

Am incercat sa scriu un articol pe blog despre Reinforcement Learning in 2019 si l-am actualizat cu putina istorie recenta de realizari in acest domeniu:

https://software-engineer-adavidoaiei.blogspot.com/2019/07/reinforcement-learning-in-games.html

Deepmind este o companie marca Google care a folosit Reinforcement Learning in sistemul AlphaGo care l-a invins pe campionul mondial la Go in 2016, Go este un joc de strategie japonez, aceasta poate fi considerata una dintre cele mai mari realizari in inteligenta artificiala diferita de sistemul de la IBM care folosea arbori de decizie ca sa il invinga pe campionul mondial la sah. Strategia de la sah neputand fi aplicata in cazul jocului Go fiind mult mai complex si presupunand foarte multe cacule. Open AI este o companie fondata de Elon Musk care printre rezultate a fost participarea la un campionat de Dota in 2017 si invingerea unui campion, Dota fiind un joc de strategie complex pe calculator, o alta realizare in inteligenta artificiala de data asta de catre Facebook in 2019 este participarea la un turneu de poker si castigarea acestuia. Open AI pune la indemana oricui medii pentru experimentarea algoritmilor de Reinforcement Learning https://gym.openai.com/envs/#classic_control. Un exemplu de mediu este un joc ATARI :

O clasificare AI ar fi:

Artificial General Intelligence (AGI, companii ca si DeepMind, OpenAI fac Research & Development), unde AI ar trebui sa fie capabil de mai multe sarcini, Reinforcement Learning combinat cu Deep Learning pare sa se incadreze la General Artificial Intelligence.

Artificial Narrow Intelligence (ANI), AI care sunt capabile de un singur task, exemplu: computer vision, speech recognition, etc, machine learning este inclus in AI, AI reprezentand o clasa mai mare.

Reinforcement Learning este o ramura in machine learning care se ocupa cu agenti care iau decizi, actiuni intr-un mediu ca sa isi maximizeze recompensa cumulata.

Reinforcement Learning poate fi combinat cu Deep Learning si se obtine Deep Reinforcement Learning , un exemplu este DQN(Deep Q Network) obtinut prin combinarea unui algoritm de Reinforcement Learning (Q Learning) cu Deep Learning (Convolutional Neural Nets) , acest algoritm poate fi aplicat unui joc de exemplu, invata din input-uri care sunt capturi de ecran din joc care sunt procesate cu Deep Learning (Convolutional Neural Nets) . Deep Mind folosind aceasta tehnica, DQN (Deep Q Network) a reusit sa proiecteze un AI care sa invete sa joace toate 57 de jocuri din colectia ATARI , DeepMind’s AI can now play all 57 Atari games—but it’s still not versatile enough.