Współczesnym przykładem zastosowania uczenia przez wzmacnianie jest systemy gier wideo, które wykorzystują uczenie przez wzmacnianie do uczenia się strategii gry i podejmowania decyzji w czasie rzeczywistym. Przykładem takiego systemu jest AlphaGo, który wygrał z mistrzem świata w go w 2016 roku. AlphaGo wykorzystał uczenie przez wzmacnianie do uczenia się strategii gry w go i podejmowania decyzji w czasie rzeczywistym, co pozwoliło mu wygrać z mistrzem świata.