Q-learning

Q-learning je algoritmus posilovaného učení, který pomáhá agentovi najít optimální strategii jednání v daném prostředí. Pracuje s tzv. Q-hodnotami, které reprezentují očekávanou odměnu za provedení určité akce ve specifickém stavu. Q-learning je bezmodelový (model-free), což znamená, že nevyžaduje znalost pravidel prostředí – učí se čistě ze zkušeností. Používá se v robotice, hrách i optimalizaci procesů.

Přihlásit

Registrovat

Obnova hesla

Zadejte uživatelské jméno nebo e-mailovou adresu, e-mailem obdržíte odkaz pro vytvoření nového hesla.