Q-learning

Q-learning je algoritmus posilovaného učení, který pomáhá agentovi najít optimální strategii jednání v daném prostředí. Pracuje s tzv. Q-hodnotami, které reprezentují očekávanou odměnu za provedení určité akce ve specifickém stavu. Q-learning je bezmodelový (model-free), což znamená, že nevyžaduje znalost pravidel prostředí – učí se čistě ze zkušeností. Používá se v robotice, hrách i optimalizaci procesů.

Q-learning

Posilované učení (Reinforcement Learning)

Random forest (Náhodný les)

Q-learning

Posilované učení (Reinforcement Learning)

Random forest (Náhodný les)

Přihlásit

Registrovat

Obnova hesla