Posilované učení (Reinforcement Learning)

Posilované učení je typ strojového učení, kde se agent učí rozhodovat na základě odměn a trestů v prostředí. Cílem je maximalizovat zisk v dlouhodobém horizontu. Používá se např. v robotice, hrách (např. AlphaGo), autonomních systémech nebo optimalizaci procesů. Agent se učí zkušeností podobně jako člověk – metodou pokus–omyl.

Přihlásit

Registrovat

Obnova hesla

Zadejte uživatelské jméno nebo e-mailovou adresu, e-mailem obdržíte odkaz pro vytvoření nového hesla.