Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

Titel in Übersetzung: Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

Ronald Ortner, Daniil Ryabko

Publikation: KonferenzbeitragPosterForschungBegutachtung

28 Zitate (Scopus)
Titel in ÜbersetzungOnline Regret Bounds for Undiscounted Continuous Reinforcement Learning
OriginalspracheEnglisch
PublikationsstatusVeröffentlicht - 2012
Veranstaltung26th Annual Conference on Neural Information Processing Systems - Lake Tahoe, USA / Vereinigte Staaten
Dauer: 6 Dez. 20126 Dez. 2012

Konferenz

Konferenz26th Annual Conference on Neural Information Processing Systems
KurztitelNIPS 2012
Land/GebietUSA / Vereinigte Staaten
OrtLake Tahoe
Zeitraum6/12/126/12/12

Dieses zitieren