Odalric-Ambrym Maillard

(Ehemalig)

Publikationen

  1. 2019
  2. Veröffentlicht

    Regret Bounds for Learning State Representations in Reinforcement Learning

    Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O-A., Dez 2019.

    Publikationen: KonferenzbeitragPosterForschung(peer-reviewed)

  3. Elektronische Veröffentlichung vor Drucklegung.

    Regret Bounds for Learning State Representations in Reinforcement Learning

    Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O-A., 2019, Advances in Neural Information Processing Systems. Band 32. S. 12717 12727 S.

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  4. 2014
  5. Veröffentlicht

    Selecting Near-Optimal Approximate State Representations in Reinforcement Learning

    Ortner, R., Maillard, O-A. & Ryabko, D., 2014, Algorithmic Learning Theory - 25th International Conference, ALT 2014, Bled, October 8-10, 2014. S. 140-154

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  6. 2013
  7. Veröffentlicht

    Competing with an Infinite Set of Models in Reinforcement Learning

    Nguyen, P., Maillard, O-A., Ryabko, D. & Ortner, R., 2013, JMLR Workshop and Conference Proceedings Volume 31 : Proceedings of the Sixteenth International Conference on Artificial Intelligence and Statistics. S. 463-471

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  8. Veröffentlicht

    Linear regression with random projections.

    Maillard, O-A., 2013, in : Journal of machine learning research (JMLR). 13, S. 1-1

    Publikationen: Beitrag in FachzeitschriftArtikelForschung(peer-reviewed)

  9. Veröffentlicht

    Optimal regret bounds for selecting the state representation in reinforcement learning.

    Maillard, O-A., Nguyen, P., Ortner, R. & Ryabko, D., 2013, JMLR Workshop and Conference Proceedings Volume 28 : Proceedings of The 30th International Conference on Machine Learning. S. 543-551

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  10. 2011
  11. Veröffentlicht

    Adaptive bandits: Towards the best history-dependent strategy

    Maillard, O-A., 2011, Proceedings of the Fourteenth International Conference on Artificial Intelligence and Statistics. S. 570-578

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  12. Veröffentlicht

    Finite-Time Analysis of Multi-armed Bandits Problems with Kullback-Leibler Divergences

    Maillard, O-A., 2011, Proceedings of the 24th Annual Conference on Learning Theory. S. 497-514

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  13. Veröffentlicht

    Selecting the State-Representation in Reinforcement Learning

    Maillard, O-A., 2011, Advances in Neural Information Processing Systems 24. S. 2627-2635

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  14. Veröffentlicht

    Sparse recovery with Brownian sensing

    Maillard, O-A., 2011, Advances in Neural Information Processing Systems 24. S. 1782-1790

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband