Pretraining Representations for Data-Efficient Reinforcement Learning

Abstract: Data efficiency is a key challenge for deep reinforcement learning. We address this problem by using unlabeled data to pretrain an encoder which is then finetuned on a small amount of task-specific data. To encourage learning representations which capture diverse aspects of the underlying MDP, we employ a combination of latent dynamics modelling and unsupervised goal-conditioned RL. When limited to 100k steps of interaction on Atari games (equivalent to two hours of human experience), our approach significantly surpasses prior work combining offline representation pretraining with task-specific finetuning, and compares favourably with other pretraining methods that require orders of magnitude more data. Our approach shows particular promise when combined with larger models as well as more diverse, task-aligned observational data -- approaching human-level performance and data-efficiency on Atari in our best setting.

06/12/2021

Łukasz Kaiser, Mohammad Babaeizadeh, Piotr Miłos and
Błażej Osiński, Roy H Campbell, Konrad Czechowski, Dumitru Erhan, Chelsea Finn, Piotr Kozakowski, Sergey Levine, Afroz Mohiuddin, Ryan Sepassi, George Tucker, Henryk Michalewski

Pretraining Representations for Data-Efficient Reinforcement Learning

Max Schwarzer, Nitarshan Rajkumar, Michael Noukhovitch, Ankesh Anand, Laurent Charlin, R Devon Hjelm, Philip Bachman, Aaron Courville

Comments

Similar Papers

Mastering Atari Games with Limited Data

Weirui Ye, Shaohuai Liu, Thanard Kurutach and Pieter Abbeel, Yang Gao

Keywords Abstract Paper

theory, reinforcement learning and planning

Model Based Reinforcement Learning for Atari

Łukasz Kaiser, Mohammad Babaeizadeh, Piotr Miłos and Błażej Osiński, Roy H Campbell, Konrad Czechowski, Dumitru Erhan, Chelsea Finn, Piotr Kozakowski, Sergey Levine, Afroz Mohiuddin, Ryan Sepassi, George Tucker, Henryk Michalewski

Keywords Abstract Paper

reinforcement learning, model based rl, video prediction model, atari

Generalizable Episodic Memory for Deep Reinforcement Learning

Hao Hu, Jianing Ye, Guangxiang Zhu and Zhizhou Ren, Chongjie Zhang

Keywords Abstract Paper

Mastering Atari with Discrete World Models

Danijar Hafner, Timothy Lillicrap, Mohammad Norouzi, Jimmy Ba

Keywords Abstract Paper

reinforcement learning, actor critic, model-based reinforcement learning, world models, Atari, planning

Non-Crossing Quantile Regression for Distributional Reinforcement Learning

Fan Zhou, Jianing Wang, Xingdong Feng

Keywords Abstract Paper

Return-Based Contrastive Representation Learning for Reinforcement Learning

Guoqing Liu, Chuheng Zhang, Li Zhao and Tao Qin, Jinhua Zhu, Li Jian, Nenghai Yu, Tie-Yan Liu

Keywords Abstract Paper

reinforcement learning, auxiliary task, contrastive learning, representation learning

Data-Efficient Reinforcement Learning with Self-Predictive Representations

Max Schwarzer, Ankesh Anand, Rishab Goel and R Devon Hjelm, Aaron Courville, Philip Bachman

Keywords Abstract Paper

Representation Learning, Self-Supervised Learning, Reinforcement Learning, Sample Efficiency

Fast Task Inference with Variational Intrinsic Successor Features

Steven Hansen, Will Dabney, Andre Barreto and David Warde-Farley, Tom Van de Wiele, Volodymyr Mnih

Keywords Abstract Paper

Reinforcement Learning, Variational Intrinsic Control, Successor Features

Width-based Lookaheads with Learnt Base Policies and Heuristics Over the Atari-2600 Benchmark

Stefan O'Toole, Nir Lipovetzky, Miquel Ramirez, Adrian Pearce

Keywords Abstract Paper

Behavior From the Void: Unsupervised Active Pre-Training

Hao Liu, Pieter Abbeel

Keywords Abstract Paper

Self-Paced Context Evaluation for Contextual Reinforcement Learning

Theresa Eimer, André Biedenkapp, Frank Hutter, Marius Lindauer

Keywords Abstract Paper

ConQUR: Mitigating Delusional Bias in Deep Q-Learning

DiJia Su, Jayden Ooi, Tyler Lu and Dale Schuurmans, Craig Boutilier

Keywords Abstract Paper

Safe Imitation Learning via Fast Bayesian Reward Inference from Preferences

Daniel Brown, Scott Niekum, Russell Coleman, Ravi Srinivasan

Keywords Abstract Paper

Munchausen Reinforcement Learning

Nino Vieillard, Olivier Pietquin, Matthieu Geist

Keywords Abstract Paper

Planning from Pixels in Atari with Learned Symbolic Representations

Andrea Dittadi, Frederik K. Drachmann, Thomas Bolander

Keywords Abstract Paper

Agent57: Outperforming the Atari Human Benchmark

Adrià Puigdomenech Badia, Bilal Piot, Steven Kapturowski and Pablo Sprechmann, Oleksandr Vitvitskyi, Zhaohan Guo, Charles Blundell

Keywords Abstract Paper

Online and Offline Reinforcement Learning by Planning with a Learned Model

Julian Schrittwieser, Thomas Hubert, Amol Mandhane and Mohammadamin Barekatain, Ioannis Antonoglou, David Silver

Keywords Abstract Paper

deep learning, reinforcement learning and planning

Accelerating Reinforcement Learning through GPU Atari Emulation

Steven Dalton, iuri frosio

Keywords Abstract Paper

Muesli: Combining Improvements in Policy Optimization

Matteo Hessel, Ivo Danihelka, Fabio Viola and Arthur Guez, Simon Schmitt, Laurent Sifre, Theo Weber, David Silver, Hado van Hasselt

Keywords Abstract Paper

Reinforcement Learning and Planning, Deep RL

On the Estimation Bias in Double Q-Learning

Zhizhou Ren, Guangxiang Zhu, Hao Hu and Beining Han, Jianglun Chen, Chongjie Zhang

Keywords Abstract Paper

Strategy and Benchmark for Converting Deep Q-Networks to Event-Driven Spiking Neural Networks

Weihao Tan, Devdhar Patel, Robert Kozma

Keywords Abstract Paper

Deep Reinforcement Learning at the Edge of the Statistical Precipice

Rishabh Agarwal, Max Schwarzer, Pablo Samuel Castro and Aaron Courville, Marc Bellemare

Keywords Abstract Paper

Accelerating SLIDE Deep Learning on Modern CPUs: Vectorization, Quantizations, Memory Optimizations, and More

Shabnam Daghaghi, Nicholas Meisburger, Mengnan Zhao, Anshumali Shrivastava

Weirui Ye, Shaohuai Liu, Thanard Kurutach and
Pieter Abbeel, Yang Gao

Keywords Paper

Łukasz Kaiser, Mohammad Babaeizadeh, Piotr Miłos and
Błażej Osiński, Roy H Campbell, Konrad Czechowski, Dumitru Erhan, Chelsea Finn, Piotr Kozakowski, Sergey Levine, Afroz Mohiuddin, Ryan Sepassi, George Tucker, Henryk Michalewski

Keywords Paper

Hao Hu, Jianing Ye, Guangxiang Zhu and
Zhizhou Ren, Chongjie Zhang

Keywords Paper

Keywords Paper

Keywords Paper

Guoqing Liu, Chuheng Zhang, Li Zhao and
Tao Qin, Jinhua Zhu, Li Jian, Nenghai Yu, Tie-Yan Liu

Keywords Paper

Max Schwarzer, Ankesh Anand, Rishab Goel and
R Devon Hjelm, Aaron Courville, Philip Bachman

Keywords Paper

Steven Hansen, Will Dabney, Andre Barreto and
David Warde-Farley, Tom Van de Wiele, Volodymyr Mnih

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

DiJia Su, Jayden Ooi, Tyler Lu and
Dale Schuurmans, Craig Boutilier

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Adrià Puigdomenech Badia, Bilal Piot, Steven Kapturowski and
Pablo Sprechmann, Oleksandr Vitvitskyi, Zhaohan Guo, Charles Blundell

Keywords Paper

Julian Schrittwieser, Thomas Hubert, Amol Mandhane and
Mohammadamin Barekatain, Ioannis Antonoglou, David Silver

Keywords Paper

Keywords Paper

Matteo Hessel, Ivo Danihelka, Fabio Viola and
Arthur Guez, Simon Schmitt, Laurent Sifre, Theo Weber, David Silver, Hado van Hasselt

Keywords Paper

Zhizhou Ren, Guangxiang Zhu, Hao Hu and
Beining Han, Jianglun Chen, Chongjie Zhang

Keywords Paper

Keywords Paper

Rishabh Agarwal, Max Schwarzer, Pablo Samuel Castro and
Aaron Courville, Marc Bellemare

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Suna (Sihang) Guo, Ruohan Zhang, Bo Liu and
Yifeng Zhu, Dana Ballard, Mary Hayhoe, Peter Stone

Keywords Paper

Keywords Paper

Keywords Paper

Guanhua Wang, Kehan Wang, Kenan Jiang and
XIANGJUN LI, Ion Stoica

Keywords Paper

Guanhua Wang, Kehan Wang, Kenan Jiang and
XIANGJUN LI, Ion Stoica

Keywords Paper

Yikai Zhou, Baosong Yang, Derek F. Wong and
Yu Wan, Lidia S. Chao

Keywords Paper

Keywords Paper

Peyman Bateni, Raghav Goyal, Vaden Masrani and
Frank Wood, Leonid Sigal

Keywords Paper

Samrath Sinha, Han Zhang, Anirudh Goyal and
Yoshua Bengio, Hugo Larochelle, Augustus Odena

Keywords Paper

Keywords Paper

John Bronskill, Daniela Massiceti, Massimiliano Patacchiola and
Katja Hofmann, Sebastian Nowozin, Richard Turner

Keywords Paper