Diversity Actor-Critic: Sample-Aware Entropy Regularization for Sample-Efficient Exploration

Abstract: In this paper, sample-aware policy entropy regularization is proposed to enhance the conventional policy entropy regularization for better exploration. Exploiting the sample distribution obtainable from the replay buffer, the proposed sample-aware entropy regularization maximizes the entropy of the weighted sum of the policy action distribution and the sample action distribution from the replay buffer for sample-efficient exploration. A practical algorithm named diversity actor-critic (DAC) is developed by applying policy iteration to the objective function with the proposed sample-aware entropy regularization. Numerical results show that DAC significantly outperforms existing recent algorithms for reinforcement learning.

18/07/2021

Diversity Actor-Critic: Sample-Aware Entropy Regularization for Sample-Efficient Exploration

Seungyul Han, Youngchul Sung

Comments

Similar Papers

Offline Reinforcement Learning with Fisher Divergence Critic Regularization

Ilya Kostrikov, Rob Fergus, Jonathan Tompson, Ofir Nachum

Keywords Abstract Paper

Reinforcement Learning and Planning, Deep RL

Direct Policy Gradients: Direct Optimization of Policies in Discrete Action Spaces

Guy Lorberbom, Chris J. Maddison, Nicolas Heess and Tamir Hazan, Daniel Tarlow

Keywords Abstract Paper

Local policy search with Bayesian optimization

Sarah Müller, Alexander von Rohr, Sebastian Trimpe

Keywords Abstract Paper

theory, optimization, reinforcement learning and planning, active learning

Variational Model-based Policy Optimization

Yinlam Chow, Brandon Cui, Moonkyung Ryu, Mohammad Ghavamzadeh

Keywords Abstract Paper

Machine Learning, Reinforcement Learning

Logistic q-learning

Joan Bas-Serrano, Sebastian Curi, Andreas Krause, Gergely Neu

Keywords Abstract Paper

Risk-Aware Transfer in Reinforcement Learning using Successor Features

Michael Gimelfarb, Andre Barreto, Scott Sanner, Chi-Guhn Lee

Keywords Abstract Paper

reinforcement learning and planning, representation learning, transfer learning

A Max-Min Entropy Framework for Reinforcement Learning

Seungyul Han, Youngchul Sung

Keywords Abstract Paper

optimization, reinforcement learning and planning

Variance Reduction for Evolution Strategies via Structured Control Variates

Yunhao Tang, Krzysztof Choromanski, Alp Kucukelbir

Keywords Abstract Paper

Variance-Aware Off-Policy Evaluation with Linear Function Approximation

Yifei Min, Tianhao Wang, Dongruo Zhou, Quanquan Gu

Keywords Abstract Paper

theory, reinforcement learning and planning

Thompson Sampling via Local Uncertainty

Zhendong Wang, Mingyuan Zhou

Keywords Abstract Paper

Probabilistic Inference - Models and Probabilistic Programming

Sparse Feature Selection Makes Batch Reinforcement Learning More Sample Efficient

Botao Hao, Yaqi Duan, Tor Lattimore and Csaba Szepesvari, Mengdi Wang

Keywords Abstract Paper

Theory, Statistical Learning Theory

Robust Reinforcement Learning via Adversarial training with Langevin Dynamics

Parameswaran Kamalaruban, Yu-Ting Huang, Ya-Ping Hsieh and Paul Rolland, Cheng Shi, Volkan Cevher

Keywords Abstract Paper

Variational Policy Gradient Method for Reinforcement Learning with General Utilities

Junyu Zhang, Alec Koppel, Amrit Bedi and Csaba Szepesvari, Mengdi Wang

Keywords Abstract Paper

On-Policy Deep Reinforcement Learning for the Average-Reward Criterion

Yiming Zhang, Keith Ross

Keywords Abstract Paper

Reinforcement Learning and Planning

Selective Transfer With Reinforced Transfer Network for Partial Domain Adaptation

Zhihong Chen, Chao Chen, Zhaowei Cheng and Boyuan Jiang, Ke Fang, Xinyu Jin

Keywords Abstract Paper

partial domain adaptation, selective transfer, pixel-level information, reconstruct error, reinforcement learning

MLE-Guided Parameter Search for Task Loss Minimization in Neural Sequence Modeling

Sean Welleck, Kyunghyun Cho

Keywords Abstract Paper

Representation Matters: Offline Pretraining for Sequential Decision Making

Mengjiao Yang, Ofir Nachum

Keywords Abstract Paper

Reinforcement Learning and Planning

Phasic Policy Gradient

Karl Cobbe, Jacob Hilton, Oleg Klimov, John Schulman

Keywords Abstract Paper

Reinforcement Learning and Planning, Deep RL

State-Relabeling Adversarial Active Learning

Beichen Zhang, Liang Li, Shijie Yang and Shuhui Wang, Zheng-Jun Zha, Qingming Huang

Keywords Abstract Paper

active learning, adversarial learning, uncertainty, relabel

FIMAP: Feature Importance by Minimal Adversarial Perturbation

Matt Chapman-Rounds, Umang Bhatt, Erik Pazos and Marc-Andre Schulz, Konstantinos Georgatzis

Keywords Abstract Paper

GMAC: A Distributional Perspective on Actor-Critic Framework

Daniel Nam, Younghoon Kim, Chan Park

Keywords Abstract Paper

Keywords Paper

Guy Lorberbom, Chris J. Maddison, Nicolas Heess and
Tamir Hazan, Daniel Tarlow

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Botao Hao, Yaqi Duan, Tor Lattimore and
Csaba Szepesvari, Mengdi Wang

Keywords Paper

Parameswaran Kamalaruban, Yu-Ting Huang, Ya-Ping Hsieh and
Paul Rolland, Cheng Shi, Volkan Cevher

Keywords Paper

Junyu Zhang, Alec Koppel, Amrit Bedi and
Csaba Szepesvari, Mengdi Wang

Keywords Paper

Keywords Paper

Zhihong Chen, Chao Chen, Zhaowei Cheng and
Boyuan Jiang, Ke Fang, Xinyu Jin

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Beichen Zhang, Liang Li, Shijie Yang and
Shuhui Wang, Zheng-Jun Zha, Qingming Huang

Keywords Paper

Matt Chapman-Rounds, Umang Bhatt, Erik Pazos and
Marc-Andre Schulz, Konstantinos Georgatzis

Keywords Paper

Keywords Paper

Shell Xu Hu, Pablo Moreno, Yang Xiao and
Xi Shen, Guillaume Obozinski, Neil Lawrence, Andreas Damianou

Keywords Paper

Aldo Pacchiano, Jack Parker-Holder, Yunhao Tang and
Krzysztof Choromanski, Anna Choromanska, Michael Jordan

Keywords Paper

Nhan Pham, Lam Nguyen, Dzung Phan and
PHUONG HA NGUYEN, Marten van Dijk, Quoc Tran-Dinh

Keywords Paper

Xu-Hui Liu, Zhenghai Xue, Jingcheng Pang and
Shengyi Jiang, Feng Xu, Yang Yu

Keywords Paper

Youngsuk Park, Ryan Rossi, Zheng Wen and
Gang Wu, Handong Zhao

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Futoshi Futami, Tomoharu Iwata, naonori ueda and
Issei Sato, Masashi Sugiyama

Keywords Paper

Mengxue Li, Yi-Ming Zhai, You-Wei Luo and
Peng-Fei Ge, Chuan-Xian Ren

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper