Wavelet: Efficient DNN Training with Tick-Tock Scheduling

Abstract: DNNs have revolutionized across a wide range of applications, such as image classification, speech recognition and robotics control. As DNN models become more computationally expensive to train, parallel execution with multiple accelerators (e.g. GPUs) is adopted. System efficiency is a big issue when scaling out. However, as computation power increases, GPUs are under-utilized mainly due to limited local memory size. To address this memory bound, we present Wavelet, an efficient and generic approach that can fully utilize all the available on-device memory among GPUs involved in the distributed training job. Wavelet achieves near optimal on-device memory usage by adopting a simple scheduling scheme called Tick-Tock, which interleaves waves of peak memory usage among the accelerators. Evaluations on a variety of DNN models and tasks show that, Wavelet trains models up to 6.7x faster than commonly used parallelism techniques.

05/04/2021

Wavelet: Efficient DNN Training with Tick-Tock Scheduling

Guanhua Wang, Kehan Wang, Kenan Jiang, XIANGJUN LI, Ion Stoica

Comments

Similar Papers

Wavelet: Efficient DNN Training with Tick-Tock Scheduling

Guanhua Wang, Kehan Wang, Kenan Jiang and XIANGJUN LI, Ion Stoica

Keywords Abstract Paper

Rammer: Enabling Holistic Deep Learning Compiler Optimizations with rTasks

Lingxiao Ma, Zhiqiang Xie, Zhi Yang and Jilong Xue, Youshan Miao, Wei Cui, Wenxiang Hu, Fan Yang, Lintao Zhang, Lidong Zhou

Keywords Abstract Paper

Efficient Algorithms for Device Placement of DNN Graph Operators

Jakub Tarnawski, Amar Phanishayee, Nikhil Devanur and Divya Mahajan, Fanny Nina Paravecino

Keywords Abstract Paper

A computational approach to packet classification

Alon Rashelbach, Ori Rottenstreich, Mark Silberstein

Keywords Abstract Paper

Neural Networks, Virtual Switches, Packet Classification

Nimble: Lightweight and Parallel GPU Task Scheduling for Deep Learning

Woosuk Kwon, Gyeong-In Yu, Eunji Jeong, Byung-Gon Chun

Keywords Abstract Paper

Multi-Precision Policy Enforced Training (MuPPET) : A Precision-Switching Strategy for Quantised Fixed-Point Training of CNNs

Aditya Rajagopal, Diederik Vink, Stylianos Venieris, Christos-Savvas Bouganis

Keywords Abstract Paper

Applications - Other

A Learned Performance Model for Tensor Processing Units

Sam Kaufman, Mangpo Phothilimthana, Yanqi Zhou and Charith Mendis, Sudip Roy, Amit Sabne, Mike Burrows

Keywords Abstract Paper

Horizontally Fused Training Array: An Effective Hardware Utilization Squeezer for Training Novel Deep Learning Models

Shang Wang, Peiming Yang, Yuxuan Zheng and Xin Li, Gennady Pekhimenko

Keywords Abstract Paper

Theory -> Statistical Physics of Learning, Optimization -> Non-Convex Optimization

Horizontally Fused Training Array: An Effective Hardware Utilization Squeezer for Training Novel Deep Learning Models

Shang Wang, Peiming Yang, Yuxuan Zheng and Xin Li, Gennady Pekhimenko

Keywords Abstract Paper

Theory -> Statistical Physics of Learning, Optimization -> Non-Convex Optimization

BulletTrain: Accelerating Robust Neural Network Training via Boundary Example Mining

Weizhe Hua, Yichi Zhang, Chuan Guo and Zhiru Zhang, G. Edward Suh

Keywords Abstract Paper

deep learning, machine learning, robustness, adversarial robustness and security

BatchQuant: Quantized-for-all Architecture Search with Robust Quantizer

Haoping Bai, Meng Cao, Ping Huang, Jiulong Shan

Keywords Abstract Paper

deep learning, optimization

Memory-Efficient Pipeline-Parallel DNN Training

Deepak Narayanan, Amar Phanishayee, Kaiyu Shi and Xie Chen, Matei Zaharia

Keywords Abstract Paper

Applications, Hardware and Systems

Faster & more reliable tuning of neural networks: Bayesian optimization with importance sampling

Setareh Ariafar, Zelda Mariet, Dana Brooks and Jennifer Dy, Jasper Snoek

Keywords Abstract Paper

GPU-Accelerated Primal Learning for Extremely Fast Large-Scale Classification

John Halloran, David M Rocke

Keywords Abstract Paper

Caladan: Mitigating Interference at Microsecond Timescales

Joshua Fried, Zhenyuan Ruan, Amy Ousterhout, Adam Belay

Keywords Abstract Paper

PipeMare: Asynchronous Pipeline Parallel DNN Training

Bowen Yang, Jian Zhang, Jonathan Li and Christopher Re, Christopher Aberger, Christopher De Sa

Keywords Abstract Paper

Optimizing Memory Placement using Evolutionary Graph Reinforcement Learning

Shauharda Khadka, Estelle Aflalo, Mattias Marder and Avrech Ben-David, Santiago Miret, Shie Mannor, Tamir Hazan, Hanlin Tang, Somdeb Majumdar

Keywords Abstract Paper

Evolutionary Algorithms, Device Placement, Memory Mapping, Reinforcement Learning

Federated Hyperparameter Tuning: Challenges, Baselines, and Connections to Weight-Sharing

Mikhail Khodak, Renbo Tu, Tian Li and Liam Li, Maria-Florina Balcan, Virginia Smith, Ameet S Talwalkar

Keywords Abstract Paper

deep learning, optimization, machine learning, meta learning, federated learning

Sample Factory: Egocentric 3D Control from Pixels at 100000 FPS with Asynchronous Reinforcement Learning

Aleksei Petrenko, Zhehui Huang, Tushar Kumar and Gaurav Sukhatme, Vladlen Koltun

Keywords Abstract Paper

Reinforcement Learning - Deep RL

NVTraverse: In NVRAM data structures, the destination is more important than the journey

Michal Friedman, Naama Ben-David, Yuanhao Wei and Guy E. Blelloch, Erez Petrank

Keywords Abstract Paper

Non-blocking, Lock-free, Concurrent Data Structures, Non-volatile Memory

Offload Annotations: Bringing Heterogeneous Computing to Existing Libraries and Workloads

Gina Yuan, Shoumik Palkar, Deepak Narayanan, Matei Zaharia

Keywords Abstract Paper

Disentanglement in Nested-Parallel Programs

Sam Westrick, Rohan Yadav, Matthew Fluet, Umut A. Acar

Guanhua Wang, Kehan Wang, Kenan Jiang and
XIANGJUN LI, Ion Stoica

Keywords Paper

Lingxiao Ma, Zhiqiang Xie, Zhi Yang and
Jilong Xue, Youshan Miao, Wei Cui, Wenxiang Hu, Fan Yang, Lintao Zhang, Lidong Zhou

Keywords Paper

Jakub Tarnawski, Amar Phanishayee, Nikhil Devanur and
Divya Mahajan, Fanny Nina Paravecino

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Sam Kaufman, Mangpo Phothilimthana, Yanqi Zhou and
Charith Mendis, Sudip Roy, Amit Sabne, Mike Burrows

Keywords Paper

Shang Wang, Peiming Yang, Yuxuan Zheng and
Xin Li, Gennady Pekhimenko

Keywords Paper

Shang Wang, Peiming Yang, Yuxuan Zheng and
Xin Li, Gennady Pekhimenko

Keywords Paper

Weizhe Hua, Yichi Zhang, Chuan Guo and
Zhiru Zhang, G. Edward Suh

Keywords Paper

Keywords Paper

Deepak Narayanan, Amar Phanishayee, Kaiyu Shi and
Xie Chen, Matei Zaharia

Keywords Paper

Setareh Ariafar, Zelda Mariet, Dana Brooks and
Jennifer Dy, Jasper Snoek

Keywords Paper

Keywords Paper

Keywords Paper

Bowen Yang, Jian Zhang, Jonathan Li and
Christopher Re, Christopher Aberger, Christopher De Sa

Keywords Paper

Shauharda Khadka, Estelle Aflalo, Mattias Marder and
Avrech Ben-David, Santiago Miret, Shie Mannor, Tamir Hazan, Hanlin Tang, Somdeb Majumdar

Keywords Paper

Mikhail Khodak, Renbo Tu, Tian Li and
Liam Li, Maria-Florina Balcan, Virginia Smith, Ameet S Talwalkar

Keywords Paper

Aleksei Petrenko, Zhehui Huang, Tushar Kumar and
Gaurav Sukhatme, Vladlen Koltun

Keywords Paper

Michal Friedman, Naama Ben-David, Yuanhao Wei and
Guy E. Blelloch, Erez Petrank

Keywords Paper

Keywords Paper

Keywords Paper

Keywords Paper

Heyang Qin, Samyam Rajbhandari, Olatunji Ruwase and
Feng Yan, Lei Yang, Yuxiong He

Keywords Paper

Yimin Jiang, Yibo Zhu, Chang Lan and
Bairen Yi, Yong Cui, Chuanxiong Guo

Keywords Paper

Chao-Yuan Wu, Ross Girshick, Kaiming He and
Christoph Feichtenhofer, Philipp Krähenbühl

Keywords Paper

Keywords Paper

Keywords Paper

Deepak Narayanan, Keshav Santhanam, Fiodar Kazhamiaka and
Amar Phanishayee, Matei Zaharia

Keywords Paper

Brennan Shacklett, Erik Wijmans, Aleksei Petrenko and
Manolis Savva, Dhruv Batra, Vladlen Koltun, Kayvon Fatahalian

Keywords Paper

Mike Rainey, Ryan R. Newton, Kyle Hale and
Nikos Hardavellas, Simone Campanoni, Peter Dinda, Umut A. Acar

Keywords Paper

Keywords Paper

David Durst, Matthew Feldman, Dillon Huff and
David Akeley, Ross Daly, Gilbert Louis Bernstein, Marco Patrignani, Kayvon Fatahalian, Pat Hanrahan

Keywords Paper

Anji Liu, Jianshu Chen, Mingze Yu and
Yu Zhai, Xuewen Zhou, Ji Liu

Keywords Paper

Atli Kosson, Vitaliy Chiley, Abhi Venigalla and
Joel Hestness, Urs Koster

Keywords Paper

Atli Kosson, Vitaliy Chiley, Abhi Venigalla and
Joel Hestness, Urs Koster

Keywords Paper