Review of "Buddy Compression: Enabling Larger Memory for Deep Learning and HPC Workloads on GPUs"
Summary of the work GPU와 같은 가속기들은 CPU에 비해 limited capacity를 가지고 있다. large footprint를 가진 application들은 아래와 같은 다양한 방법들을 사용하였다. Scale out to many GPUs orchestrate data movement between the CPU and GPU Off-GPU memory access or Unified Memory (Oversubscribe device memory) 해당 논문에서는 Memory Compression을 통한 capacity 문제를 해결하려고 한다. Memory compression은 CPU에서 이미 많은 연구가 진행되었다. CPU에서 제안된 방법들은 CPU와 GPU의 1) 구조적인 차이와 2) Compressibility의 잦은 변호로 인하여 GPU에 적용하기 어렵다. Buddy compression의 Key idea는 GP