Wonhyuk Yang2022년 12월 28일Review of "Buddy Compression: Enabling Larger Memory for Deep Learning and HPC Workloads on GPUs"Summary of the work GPU와 같은 가속기들은 CPU에 비해 limited capacity를 가지고 있다. large footprint를 가진 application들은 아래와 같은 다양한 방법들을 사용하였다. Scale out to...
Wonhyuk Yang2022년 7월 9일qspinlock note (feat. Paravirtualization)-WIP최근에 ETRI와 함께 Memos라는 역가상화 연구에 참여했다. 주제는 Guest 커널의 spinlock을 수정하여 성능 개선을 하는 것이였다. 이 주제에 대해 공부하면서 얻게된 spinlock에 대한 지식들을 정리하는 시간을 가져보도록 하겠다....
Wonhyuk Yang2022년 5월 29일포스텍 컴공 대학원 면접 후기이번 달은 대학원 면접들이 몰려 있어서 포스팅을 작성하지 못했다. 면접들이 다 치뤄 어느 정도 여유가 생겼기 때문에 면접들에 대한 후기를 짤막하게 적어보려고 한다. 나는 후기 모집으로 포스텍 컴공에 지원하였다. 포스텍은 지원했던 다른 대학에 비해...
Wonhyuk Yang2022년 4월 24일[IAMROOT] 2022/4/23 NoteQ1: __free_one_pages의 다소 복잡한 이유? A: mm/page_alloc: prevent merging between isolated and other pageblocks CMA 타입과, ISOLATE 타입의 블록 병합 문제 현상...
Wonhyuk Yang2022년 4월 23일Trace Point와 Event Tracer에 대한 NoteIntro 커널 코드를 살펴보면, 종종 "trace_" 접두사가 붙은 함수들을 살펴볼 수 있다. 해당 함수가 어떤 식으로 구현되어 있는지 살펴보려고 태그를 따라가려 하면 태그를 찾을 수 없을 것이다. 만약 해당 함수에 대한 간략한 설명이 있다면...
Wonhyuk Yang2022년 4월 19일Combining lock 노트-WIPBackground 현재 CPU의 발전 흐름은, CPU의 clock의 속도를 늘리는 방향이 아니라 코어의 개수를 늘려 throughput 늘리는 방향으로 진행되고 있다. core의 수가 늘어나면서 memory에 대한 높은 bandwith이...