본문으로 건너뛰기

Garbage Collection (GC) — SSD 내부

[!tldr] 업무 관점 takeaway SSD의 GC는 [[NAND-Flash-기초|NAND의 erase 단위 > write 단위]] 특성 때문에 반드시 발생한다. 문제는 얼마나 자주, 얼마나 비싸게 발생하느냐. [[KV-Cache]] 워크로드는 lifetime 불균일 + 높은 utilization으로 GC를 폭주시킨다 → [[WAF]] 증가 → write tail latency spike → LMCache warm [[TTFT-ITL|TTFT]] 흔들림. FDP는 정확히 이 GC 비용을 낮추는 메커니즘.


왜 GC가 필요한가

[[NAND-Flash-기초|NAND]]는:

  • Page 단위로 쓰기/읽기
  • Block 단위로만 erase
  • 덮어쓰기 불가

즉 "이 페이지를 업데이트" = "다른 페이지에 새로 쓰고 기존 페이지를 invalid 처리". 시간이 흐르면 블록 안에 invalid 페이지가 늘어나지만 erase는 block 단위라 못 지움 → 그 블록을 재활용하려면 GC.

GC 절차

1. Victim Block 선정 (invalid 페이지 비율 높은 블록)
2. Valid 페이지들을 다른 블록으로 복사
3. Victim Block을 erase
4. 이제 그 블록을 새 쓰기에 사용 가능

2번 복사가 [[WAF|Write Amplification]]의 직접 원인.


비용을 결정하는 변수

변수GC 비용에 미치는 영향
블록 안 valid 페이지 비율높을수록 복사량 ↑ → 비용 ↑
SSD utilization높을수록 victim 선택지 ↓ → 빈도 ↑
Lifetime 불균일짧은 게 지워질 때 긴 게 복사됨
Random write 빈도superblock에 구멍이 뚫림

GC와 사용자 응답속도 인과 사슬

GC 시점에 들어온 host write


GC 작업이 끝날 때까지 대기 (또는 background와 경합)


Write latency spike (p99)


[[LMCache-Local-Disk-Backend|LMCache async write]] 대기열 적체


CPU DRAM에서 evict 못 함 → 메모리 압박 → 결국 throughput ↓

→ GC 폭주는 단순히 SSD가 느려지는 게 아니라 LMCache 전체 파이프라인 backpressure로 전파.


FDP가 GC를 어떻게 줄이나

기존 SSD: append point 1개 → 모든 데이터 섞임 → 블록마다 lifetime 다양 → valid copy 많음 → GC 비쌈.

[[NVMe-FDP|FDP]] SSD: RUH별 append point → 같은 수명 데이터끼리 같은 RU → RU 단위로 동시에 invalid → 복사할 게 없는 erase.

이상적 FDP 시나리오:
RU #0 (single-query KV)
→ 모두 동시에 invalid 됨 (쿼리 끝나면)
→ erase 시 valid copy = 0
→ WAF = 1

측정 시 주의사항

  • SSD utilization이 낮으면 GC가 거의 안 일어남 → FDP 효과 안 보임. 실험은 utilization 90%+ 에서.
  • 측정 도중 SSD 내부 GC 타이밍에 따라 결과 노이즈. warm-up 후 정상 상태에서 측정.

의외의 연결

[!note] LMCache LRU evict ↔ FDP RU invalidation [[LMCache-Local-Disk-Backend|LMCache의 LRU eviction]]은 .pt 파일 삭제 = TRIM/DEALLOC. 같은 RUH로 그룹화된 파일들이 비슷한 시점에 모두 invalid 되면 → RU 전체가 비어 GC 없이 erase 가능. LRU bucket 자체가 RUH 매핑의 자연스러운 단위.


관련 페이지

  • [[NAND-Flash-기초]] — GC의 물리적 이유
  • [[WAF]] — GC의 정량 지표
  • [[NVMe-FDP]] — GC 비용을 푸는 기술
  • [[LMCache-Local-Disk-Backend]] — LRU eviction이 GC를 만나는 지점
  • [[HC-SSD]] — GC가 특히 비싼 미디어