FDP PoC 반복실험 재해석: host write 감소는 FDP 확정 효과 아님
작성일: 2026-06-19 관련 결과 리포트:
- 2026-06-15_waf_r0_window32g_readme8_result.md (단일 batch, R0 32GiB)
- 2026-06-15_stage4_poc_harness_report.md (3mode_final)
- ../04_measure/summary.md
- parser: ../04_measure/parse_results.py
한 줄 결론
72 measurement run 반복실험에서 세 모드(no_fdp / mixed / separated)의 LMCache replay
operation 수는 동일했다. 따라서 평균에서 관측된 separated의 host write delta 감소는
FDP placement로 인한 확정적 애플리케이션 write 감소가 아니라, 현재 측정 조건에서 관측된
SMART controller counter 차이로 해석해야 한다. WAF ratio가 세 모드 거의 동일했던 것도 이
해석을 지지한다.
반복실험 관측 (72 measurement run, 3 mode 공통)
| 항목 | no_fdp / mixed / separated 공통 |
|---|---|
| measurement run 수 | 72 |
| finish_write count | 105,728 |
| reserve_write count | 105,728 |
| prefetch count | 6,464 |
| errors | 0 |
즉 store/prefetch operation 수가 세 모드 동일 → separated가 store operation을 덜 수행해서
host write가 적어진 것이 아니다.
host write가 적어 보인 이유
-
host_write_bytes_delta는 애플리케이션 logical write 합산이 아니라 NVMe SMARTData Units Written차이다.- harness가 쓴 "논리적 KV store bytes"를 직접 더한 값이 아님.
measurement_after - measurement_after_warmup으로 잡은 SSD controller counter.- 코드 근거:
parse_results.py는 이 값을 harnesssummary.json에서 그대로 읽고 (summarize_run의host_write_bytes_delta = summary.get(...)), 두 결과 리포트의 "Counter consistency" 표에서 Internal host delta == Outer SMART delta 가 바이트까지 일치한다 (예: no_fdp385,622,528,000동일). 즉 harness 내부값 자체가nvme smart-log의data_units_writtenbefore/after 차이다.
-
mode별 실제 write path는 거의 같고, FDP는 placement directive만 다르다.
- no_fdp / mixed / separated 모두
use_uring_cmd=true. - 차이는
use_fdp=false냐, FDP directive dtype/dspec(RUH 할당)을 넣느냐 정도. - 그러니까 host write 감소를 "FDP가 앱 write 자체를 줄였다"로 설명하면 안 된다.
- no_fdp / mixed / separated 모두
-
반복실험에서도 일관된 mode 효과는 아니다.
- 평균은 separated host write가 가장 낮지만, trial별로 보면 고정된 패턴이 아니다.
- 예: trial_03 은 no_fdp
464.10GiB, separated473.62GiB로 오히려 separated가 더 큼.
-
R0 precondition / discard / controller 내부 상태 / counter capture timing 영향 가능성.
- 각 mode 전에
blkdiscard+ 32GiB fill + random overwrite(≈64GiB write)를 수행. - SMART host counter는 SSD/controller 관점의 data units written이라, 직전 상태·write coalescing·deferred work·namespace/controller counter 특성에 영향을 받을 수 있다.
- 각 mode 전에
더 강하게 말할 수 있는 점 (op 동일 ⇒ artifact)
replay op 수가 세 모드 동일(finish_write 105,728 each)이라면 앱이 장치로 보낸 host write
총량도 모드 간 같아야 한다. 그런데 단일 batch 리포트의 SMART host delta는 no_fdp 475.96 / mixed 466.29 / separated 348.08 GiB 로 ~127GiB 벌어졌다. op가 같은데 이만큼 벌어지는 것은
"FDP가 앱 write를 줄였다"로는 원리적으로 설명되지 않으며, R0 잔여·counter capture
window·controller deferred write가 delta에 섞인 측정 artifact라는 뜻이다.
그리고 WAF ratio가 세 모드 모두 ≈ 1.0159 로 동일했던 것이 결정적 근거다 — 실제로
placement 분리가 내부 GC copy를 줄였다면 separated의 WAF가 떨어졌어야 하는데 떨어지지 않았다.
권장 리포트 표현
반복실험 평균에서
separated의 host/media write delta가 낮게 관측되었지만, replay operation 수는 세 모드가 동일하고 trial별 방향도 완전히 일관되지는 않았다. 따라서 host write 감소는 FDP placement로 인한 확정적 애플리케이션 write 감소라기보다, 현재 측정 조건에서 관측된 controller counter 차이로 해석해야 한다.
지금 확실히 말할 수 있는 것은: store/prefetch operation 수는 세 모드 동일했고, SMART host write delta만 달랐으며, WAF ratio는 거의 같았다는 것뿐이다. host write 감소를 FDP 효과로 단정할 수 없다.
후속
- 정식 FDP 효과(WAF/endurance)를 주장하려면, op 수가 동일한 조건에서 host write delta가 아니라 media write / WAF ratio가 mode 간 통계적으로 분리되는지를 봐야 한다. 현재는 분리 안 됨.
- counter artifact를 줄이려면 R0 span 확대(256/512GiB) 또는 counter capture window를 mode별로 동일 길이·동일 settle로 고정한 재실험이 필요하다 (단일 batch 리포트의 "next step"과 동일 방향).