NVIDIA, Kubernetes용 AI 추론을 위한 CRIU 기반의 빠른 시작 시스템 ‘다이나모 스냅샷’ 출시

NVIDIA가 최근 Kubernetes 환경에서 AI 추론을 위한 새로운 시스템인 ‘다이나모 스냅샷’을 출시했습니다. 이 시스템은 CRIU(Checkpoint/Restore In Userspace)와 cuda-checkpoint 도구를 활용하여 vLLM 추론 작업자를 체크포인트하고 복원하는 기능을 제공합니다. 이를 통해 사용자는 AI 모델의 빠른 시작과 효율적인 관리가 가능해집니다. 다이나모 스냅샷은 AI 인프라의 성능을 향상시키고, 개발자들이 보다 쉽게 AI 애플리케이션을 운영할 수 있도록 돕는 데 중점을 두고 설계되었습니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자