2026년 3월 7일 토요일
오늘의 신문
2026년 3월 7일 토요일 오늘의 신문
Amazon SageMaker HyperPod에서 원 클릭 가능한 관측성으로 기본 모델 개발 가속화
발행일: 2025년 7월 10일 오후 2시 37분

Amazon SageMaker HyperPod는 SageMaker의 새로운 배포 옵션으로, Amazon EKS에서 실행되는 SageMaker 작업을 지원합니다. 이제 SageMaker HyperPod는 Amazon EKS 클러스터에 대한 관측성을 강화하기 위해 Amazon EKS 애드온을 제공합니다. Amazon SageMaker HyperPod에서 Amazon Elastic Kubernetes Service (EKS) 애드온을 원 클릭으로 설치하면 NVIDIA DCGM, 인스턴스 수준의 Kubernetes 노드 익스포터, Elastic Fabric Adapter (EFA), 통합 파일 시스템, Kubernetes API, Kueue, 그리고 SageMaker HyperPod 작업 연산자의 건강 및 성능 데이터를 통합할 수 있습니다. 이를 통해 사용자는 단일 대시보드에서 클러스터의 건강 상태와 성능에 대한 종합적인 정보를 시각화할 수 있습니다. 이 기사에서는 Amazon SageMaker AI 콘솔에서의 원 클릭 설치, 대시보드 및 통합하는 메트릭 탐색, 사용자 정의 경고 설정과 같은 고급 주제에 대해 다룹니다. SageMaker HyperPod의 관측성 기능을 통해 사용자는 클러스터의 건강 상태를 쉽게 모니터링하고 문제를 해결할 수 있습니다. 또한 사용자 지정 경고를 설정하여 잠재적인 문제에 대한 경고를 받을 수 있습니다. Amazon SageMaker HyperPod의 이러한 관측성 기능은 모델 개발 및 운영의 효율성을 높이는 데 도움이 될 것으로 기대됩니다. 관측성을 통해 사용자는 클러스터의 상태를 실시간으로 파악하고 리소스 사용률을 최적화할 수 있습니다. 또한 사용자 지정 경고를 통해 잠재적인 문제에 대한 미리 경고를 받아 신속하게 대응할 수 있습니다.

<AWS Blog 뉴스 본문 전체읽기>

출처: AWS Blog
요약번역: 미주투데이 최정민 기자