2026년 6월 2일 화요일
오늘의 신문
2026년 6월 2일 화요일 오늘의 신문

최신뉴스 전체보기

Amazon FSx for Lustre와 TurboQuant로 LLM 모델 로딩 가속화 및 컨텍스트 윈도우 확대

AWS GPU 인스턴스에서 대형 언어 모델을 배포할 때, GPU 고대역폭 메모리에 모델을 로딩하는 시간이 길어지는 문제를 해결하기 위한 방법이 소개됐다.

2026년 6월 2일 오전 1시 07분AWS Blog