Microsoft, Azure 데이터센터용 FP4 및 FP8 최적화 AI 추론 가속기 Maia 200 공개
Microsoft은 Azure 데이터센터에서 사용하기 위해 Maia 200이라는 새로운 AI 가속기를 개발했다. 이 가속기는 좁은 정밀도 컴퓨팅, 밀도 높은 칩 내 메모리 계층, 이더넷 기반 확장 패브릭을 결합하여 대형 언어 모델 및 추론 워크로드의 토큰 생성 비용을 줄이는 것을 목표로 한다. Microsoft은 왜 전용 추론 칩을 만들었는지에 대해 설명했다. 이러한 노력은 Azure의 AI 기능을 향상시키고 사용자들에게 더 나은 경험을 제공하기 위한 것이다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자