아마존, 관련 뉴런만 활성화시켜 추론 시간 30% 단축하는 AI 아키텍처 개발
아마존 연구원들이 개발한 새로운 AI 아키텍처는 뇌가 특정 작업을 수행할 때 특정 뇌 영역을 활성화하는 방식과 유사한 원리를 적용하여 추론 시간을 30% 단축했다. 이전에는 대규모 AI 모델이 모든 요청마다 모든 뉴런을 활성화하는데 필요한 계산 비용과 지연 시간이 큰 문제였는데, 이 새로운 방법을 통해 관련성이 높은 뉴런만 선택함으로써 이 문제를 해결할 수 있었다. 이러한 혁신적인 아키텍처는 AI 모델의 성능을 향상시키고 더 빠른 응답 시간을 가능케 한다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자