알리바바 큐엔 팀, GUI 자동화를 위한 다음 세대 멀티 에이전트 프레임워크 Mobile-Agent-v3 및 GUI-Owl 공개
최신 컴퓨팅은 모바일, 데스크탑 및 웹 디바이스에서 그래픽 사용자 인터페이스에 의해 지배된다. 이러한 환경에서 작업을 자동화하는 것은 기존에는 스크립트된 매크로나 부서지기 쉬운 수작업 엔진이 작업이었던 것이었다. 하지만 최근 언어 모델의 발전은 화면을 이해하고 작업을 추론하며 실행할 수 있는 에이전트의 가능성을 제공한다. 이러한 상황 속에서 알리바바 큐엔 팀은 GUI 자동화를 위한 Mobile-Agent-v3와 GUI-Owl을 발표했다. 이러한 프레임워크는 GUI 자동화를 위한 혁신적인 솔루션을 제공하며, 화면을 이해하고 작업을 추론하여 실행할 수 있는 에이전트를 구현하는 데 중요한 역할을 할 것으로 기대된다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자