
이 연구는 LLM 에이전트를 위해 장기 기억에 저장할 내용, 단기 기억에 유지할 내용, 버릴 내용을 스스로 결정하는 방법을 설계하는 방법에 대해 다루고 있습니다. 이 연구에서는 텍스트 생성과 동일한 액션 공간을 통해 두 유형의 기억을 관리하는 단일 정책을 학습할 수 있는지에 대해 탐구하고 있습니다.

이 연구는 LLM 에이전트를 위해 장기 기억에 저장할 내용, 단기 기억에 유지할 내용, 버릴 내용을 스스로 결정하는 방법을 설계하는 방법에 대해 다루고 있습니다. 이 연구에서는 텍스트 생성과 동일한 액션 공간을 통해 두 유형의 기억을 관리하는 단일 정책을 학습할 수 있는지에 대해 탐구하고 있습니다.

MiniMax가 M2 모델의 향상된 버전인 MiniMax M2.1을 출시했다. 이 모델은 다중 코딩 언어 지원, API 통합, 구조화된 코딩을 위한 개선된 도구 등의 기능을 제공하며 낮은 비용으로 빠른 실행 속도를 자랑한다.
이 튜토리얼에서는 자체 추론 깊이를 조절하는 고급 메타-인지 제어 에이전트를 구축한다. 빠른 휴리스틱부터 심층적인 사고 연쇄, 정확한 도구 형식의 문제 해결까지 추론을 스펙트럼으로 취급하고, 각 작업에 대해 사용할 모드를 결정하기 위해 신경 메타-컨트롤러를 훈련시킨다.

구글 딥마인드는 복잡한 3D 게임 세계 안에서 얼마나 멀리 진화한 에이전트가 갈 수 있는지 테스트하기 위해 SIMA 2를 출시했다. SIMA 2는 이전의 명령 따르기 에이전트를 업그레이드하여 목표에 대한 추론, 계획 설명, 다양한 환경에서의 자가 플레이로부터 개선하는 제네시스 시스템을 도입했다.
신뢰할 수 있는 다중 에이전트 시스템은 대부분 메모리 설계 문제이다. 에이전트들이 도구를 호출하고 협업하며 긴 워크플로우를 실행할 때, 저장되는 내용, 검색 방법, 메모리가 잘못되거나 누락된 경우 시스템이 어떻게 동작하는지에 대한 명시적 메커니즘이 필요하다. 이 기사는 에이전트 스택에서 일반적으로 사용되는 6가지 메모리 시스템 패턴을 비교한다.
이 튜토리얼에서는 외부 조율이 아닌 에이전트가 단일 신경 모델 내에서 계획, 메모리 및 도구 사용을 내재화하는 방법을 탐색한다. 우리는 콤팩트한 모델 내이티브 에이전트를 디자인하여 산술 추론 작업을 강화 학습을 통해 수행하는 방법을 학습한다.

미니맥스팀이 코딩과 에이전트 워크플로에 최적화된 전문가 모델인 MiniMax-M2를 공개했다. 이 모델은 최대 모델 비용의 일부분으로 오랜 기간 동안 MCP, 쉘, 브라우저, 검색 및 코드 작업을 지원한다.
PokeeResearch-7B는 7B 파라미터 딥 리서치 에이전트로, 쿼리를 분해하고 검색 및 읽기 호출을 실행하며 후보 답변을 확인한 후 여러 리서치 스레드를 최종 응답으로 합성하는 기능을 제공한다. 에이전트는 연구 및 검증 루프를 실행한다.
이 튜토리얼에서는 Darts 라이브러리와 가벼운 HuggingFace 모델을 결합하여 시계열 예측을 자율적으로 처리하는 고급 에이전틱 AI 시스템을 구축한다. 데이터의 패턴을 분석한 후 적절한 예측 모델을 선택하고 예측을 생성하는 주기적 작업을 수행하는 에이전트를 설계한다.
알리바바의 통이 랩이 통이-딥리서치-30B-A3B를 오픈소스로 공개했다. 이 모델은 웹 도구를 활용한 장기, 심층 정보탐색을 위해 구축된 에이전트 특화 대형 언어 모델로, 약 30.5B의 총 파라미터와 토큰당 약 3-3.3B의 활성 파라미터를 사용하여 강력한 추론 성능을 유지하면서 고 처리량을 가능케 한다. ReAct 스타일 하의 멀티턴 연구 워크플로우를 대상으로 한다.
의료 인공지능 분야에서 AI의 역할이 증가하고 있으며, 생물학적 문제를 해결하고 환자 데이터를 해석하는 등 복잡한 작업을 수행할 수 있는 에이전트에 대한 수요가 급증하고 있다.
메모리의 중요성은 AI 에이전트에서 과소평가될 수 없다. 인공지능이 단순한 통계 모델에서 자율 에이전트로 성숙해갈수록 기억, 학습, 적응 능력이 기본적인 능력이 된다. 메모리는 기본 반응형 봇과 유연하고 인간과 유사한 상호작용과 의사결정을 지원할 수 있는 문맥을 인식하는 디지턀 개체를 구분짓는다.

OpenAI가 에이전트 SDK를 사용하여 도메인에 특화된 인공지능(AI) 에이전트를 구축하는 방법을 보여주는 새로운 다중 에이전트 고객 서비스 데모를 GitHub에 공개했습니다. 항공사 고객 서비스 챗봇 모델인 이 프로젝트는 다양한 여행 관련 쿼리를 처리할 수 있으며 요청을 전문 에이전트로 동적으로 라우팅합니다. Python 백엔드와 Next.js 프론트엔드로 구축되었습니다.

바이트댄스가 DeerFlow를 공개했는데, 이는 대형 언어 모델(Large Language Models)의 기능을 도메인별 도구와 통합하여 복잡한 연구 워크플로우를 향상시키는 오픈소스 멀티 에이전트 프레임워크이다. DeerFlow는 LangChain과 LangGraph 위에 구축되어 정보 검색부터 다중 모달 콘텐츠 생성까지 협력적인 인간 중심 환경에서 고급 연구 작업을 자동화하는 구조화된, 확장 가능한 플랫폼을 제공한다.

대형 언어 모델(Large language models, LLM)이 상호작용 환경에서 자율 에이전트로 훈련받을 때 중요한 도전에 직면하고 있다. 순차적 의사 결정, 교차 턴 메모리 유지, 환경적 피드백에 대한 적응 등이 필요한데, 이는 효과적인 계획 보조자, 로봇 응용 프로그램, 경험을 통해 자가 개선할 수 있는 지도 에이전트 개발에 중요하다. 이에 연구진은 StarPO-S와 RAGEN을 도입하여 이러한 도전을 대응하고 있다.
Xata Agent는 PostgreSQL 데이터베이스를 위한 사이트 신뢰성 엔지니어로 구축된 오픈 소스 AI 어시스턴트입니다. 느린 쿼리, CPU 및 메모리 스파이크, 비정상적인 연결 수 등의 신호를 지속적으로 모니터링하여 장애로 확대되기 전에 문제를 감지합니다.