2026년 4월 23일 목요일
오늘의 신문
2026년 4월 23일 목요일 오늘의 신문
포톤이 AI 에이전트를 iMessage, WhatsApp, 텔레그램에 직접 배포할 수 있는 오픈소스 TypeScript 프레임워크 '스펙트럼'을 출시했다. 이 프레임워크는 사용자와의 상호작용을 증진시키기 위해 개발되었다.
2026년 4월 22일 오전 3시 43분
OpenAI가 AI 에이전트의 디버깅을 돕기 위한 브라우저 기반 시각화 도구 'Euphony'를 오픈 소스로 공개했습니다. 이 도구는 Harmony 채팅 데이터와 Codex 세션 로그를 시각화합니다.
2026년 4월 22일 오전 12시 38분
Hugging Face가 대형 언어 모델(LLM)의 후처리 작업을 자동화하는 오픈소스 AI 에이전트 'ml-intern'을 출시했다. 이 도구는 문헌 검토, 데이터셋 발견, 훈련 스크립트 실행 등의 작업을 자동으로 수행한다.
2026년 4월 21일 오후 8시 43분
이 튜토리얼에서는 Hyperopt와 TPE 알고리즘을 사용하여 조건부 베이지안 하이퍼파라미터 최적화 워크플로우를 구현합니다. 다양한 모델 패밀리 간의 동적 전환을 보여주는 검색 공간을 구성합니다.
2026년 4월 21일 오후 8시 04분
구글이 전문 AI 분야에서 사용할 수 있는 제어 가능하고 확장 가능한 합성 데이터셋을 생성하는 '시뮬라'라는 새로운 프레임워크를 소개했습니다. 이는 사이버 보안, 법률, 의료 등 다양한 분야에서 필요한 데이터 부족 문제를 해결하기 위한 노력의 일환입니다.
2026년 4월 21일 오후 12시 46분
이번 튜토리얼에서는 Qwen 3.6-35B-A3B 모델을 기반으로 멀티모달 MoE 모델을 실제 워크플로우에 적용하는 방법을 다룹니다. 환경 설정부터 GPU 메모리에 따른 모델 로딩, 재사용 가능한 채팅 프레임워크 구축까지 다양한 내용을 포함합니다.
2026년 4월 21일 오전 3시 54분
중국의 AI 연구소 문샷 AI가 Kimi K2.6을 오픈 소스 형태로 출시했습니다. 이 모델은 자율적으로 소프트웨어 공학 문제를 해결하는 데 중점을 두고 있으며, 장기 코딩 에이전트와 자연어 기반 프론트엔드 생성 기능을 제공합니다.
2026년 4월 20일 오후 9시 58분
이번 튜토리얼에서는 Microsoft의 Phi-4-mini를 사용하여 현대 LLM 워크플로우를 처리하는 방법을 소개합니다. 안정적인 환경 설정과 4비트 양자화를 통한 모델 로딩 과정을 단계별로 설명합니다.
2026년 4월 20일 오후 8시 13분
OpenAI가 사이버 방어 프로그램의 신뢰할 수 있는 접근 방식을 확대하며, 사이버 보안에 최적화된 GPT-5.4-Cyber 모델을 수천 명의 검증된 방어자에게 제공한다고 발표했다.
2026년 4월 20일 오전 4시 26분
문샷 AI와 칭화대 연구진이 대규모 언어 모델(LLM) 서비스 방식을 혁신적으로 변화시킬 PrfaaS 아키텍처를 제안했습니다. 이 아키텍처는 데이터 센터 간의 KVCache 구조를 통해 LLM의 추론 방식을 개선하는 데 중점을 두고 있습니다.
2026년 4월 19일 오후 8시 51분
OpenMythos는 Claude Mythos 아키텍처를 이론적으로 재구성한 오픈소스 프로젝트로, PyTorch로 완전히 구축되었습니다. 이 프로젝트는 연구 커뮤니티의 이론을 바탕으로 하고 있습니다.
2026년 4월 19일 오후 3시 47분
TabPFN이 In-Context Learning을 활용하여 랜덤 포레스트와 CatBoost보다 탭형 데이터셋에서 더 높은 정확도를 기록하고 있습니다. 이 기술은 다양한 데이터 유형을 처리하는 데 강점을 보입니다.
2026년 4월 19일 오후 3시 11분
이 튜토리얼에서는 Magika의 딥러닝 기반 파일 유형 탐지와 OpenAI의 언어 지능을 결합하여 실용적인 분석 파이프라인을 구축하는 방법을 소개합니다.
2026년 4월 19일 오후 2시 38분
NVIDIA가 하이브리드 양자-고전 시스템을 위한 첫 번째 오픈 양자 AI 모델인 '이징'을 출시했습니다. 이 모델은 양자 컴퓨터와 고전 컴퓨터의 간극을 줄이기 위한 노력의 일환으로 개발되었습니다.
2026년 4월 19일 오전 3시 54분
일론 머스크의 AI 회사 xAI가 독립형 음성 인식(STT) 및 음성 합성(TTS) API를 출시했습니다. 이 API는 Grok Voice의 인프라를 기반으로 하며, 기업 음성 개발자를 겨냥하고 있습니다.
2026년 4월 19일 오전 1시 28분
이 튜토리얼에서는 GPU 가속을 활용하여 PrismML의 최적화된 GGUF 배포 스택을 사용해 Bonsai 1비트 대형 언어 모델을 효율적으로 실행하는 방법을 설명합니다.
2026년 4월 19일 오전 12시 33분

최신뉴스 전체보기

보상 희소 환경 해결을 위한 온라인 프로세스 보상 학습을 사용하여 선호도로부터 단계별 보상 학습하는 방법

이 튜토리얼에서는 온라인 프로세스 보상 학습 (OPRL)을 탐구하고, 궤적 선호도로부터 밀도가 높은 단계별 보상 신호를 학습하여 희소 보상 강화 학습 과제를 해결하는 방법을 시연합니다. 미로 환경부터 보상 모델 네트워크, 선호도 생성, 훈련 루프 및 평가까지 각 구성요소를 살펴보면서 에이전트가 서서히 개선되는 과정을 관찰합니다.

2025년 12월 3일 오전 8시 19분
구글 딥마인드 연구진, LLM 에이전트의 경험 재사용을 위한 Evo-Memory 벤치마크 및 ReMem 프레임워크 소개

대형 언어 모델 에이전트들은 모든 것을 저장하기 시작했지만, 테스트 시 경험을 통해 정책을 개선할 수 있을까? 일리노이 대학과 구글 딥마인드의 연구진은 Evo-Memory를 제안하며 이 문제에 대처한다. Evo-Memory는 경험 재사용을 위한 스트리밍 벤치마크 및 에이전트 프레임워크를 평가한다.

2025년 12월 3일 오전 7시 01분
DeepSeek 연구자들, 장문맥 추론과 에이전트 워크로드를 위한 DeepSeek-V3.2 및 DeepSeek-V3.2-Speciale 소개

DeepSeek 연구팀이 DeepSeek-V3.2 및 DeepSeek-V3.2-Speciale을 소개했다. 이 모델들은 에이전트를 위한 고품질 추론, 장문맥, 에이전트 워크플로우를 지향하며 열린 가중치와 제품 API를 갖췄다.

2025년 12월 2일 오전 9시 53분
MiniMax-M2: 상호 작용적 사고에 대한 에이전틱 코딩 워크플로에 대한 기술적 탐구

MiniMax-M2는 AI 코딩 환경을 혁신하며, 고성능이 높은 비용이나 레이턴시로 이어지는 문제를 해결한다. 이 기사는 MiniMax-M2에 대한 기술적 개요를 제공한다.

2025년 12월 2일 오전 2시 23분
Panel를 사용하여 고급 다중 페이지 대시 보드 설계하기: 동적 필터링, 실시간 KPI, 풍부한 시각적 탐색

Panel을 활용해 고급 다중 페이지 인터랙티브 대시 보드를 만드는 튜토리얼. 각 구성 요소를 통해 합성 데이터 생성, 풍부한 필터 적용, 동적 시계열 트렌드 시각화, 세그먼트 및 지역 비교, 그리고 실시간 KPI 업데이트 시뮬레이션 방법을 탐구한다.

2025년 12월 1일 오전 6시 53분
메타 AI 연구원들이 소개하는 매트릭스: 레이 네이티브, 분산 프레임워크를 통한 다중 에이전트 합성 데이터 생성

메타 AI 연구원들이 소개한 매트릭스는 현대 AI 모델을 위해 합성 데이터를 신선하고 다양하게 유지하는 방법을 제시하는데, 단일 조율 파이프라인을 병목 현상으로 만들지 않고, 분산된 대기열을 통해 메시지로 직렬화된 제어와 데이터 흐름을 구현한 분산 프레임워크이다.

2025년 11월 30일 오후 6시 49분
StepFun AI, 새 오디오 LLM Step-Audio-R1 발표: 테스트 시간 컴퓨팅 스케일링에서 이점

StepFun 연구팀이 새 오디오 LLM Step-Audio-R1을 발표했다. 이 모델은 테스트 시간 컴퓨팅 스케일링을 위해 설계되어, 오디오에 대한 실제 소리 기반의 의사 결정에서 장시간 추론을 생성할 때 성능이 저하되는 문제를 해결한다.

2025년 11월 30일 오전 7시 03분
NVIDIA AI, Orchestrator-8B 발표: 효율적인 도구 및 모델 선택을 위한 강화 학습 훈련 컨트롤러

NVIDIA 연구진이 ToolOrchestra를 발표했습니다. 이는 각 작업 단계마다 올바른 모델 또는 도구를 선택하는 AI 시스템을 어떻게 학습시킬 수 있는지에 대한 혁신적인 방법입니다.

2025년 11월 29일 오후 1시 18분
안전하고 모듈화되며 확장 가능한 툴 주도 추론 워크플로우를 위한 제어 평면 아키텍처를 사용하여 에이전틱 AI 시스템을 설계하는 코딩 가이드

이 튜토리얼에서는 제어 평면 디자인 패턴을 사용하여 고급 에이전틱 AI를 구축하고 구현할 때 각 구성 요소를 단계별로 안내합니다. 제어 평면을 중앙 조정기로 취급하여 도구를 조정하고 안전 규칙을 관리하며 추론 루프를 구조화합니다. 또한 작은 검색 시스템을 설정합니다.

2025년 11월 29일 오후 12시 15분
DeepSeek AI, DeepSeekMath-V2 발표: 2024년 Putnam 대회에서 118/120점 획득한 오픈 웨이트 수학 모델

DeepSeek AI가 공개 가중치 대규모 언어 모델인 DeepSeekMath-V2를 발표했다. 이 모델은 자연어 정리를 최적화하고 자가 검증을 통해 자신의 추론이 올바른지 확인하면서 복잡한 올림피아드 수학 문제를 해결할 수 있다.

2025년 11월 28일 오후 6시 35분
문헌 분석, 가설 생성, 실험 계획, 시뮬레이션, 과학 보고를 수행하는 에이전틱 AI 프레임워크에 대한 코딩 구현

이 튜토리얼에서는 문헌 말뭉치를 로드하고 검색 및 LLM 모듈을 구성하고 논문을 검색하고 가설을 생성하고 실험을 설계하며 구조화된 보고서를 생성하는 에이전트를 조립하여 과학적 발견 에이전트를 구축하는 방법을 설명합니다.

2025년 11월 28일 오전 11시 30분
OceanBase, Seekdb 릴리스: 멀티모델 RAG와 AI 에이전트를 위한 오픈소스 AI 네이티브 하이브리드 검색 데이터베이스

OceanBase가 AI를 위해 고안된 오픈소스 데이터베이스인 seekdb를 출시했다. seekdb는 다양한 데이터 모델과 AI 에이전트를 위한 하이브리드 검색 기능을 제공하며, Apache 2.0 라이센스로 제공된다.

2025년 11월 27일 오후 4시 44분
텐센트 훈유안, HunyuanOCR 공개: 1B 파라미터 엔드 투 엔드 OCR 전문가 VLM

텐센트 훈유안이 OCR 및 문서 이해를 위해 특화된 1B 파라미터 비전 언어 모델인 HunyuanOCR을 공개했다. 이 모델은 멀티모달 아키텍처를 기반으로 하며, 스포팅, 파싱, 정보 추출, 시각적 질문 응답 및 텍스트 이미지 번역을 단일 엔드 투 엔드 파이프라인을 통해 실행한다.

2025년 11월 27일 오전 4시 07분
Black Forest Labs가 제작 이미지 파이프라인을 위한 32B 플로우 매칭 트랜스포머인 FLUX.2를 출시합니다

Black Forest Labs가 FLUX.2를 발표했습니다. FLUX.2는 실제 창의적 워크플로우를 대상으로 하며, 마케팅 자산, 제품 사진, 디자인 레이아웃, 복잡한 인포그래픽 등에 편집 지원을 제공합니다. FLUX.2 제품군과 FLUX.2 [dev]가 소개되었습니다.

2025년 11월 26일 오후 4시 46분
Tinygrad를 사용하여 딥러닝 내부를 이해하기 위해 Transformer 및 Mini-GPT 모델의 기능 구성 요소를 처음부터 구현하는 방법

Tinygrad를 사용하여 텐서, 오토그래드, 어텐션 메커니즘 및 트랜스포머 구조를 완전히 손으로 만들어보는 튜토리얼. 기본 텐서 작업부터 멀티헤드 어텐션, 트랜스포머 블록, 미니-GPT 모델까지 순차적으로 구축하면서 Tinygrad의 간결함을 관찰한다.

2025년 11월 26일 오후 4시 04분
Salesforce AI 연구팀이 소개한 xRouter: 비용 인식 LLM Orchestration을 위한 강화 학습 라우터

Salesforce AI 연구팀이 소개한 xRouter는 강화 학습 기반 라우터를 활용하여 각 요청에 어떤 서버가 응답해야 하는지 결정하며 외부 모델을 호출할지 결정하는 기능을 제공한다.

2025년 11월 26일 오전 3시 25분
Agent0: 외부 데이터 없이 고성능 에이전트를 진화시키는 완전 자율형 AI 프레임워크

UNC-Chapel Hill, Salesforce Research 및 Stanford University의 연구자들이 소개한 ‘Agent0’는 외부 데이터 없이 고성능 에이전트를 다단계 공진을 통해 진화시키는 완전 자율형 프레임워크이다.

2025년 11월 25일 오후 3시 10분
논리적 계획과 신경 인식을 결합한 강력한 자율 의사 결정을 위한 신경 기호 하이브리드 에이전트 구축 방법

이 튜토리얼에서는 심볼릭 추론의 강점을 신경 학습과 결합하여 강력한 하이브리드 에이전트를 구축하는 방법을 보여줍니다. 우리는 구조, 규칙 및 목표 지향적 행동을 위해 고전적 계획을 사용하는 신경 기호 아키텍처를 만드는 데 초점을 맞추고, 신경망이 인식 및 행동 정제를 처리하도록합니다.

2025년 11월 25일 오후 2시 13분
Microsoft AI, Fara-7B 발표: 컴퓨터 사용을 위한 효율적인 에이전틱 모델

마이크로소프트 연구팀이 7조 개의 파라미터를 가진 Fara-7B를 발표했다. 이 모델은 컴퓨터 사용을 위해 특별히 설계된 작은 언어 모델로, 클라우드로 데이터를 보내지 않고도 AI 에이전트가 웹 작업을 처리할 수 있게 해준다.

2025년 11월 25일 오전 7시 57분
NVIDIA AI, Nemotron-Elastic-12B 발표: 추가 훈련 비용 없이 6B/9B/12B 변형 제공하는 단일 AI 모델

NVIDIA는 하나의 탄력 있는 모델로 여러 크기의 모델을 생성할 수 있게 하여 AI 개발팀이 여러 대규모 언어 모델을 훈련하고 저장할 필요성을 없앴다. NVIDIA AI팀은 Nemotron-Elastic-12B를 발표했는데, 이는 12B 파라미터 추론 모델로, 추가 훈련 비용 없이 6B, 9B, 12B 변형을 제공한다.

2025년 11월 24일 오후 3시 54분
AI 인터뷰 시리즈 #3: 페더레이티드 러닝 설명

ML 엔지니어로서 민감한 센서 데이터를 다루는 피트니스 회사에서 개인 맞춤형 운동을 권장하거나 건강 위험을 예측하는 모델을 구축하려고 할 때 개인정보 보호법에 따라 페더레이티드 러닝을 설명하라는 질문에 대한 답변.

2025년 11월 24일 오후 2시 57분
Moonshot AI 연구자들, Seer 소개: 빠른 동기화 강화 학습 RL 롤아웃을 위한 온라인 콘텍스트 학습 시스템

Moonshot AI와 Tsinghua 대학의 연구진은 대규모 추론 모델에 대한 강화 학습이 매우 긴, 매우 느린 롤아웃에 멈추지 않도록하고 GPU가 under used 상태에서 어떻게 유지할 수 있는지에 대한 새로운 온라인 콘텍스트 학습 시스템 ‘Seer’를 소개했다.

2025년 11월 23일 오후 3시 28분
똑똑한 지역 피드백, 적응적 의사 결정, 그리고 다중 에이전트 조정을 갖춘 미니 강화 학습 환경-행동 에이전트 설계하는 방법

이 튜토리얼에서는 상호 작용, 피드백 및 계층적 의사 결정을 통해 그리드 월드를 탐색하는 다중 에이전트 시스템을 학습하는 미니 강화 학습 설정을 코딩합니다. Action Agent, Tool Agent 및 Supervisor 세 가지 에이전트 역할을 결합하여 간단한 휴리스틱, 분석을 관찰할 수 있습니다.

2025년 11월 23일 오후 2시 24분
구글 딥마인드, 나노 바나나 프로 소개: 텍스트 정확하고 스튜디오급 시각을 위한 제미니 3 프로 이미지 모델

나노 바나나 프로는 구글 딥마인드의 새 이미지 생성 및 편집 모델로, 구조, 세계 지식, 텍스트 레이아웃을 존중해야 하는 이미지를 생성하고 편집하는 최첨단 시스템이다.

2025년 11월 22일 오후 4시 34분
Perplexity AI, 기존 GPU 클러스터에서 1조 매개변수 LLMs 실행 가능한 TransferEngine 및 pplx garden 공개

Perplexity의 연구팀이 TransferEngine 및 pplx garden 툴킷을 공개하여, 기존 GPU 클러스터에서 1조 매개변수 언어 모델을 실행하는 방법을 제공함.

2025년 11월 21일 오후 7시 56분
Opik를 사용한 투명하고 측정 가능하며 재현 가능한 AI 워크플로우를 위한 완전 추적 및 평가된 로컬 LLM 파이프라인 구현

Opik를 사용하여 LLM 파이프라인을 구축, 추적 및 평가하는 완전한 워크플로우를 구현하는 튜토리얼. 경량 모델로 시작하여 프롬프트 기반 계획 추가, 데이터셋 생성 및 자동화된 평가 실행까지 구조화된 시스템을 단계별로 진행하며 Opik가 각 함수 스팬을 추적하는 방법을 확인합니다.

2025년 11월 21일 오후 5시 47분
Allen Institute for AI (AI2)가 Dolma 3 및 Dolci 스택에서 구축된 오픈 소스 7B 및 32B LLM 패밀리인 Olmo 3를 소개합니다

Allen Institute for AI (AI2)가 오픈 소스로 출시한 Olmo 3는 전체 ‘모델 플로우’를 노출하는데, 원시 데이터 및 코드부터 중간 체크포인트 및 배포 준비 모델까지 포함하고 있습니다. Olmo 3은 7B 및 32B 파라미터 모델을 갖춘 밀도 변환기 스위트입니다.

2025년 11월 21일 오후 12시 07분
오프라인 멀티툴 추론 에이전트 구축하는 방법: 동적 계획, 오류 복구, 지능적 기능 라우팅

이 튜토리얼에서는 Instructor 라이브러리를 사용하여 구조화된 출력물을 생성하고 복잡한 도구 호출을 신뢰성 있게 조정하는 오프라인 멀티스텝 추론 에이전트를 구축하는 방법을 탐구합니다. 올바른 도구 선택, 입력 유효성 검사, 다단계 워크플로 계획, 오류 복구를 할 수 있는 에이전트를 설계합니다.

2025년 11월 21일 오전 8시 32분
Meta AI, 이미지와 비디오에서 프롬프트 가능한 개념 세분화를 위한 Segment Anything Model 3 (SAM 3) 발표

Meta AI 팀이 Meta Segment Anything Model 3 또는 SAM 3을 공개했다. SAM 3은 간단한 프롬프트를 사용하여 대규모 이미지 및 비디오 컬렉션에서 모든 개념의 인스턴스를 신뢰성 있게 찾고 세분화하고 추적하는 데 사용되는 통합 기본 모델이다.

2025년 11월 21일 오전 4시 53분
vLLM 대 TensorRT-LLM 대 HF TGI 대 LMDeploy, 프로덕션 LLM 추론을 위한 심층 기술 비교

이 비교는 vLLM, TensorRT-LLM, HF TGI, LMDeploy의 4가지 스택에 초점을 맞춰 실제 작업 부하에서 추론 스택의 선택이 GPU 플릿의 토큰 당 초, 테일 레이턴시 및 궁극적으로 백만 토큰 당 비용을 결정한다.

2025년 11월 20일 오후 4시 21분
OpenAI, GPT-5.1-Codex-Max 소개: 장기간 소프트웨어 엔지니어링 작업을 위한 코딩 모델

OpenAI가 GPT-5.1-Codex-Max를 소개했다. 이 모델은 수백만 토큰과 멀티 시간대 세션을 거치는 장기 소프트웨어 엔지니어링 작업을 위해 설계되었다. CLI, IDE 확장, 클라우드 통합 및 코드 리뷰 등에서 사용 가능하며 API 액세스도 곧 예정되어 있다.

2025년 11월 20일 오후 12시 55분
구글 안티그래비티, IDE를 에이전트 코딩을 위한 제어 평면으로 만듦

구글이 Gemini 3 위에 위치한 에이전트 개발 플랫폼인 안티그래비티를 소개했다. 자동 완성 레이어뿐만 아니라 편집기, 터미널, 브라우저 등 여러 환경에서 복잡한 소프트웨어 작업을 기획, 실행, 설명하는 IDE로 안티그래비티는 2025년 11월 18일 Gemini 3와 함께 출시되었다.

2025년 11월 20일 오전 8시 02분
현대적 에이전틱 AI 시스템의 추론 전략을 평가하기 위한 포괄적 경험적 프레임워크의 구현

이 튜토리얼에서는 다양한 작업에서 여러 추론 전략을 평가하여 에이전틱 구성 요소를 체계적으로 벤치마킹하는 방법을 탐구합니다. 각기 다른 아키텍처인 직접방식, 사고연쇄방식, ReAct, Reflexion 등이 어려움이 증가하는 문제에 직면했을 때 어떻게 행동하고, 정확도, 효율성, 대기 시간, 도구 사용 패턴을 측정합니다.

2025년 11월 20일 오전 6시 32분
에이전틱 딥 강화 학습 시스템 구축 방법: 커리큘럼 진행, 적응적 탐험, 메타 레벨 UCB 계획

이 튜토리얼에서는 환경 내에서의 행동 뿐만 아니라 자체 교육 전략을 선택하는 방법을 학습하는 고급 에이전트형 딥 강화 학습 시스템을 구축한다. Dueling Double DQN 학습자를 설계하고 어려움이 증가하는 커리큘럼을 도입하며 학습 중에 적응하는 여러 탐험 모드를 통합한다.

2025년 11월 19일 오전 8시 35분
xAI의 Grok 4.1, 감정 지능 향상, 환각 감소 및 안전 제어 강화를 추진

xAI의 최신 대형 언어 모델인 Grok 4.1은 인간들에게 감정적으로 지능적이고 신뢰할 수 있는 AI 어시스턴트를 구축하는 방법을 제시한다. 이 모델은 모든 사용자에게 이용 가능하며, 감정 지능을 향상시키고 환각을 줄이며 안전 제어를 강화한다.

2025년 11월 19일 오전 8시 21분
구글의 Gemini 3 Pro가 희소 MoE와 1백만 토큰 콘텍스트를 다중 모달 에이전트 워크로드를 위한 실용 엔진으로 변환

구글은 Gemini 3 Pro를 중심으로 하는 Gemini 3 패밀리를 발표했는데, 이는 백만 토큰 콘텍스트를 다루며 현실 신호를 이해하고 신뢰성 있게 대리자로서 행동할 수 있는 시스템으로 발전하는 과정에서 중요한 한걸음을 나아가고 있다.

2025년 11월 19일 오전 4시 12분
Uni-MoE-2.0-Omni: 텍스트, 이미지, 오디오 및 비디오 이해를 위한 오픈 Qwen2.5-7B 기반 Omnimodal MoE

Uni-MoE-2.0-Omni은 텍스트, 이미지, 오디오, 비디오를 신뢰성 있게 이해하는 오픈 모델로, 하비른 공과대학의 연구진이 소개했다. 이 시스템은 언어 중심의 다중 모달 추론을 위해 Lychee의 Uni-MoE 라인을 발전시킨 것으로, 효율적으로 운영된다.

2025년 11월 18일 오후 3시 56분
불균형 분류를 위한 Focal Loss vs 이진 크로스 엔트로피: 실용적 가이드

바이너리 크로스 엔트로피(BCE)는 이진 분류의 기본 손실 함수이지만, 불균형 데이터셋에서 심각한 문제를 야기할 수 있다. Focal Loss는 한 클래스가 극도로 드물 때도 오류를 적절하게 고려하여 불균형 분류에 유용하다.

2025년 11월 18일 오전 10시 08분
구글 딥마인드의 WeatherNext 2, 함수적 생성 신경망 활용해 확률 기반 날씨 예보 8배 빨라져

구글 딥마인드의 WeatherNext 2는 새로운 함수적 생성 신경망(FGN) 아키텍처와 대규모 앙상블을 결합하여 8배 빠른 확률 기반 날씨 예보를 제공하는 AI 기반의 중기 전역 날씨 예보 시스템이다. Google Search, Gemini, Pixel Weather, Google Maps Platform의 Weather API에 업그레이드된 예보를 제공하고 있으며 Google Maps 통합이 예정되어 있다.

2025년 11월 18일 오전 5시 16분
Meta AI가 DreamGym을 소개: 강화 학습 RL 에이전트를 위한 텍스트 경험 합성기

Meta AI가 DreamGym을 소개했다. DreamGym은 강화 학습을 위한 텍스트 경험 합성기로, 대형 언어 모델 에이전트를 위해 설계되었다. 강화 학습에서 실제 상호작용이 필요한데 이를 해결하기 위해 DreamGym이 개발되었다.

2025년 11월 17일 오후 6시 17분
Optuna를 사용한 고급 하이퍼파라미터 최적화 구현을 위한 코딩 가이드: Pruning Multi-Objective Search, Early Stopping 및 Deep Visual Analysis 활용

이 튜토리얼에서는 Optuna를 사용하여 가지치기, 다중 목적 최적화, 사용자 정의 콜백 및 풍부한 시각화를 체계적으로 탐색하는 고급 워크플로우를 구현합니다. 각 스니펫을 통해 Optuna가 더 스마트한 탐색 공간을 형성하고 실험 속도를 높이며 모델 향상을 이끄는 통찰을 추출하는 방법을 살펴봅니다.

2025년 11월 17일 오후 5시 24분
구글 딥마인드, 복잡한 3D 가상 세계용 제네시스 기반 일반적 에이전트 SIMA 2 소개

구글 딥마인드는 복잡한 3D 게임 세계 안에서 얼마나 멀리 진화한 에이전트가 갈 수 있는지 테스트하기 위해 SIMA 2를 출시했다. SIMA 2는 이전의 명령 따르기 에이전트를 업그레이드하여 목표에 대한 추론, 계획 설명, 다양한 환경에서의 자가 플레이로부터 개선하는 제네시스 시스템을 도입했다.

2025년 11월 16일 오후 4시 40분
AI 인터뷰 시리즈 #2: 일반적인 모델 컨텍스트 프로토콜 (MCP) 보안 취약점 설명

MCP에서 발생하는 일반적인 보안 취약점에 대해 살펴보는 인터뷰 시리즈. MCP는 LLM이 외부 도구 및 데이터 소스와 안전하게 상호 작용할 수 있도록 설계된 프레임워크인데, 모델이 컨텍스트에 액세스하는 방법에 구조와 투명성을 제공하지만 동시에 새로운 보안 위험을 도입한다.

2025년 11월 16일 오후 4시 00분
2025년 최고의 4가지 에이전틱 AI 브라우저 비교: Atlas vs Copilot Mode vs Dia vs Comet

2025년에는 OpenAI의 ChatGPT Atlas, Microsoft Edge의 Copilot Mode, The Browser Company의 Dia, Perplexity의 Comet이 에이전틱 AI 브라우저 시장을 주도하고 있습니다. 각각이 자율성, 기억, 개인 정보 보호 등 다른 디자인 선택을 하고 있습니다. 이 기사는 그들의 아키텍처를 비교합니다.

2025년 11월 16일 오전 2시 51분
메모리를 활용한 에이전틱 AI 구축 방법: 경험과 의미론적 패턴을 통해 장기 자율성 달성하기

이 튜토리얼에서는 메모리를 핵심 능력으로 활용하여 단일 상호작용을 넘어선 에이전틱 시스템을 구축하는 방법을 탐색합니다. 에피소딕 메모리를 설계하고 경험을 저장하며 의미론적 메모리를 활용하여 장기적인 패턴을 파악함으로써 에이전트가 여러 세션을 통해 행동을 발전시킬 수 있습니다.

2025년 11월 16일 오전 1시 57분
Cerebras, 롱 컨텍스트 코딩 에이전트를 위한 MiniMax-M2-REAP-162B-A10B 출시

Cerebras가 MiniMax-M2-REAP-162B-A10B를 발표했다. 이 모델은 MiniMax-M2에서 파생된 압축된 희소 Mixture-of-Experts (SMoE) 인과 언어 모델로, Router 가중 전문가 활성화 가지치기(REAP) 방법을 사용하여 전문가를 가지치기하고 코딩 에이전트 및 도구와 같은 배포 중심 워크로드의 메모리를 줄였다.

2025년 11월 15일 오후 9시 53분
MBZUAI 연구자들이 PAN을 소개: 상호작용 가능한 장기 시뮬레이션을 위한 일반적인 세계 모델

MBZUAI의 연구진이 PAN이라는 새로운 모델을 소개했다. 이 모델은 시간이 지남에 따라 도착하는 작업에 따라 지속되는 내부 세계 상태를 유지하지 않는 대부분의 텍스트에서 비디오 모델과는 달리, 상호작용 가능한 일반적인 세계 모델로 작용하도록 설계되었다.

2025년 11월 15일 오후 12시 13분
텍스트를 이용한 완전히 대화형, 반응형, 동적 터미널 기반 데이터 대시보드 디자인하는 방법?

이 튜토리얼에서는 Textual을 사용하여 고급 대화형 대시보드를 구축하며 터미널 우선 UI 프레임워크가 현대적인 웹 대시보드와 같이 표현력이 풍부하고 동적일 수 있는 방법을 탐색합니다. 각 스니펫을 작성하고 실행하면서 인터페이스를 조각조각 조립하고 위젯, 레이아웃, 반응 상태 및 이벤트 흐름을 활성화하여 볼 수 있습니다.

2025년 11월 15일 오전 3시 48분
2025년 최고의 AI 에이전트 아키텍처 비교: 계층적, 스왐, 메타 러닝, 모듈러, 진화

2025년에는 AI 에이전트를 구축하는 것은 대부분 에이전트 아키텍처를 선택하는 것을 의미하며, 인식, 기억, 학습, 계획 및 행동이 어떻게 구성되고 조정되는지에 대한 것이다. 이 비교 기사는 계층적, 스왐, 메타 러닝, 모듈러, 진화적인 5가지 구조를 살펴본다.

2025년 11월 15일 오전 3시 21분
OpenAI 연구자들, 해석 가능한 회로 노출을 위해 가중치 희소 트랜스포머를 훈련

OpenAI가 새로운 기계적 해석 가능성 연구를 소개했는데, 언어 모델을 희소 내부 배선을 사용하도록 훈련시켜 각 행동을 구동하는 특정 회로를 볼 수 있게 했다.

2025년 11월 14일 오후 7시 16분
spaCy를 활용한 계획, 반성, 메모리, 지식 그래프를 특징으로 하는 고급 다중 에이전트 추론 시스템 설계 방법

본 튜토리얼에서는 spaCy를 사용하여 고급 에이전트 AI 시스템을 구축하는 방법을 소개하며, 여러 지능적인 에이전트가 추론, 협업, 반성 및 경험으로 학습할 수 있도록 설계되었습니다. 각 에이전트가 계획, 메모리, 통신 및 의미적 추론을 사용하여 작업을 처리하는 과정을 단계별로 살펴보며, 최종적으로 어떻게 작동하는지 확인합니다.

2025년 11월 14일 오전 9시 53분
Meta AI, 1600개 이상의 언어에 대한 다국어 음성 인식 모델인 Omnilingual ASR 공개

Meta AI가 Omnilingual ASR을 발표했다. 이는 1600개 이상의 언어를 이해할 수 있는 오픈 소스 음성 인식 스위트로, 이전에 작동되지 않았던 많은 언어에도 적용 가능하다.

2025년 11월 11일 오전 4시 06분
JAX, Flax, 및 Optax를 사용하여 잔여 연결, Self-Attention, 적응적 최적화를 활용한 고급 아키텍처 구축 및 훈련하는 코딩 구현

이 튜토리얼에서는 JAX, Flax, 및 Optax를 사용하여 효율적이고 모듈화된 방식으로 고급 신경망을 구축하고 훈련하는 방법을 탐구합니다. 잔여 연결 및 Self-Attention 메커니즘을 통합한 심층 아키텍처를 설계한 후 학습률 스케줄링과 같은 정교한 최적화 전략을 구현합니다.

2025년 11월 11일 오전 2시 16분
Moonshot AI, Kimi CLI를 구동하는 LLM 추상화 계층인 Kosong 출시

Moonshot AI의 Kosong은 에이전트 애플리케이션을 위한 LLM 추상화 계층으로, 메시지 구조, 비동기 도구 조정, 플러그인형 채팅을 통합해 유지보수 가능한 스택을 제공한다.

2025년 11월 10일 오후 6시 47분
Gelato-30B-A3B: GUI 컴퓨터 사용 작업을 위한 최첨단 그라운딩 모델, GTA1-32B와 같은 컴퓨터 그라운딩 모델을 능가

ML Foundations 연구팀이 소개한 Gelato-30B-A3B는 그래픽 사용자 인터페이스를 위한 최첨단 그라운딩 모델로, AI 에이전트에게 명확한 화면 요소를 찾아 클릭하도록 가르치는 것에 대한 문제를 해결한다.

2025년 11월 10일 오후 4시 30분
LLM 에이전트를 위한 메모리 시스템 비교: 벡터, 그래프, 이벤트 로그

신뢰할 수 있는 다중 에이전트 시스템은 대부분 메모리 설계 문제이다. 에이전트들이 도구를 호출하고 협업하며 긴 워크플로우를 실행할 때, 저장되는 내용, 검색 방법, 메모리가 잘못되거나 누락된 경우 시스템이 어떻게 동작하는지에 대한 명시적 메커니즘이 필요하다. 이 기사는 에이전트 스택에서 일반적으로 사용되는 6가지 메모리 시스템 패턴을 비교한다.

2025년 11월 10일 오전 3시 24분
Kosmos를 만나보세요: 데이터 주도적 발견을 자동화하는 AI 과학자

Edison Scientific이 만든 Kosmos는 데이터세트와 자연어 목표를 받아들여 반복적인 데이터 분석, 문헌 검색, 가설 생성을 수행하고 결과를 완전히 인용된 과학 보고서로 합성하는 자율 발견 시스템이다.

2025년 11월 10일 오전 2시 35분
다른치 메모리, 메타-러닝, 경험 재생으로 지속적으로 적응하는 신경 메모리 에이전트를 구축하는 코딩 구현

이 튜토리얼에서는 신경 메모리 에이전트가 과거 경험을 잊지 않고 계속 학습하는 방법을 탐구합니다. 우리는 경험 재생과 메타-러닝을 통합한 메모리 보강 신경망을 설계하여 새로운 작업에 빠르게 적응하면서 이전 지식을 유지하는 방법을 보여줍니다. PyTorch에서 이 방법을 구현함으로써 콘텐츠 기반 메모리를 어떻게 활용하는지를 시연합니다.

2025년 11월 9일 오후 9시 14분
AI 인터뷰 시리즈 #1: LLM에서 사용되는 몇 가지 LLM 텍스트 생성 전략 설명

LLM은 한 번에 완전한 답변을 생성하는 것이 아니라 한 번에 한 단어(또는 토큰)씩 응답을 구축합니다. 각 단계에서 모델은 지금까지 쓰여진 모든 것을 기반으로 다음 토큰이 될 확률을 예측합니다. 하지만 확률만 알아서는 충분하지 않습니다.

2025년 11월 9일 오후 4시 42분
StepFun AI, 새로운 오픈소스 3B LLM 등급 오디오 편집 모델 Step-Audio-EditX 출시, 표현력과 반복적인 오디오 편집에서 뛰어남

StepFun AI가 공개한 Step-Audio-EditX는 3B 파라미터 LLM 기반 오디오 모델로, 표현력 있는 음성 편집을 파형 수준 신호 처리 작업이 아닌 토큰 수준 텍스트 작업으로 변환시킴. 개발자들이 제어 가능한 TTS에 관심을 갖는 이유에 대해 설명.

2025년 11월 9일 오전 11시 51분
의지를 갖춘 음성 AI 어시스턴트 구축 방법: 자율적인 다단계 지능을 통해 이해하고 추론, 계획 및 응답하는 방법

이 튜토리얼에서는 실시간으로 자연어를 통해 이해, 추론 및 응답이 가능한 의지를 갖춘 음성 AI 어시스턴트를 구축하는 방법을 탐구합니다. 음성 인식, 의도 감지, 다단계 추론 및 텍스트 음성 합성을 통합하는 자체 음성 인텔리전스 파이프라인을 설정하는 것부터 시작하여, 우리는 듣고 반응하며 디자인합니다.

2025년 11월 8일 오후 11시 22분
Nested Learning: 연속 학습을 위한 새로운 기계 학습 접근 방식, 모델을 중첩 최적화 문제로 보고 장기적인 컨텍스트 처리 향상

구글 연구자들이 소개한 Nested Learning은 모델을 하나의 외부 루프로 훈련된 단일 네트워크가 아닌 작은 중첩 최적화 문제의 모음으로 처리하는 기계 학습 접근 방식으로, 이전에 학습한 내용을 잊지 않고 새로운 정보를 계속 학습할 수 있는 AI 시스템을 구축하는 방법을 모색한다.

2025년 11월 8일 오후 4시 05분
Prior Labs, TabPFN-2.5 발표: 탭피에프엔의 규모와 속도를 높이는 최신 버전

Prior Labs가 TabPFN-2.5를 발표했다. 이는 탭피에프엔의 규모와 속도를 높여준다. 금융, 의료, 에너지 및 산업팀은 행과 열의 테이블로 작업하며, 이 모델은 50,000개 샘플과 2,000개 피처로 학습 범위를 확장한다.

2025년 11월 8일 오전 5시 44분
Anthropic, ‘Code Execution With MCP’ 방식으로 MCP 에이전트를 코드 우선 시스템으로 전환

Anthropic의 ‘code execution with MCP’ 패턴은 MCP 도구를 코드 수준 시스템으로 전환하여 대규모 워크플로우의 토큰 소모, 지연 및 비용 한계를 개선한다.

2025년 11월 8일 오전 5시 06분
실시간 데이터베이스, 동적 상태 관리, 반응형 UI로 고급 멀티페이지 Reflex 웹 애플리케이션 만드는 방법

이 튜토리얼에서는 Colab 내에서 완벽하게 실행되는 고급 Reflex 웹 애플리케이션을 파이썬으로 구축합니다. Reflex를 사용하면 JavaScript 없이 반응형 파이썬 코드만으로 풀스택 개발이 가능합니다. 두 개의 페이지, 실시간 데이터베이스 상호작용, 필터링, 정렬, 분석, 사용자 맞춤 설정을 갖춘 노트 관리 대시보드를 만듭니다.

2025년 11월 8일 오전 4시 32분
구글 AI가 ADK Go를 공개: 강력한 AI 에이전트 구축을 위해 Go 개발자에게 역량을 부여하는 새로운 오픈소스 툴킷

구글이 Go용 에이전트 개발 킷인 ADK Go를 출시했다. Go 개발자들은 기존의 Python과 Java를 지원하는 프레임워크로 AI 에이전트를 구축할 수 있게 되었으며, 익숙한 Go 도구 체인 내에서 모든 것을 유지할 수 있다.

2025년 11월 7일 오후 5시 08분
왜 공간 초감지가 다중 모달 AI 시스템의 핵심 능력으로 떠오르고 있는가?

다중 모달 AI 시스템에서 공간 초감지가 중요한 이유는 강력한 ‘장기적 맥락’ AI 모델조차 오랜 메시 비디오 스트림에서 객체 및 수를 추적할 때 실패하기 때문이다. 이에, 다음에 오는 것을 예측하고 놀라운 중요한 사건만 선택적으로 기억하는 모델들이 다음 경쟁 우위를 확보할 것으로 전망된다.

2025년 11월 7일 오후 12시 29분
2025년 LLM 서빙을 위한 상위 6개 추론 런타임 비교

대형 언어 모델은 훈련보다는 실제 트래픽 하에서 토큰을 빠르고 저렴하게 제공하는 방법에 더 많은 제약을 받는다. 이는 런타임이 요청을 일괄 처리하는 방식, 프리필과 디코드를 어떻게 중첩시키는지, KV 캐시를 어떻게 저장하고 재사용하는지에 달려 있다. 서로 다른 엔진들은 서로 다른 절충안을 제공한다.

2025년 11월 7일 오전 5시 12분
통로 추론을 이용한 통합 전사체, 단백체, 대사체 데이터 해석을 위한 다중 에이전트 시스템 구축

이 튜토리얼에서는 전사체, 단백체, 대사체를 포함한 통합 옴익스 데이터를 해석하여 주요 생물학적 통찰을 발견하는 고급 다중 에이전트 파이프라인을 구축합니다. 실제 생물학적 추세를 모방하는 일관된 합성 데이터 세트를 생성하고, 통계 분석, 네트워크 추론, 경로 풍부화, 약물 재활용을 위해 설계된 에이전트를 단계별로 진행합니다.

2025년 11월 7일 오전 3시 43분
Moonshot AI, 인간 개입 없이 200-300개의 순차 도구 호출을 실행할 수 있는 인상적인 사고 모델 Kimi K2 Thinking 출시

Moonshot AI사가 Kimi K2 Thinking을 공개했다. 이 모델은 Kimi K2 Mixture of Experts 아키텍처의 전체 추론 스트림을 노출하는 오픈 소스 사고 에이전트 모델로, 깊은 추론이 필요한 작업을 대상으로 한다.

2025년 11월 6일 오후 9시 19분
Salesforce CodeGen을 활용한 자율 Wet-Lab 프로토콜 플래너 및 검증기 구축

Python을 사용하여 실험 설계 및 실행을 위한 지능적 에이전트인 Wet-Lab 프로토콜 플래너 및 검증기를 구축하는 튜토리얼. Salesforce의 CodeGen-350M-mono 모델을 자연어 추론에 통합하고 ProtocolParser를 사용하여 구조화된 데이터 추출.

2025년 11월 6일 오후 8시 03분
구글 AI가 DS STAR를 소개: 엔드 투 엔드 분석을 계획, 코딩, 검증하는 멀티 에이전트 데이터 과학 시스템

구글 연구원들이 DS STAR(Data Science Agent via Iterative Planning and Verification)를 소개했다. 이는 엔드 투 엔드 데이터 과학 질문을 실행 가능한 Python 코드로 변환하는 멀티 에이전트 프레임워크이다.

2025년 11월 6일 오후 5시 03분
CMU 연구진, 프로액티브 및 개인화된 LLM 에이전트를 훈련시키기 위해 PPP와 UserVille 소개

CMU 연구진은 프로액티브 및 개인화된 LLM 에이전트를 훈련시키기 위해 PPP와 UserVille을 소개했다. 기존 LLM 에이전트들은 과제 성공을 극대화하기 위해 조정되어 있지만 사용자에게 언제 질문할지, 상호작용 선호도를 어떻게 존중할지 신중하게 이유를 생각하지 않는다. 이에 대한 해결책을 모색하고 있다.

2025년 11월 6일 오전 4시 49분
Generalist AI가 GEN-θ를 소개: 고품질 원시 물리적 상호작용에 직접 다중 모달 훈련을 위해 구축된 새로운 신체 기반 모델 클래스

Generalist AI가 GEN-θ를 공개했습니다. 이 모델은 시뮬레이션에 의존하지 않고 혼돈스러운 로봇 데이터로부터 물리적 기술을 학습할 수 있는 싱글 모델을 어떻게 구축할 수 있는지 보여줍니다. GEN-θ는 인터넷 비디오나 시뮬레이션 대신에 고품질 원시 물리적 상호작용 데이터로 직접 훈련된 신체 기반 모델의 가족입니다.

2025년 11월 5일 오후 8시 56분
모델 내이티브 에이전트를 구축하는 방법: 엔드 투 엔드 강화 학습을 통해 내부 계획, 메모리 및 멀티툴 추론 습득하기

이 튜토리얼에서는 외부 조율이 아닌 에이전트가 단일 신경 모델 내에서 계획, 메모리 및 도구 사용을 내재화하는 방법을 탐색한다. 우리는 콤팩트한 모델 내이티브 에이전트를 디자인하여 산술 추론 작업을 강화 학습을 통해 수행하는 방법을 학습한다.

2025년 11월 5일 오후 1시 00분
OpenAI, 인도어 언어를 위한 문화 인식 벤치마크 ‘IndQA’ 발표

OpenAI가 인도어 언어와 문화를 실제 상황에서 얼마나 이해하는지 테스트하는 벤치마크 ‘IndQA’를 발표했다. 이는 AI 모델이 인도어 언어의 문화적 영역에 관한 질문을 얼마나 잘 이해하고 추론하는지를 평가한다. OpenAI는 전 세계 인구의 약 80%가 인도어 언어를 사용한다고 밝혔다.

2025년 11월 5일 오후 12시 37분
구글 AI, 아부지파와 탈옥 스타일 프롬프트에서 안전한 언어 모델을 위한 일관성 훈련 소개

구글 AI가 일관성 훈련을 도입하여 언어 모델이 아부지파 프롬프트와 탈옥 스타일 공격에 저항하면서 능력을 유지하는 방법. 대형 언어 모델은 종종 칭찬이나 롤플레이로 둘러싸인 동일한 작업에 대해 안전하게 응답한 뒤 행동을 바꿀 수 있다. DeepMind 연구원들은 이를 위해 간단한 훈련 렌즈에서 일관성 훈련을 제안한다.

2025년 11월 5일 오전 10시 32분
메타 리서치 하이드라를 활용해 확장 가능하고 재현 가능한 머신러닝 실험 파이프라인을 구축하는 방법은 무엇인가요?

이 튜토리얼에서는 Meta Research가 개발하고 오픈 소스로 공개한 고급 구성 관리 프레임워크 인 하이드라를 탐색합니다. Python 데이터 클래스를 사용하여 구조화된 구성을 정의하여 실험 매개변수를 깔끔하고 모듈식으로 관리하고 재현 가능하게 합니다. 튜토리얼을 진행하면서 구성을 구성하고 런타임 오버라이드를 적용하고 시뮬레이션합니다.

2025년 11월 4일 오후 7시 00분
2025년 코딩을 위한 상위 7개 대형 언어 모델 LLMs/시스템 비교

2025년, 주요 모델은 실제 GitHub 문제를 해결하고 다중 저장소 백엔드를 리팩터링하며 테스트를 작성하고 긴 컨텍스트 창 위에서 에이전트로 실행해야 합니다. 팀들에게 중요한 질문은 “코딩이 가능한가”가 아니라 어떤 모델이 어떤 제약 조건에 적합한가입니다.

2025년 11월 4일 오전 4시 48분
대규모 언어 모델 간의 KV-Cache 퓨전을 통한 캐시 간 직접 의미적 통신인 ‘캐시-투-캐시(C2C)’

대규모 언어 모델이 텍스트 토큰을 보내지 않고 협업할 수 있는지 연구팀이 증명했다. 캐시-투-캐시(C2C)는 대규모 언어 모델이 KV-Cache를 통해 정보를 교환하는 새로운 통신 패러다임이다.

2025년 11월 4일 오전 3시 32분
주석 달린 데이터가 없을 때 지도 AI 모델을 구축하는 방법

실제 기계 학습에서 가장 큰 어려움은 지도 모델이 레이블이 달린 데이터를 필요로 한다는 것인데, 많은 실전 시나리오에서 시작하는 데이터는 대부분 레이블이 없습니다. 수천 개의 샘플을 수동으로 주석을 다는 것은 느리고 비용이 많이 들며 지루하고 종종 실용적이지 않습니다. 이때 액티브 러닝이 게임 체인저가 됩니다.

2025년 11월 3일 오후 6시 58분
Anyscale 및 NovaSky 팀이 SkyRL tx v0.1.0을 출시: Tinker 호환 강화 학습 엔진을 로컬 GPU 클러스터로 가져오기

Anyscale과 NovaSky 팀이 SkyRL tx v0.1.0을 출시했다. 이 엔진은 AI 팀이 자체 인프라에서 대형 언어 모델에 대한 Tinker 스타일 강화 학습을 단일 통합 엔진을 사용하여 실행할 수 있게 해준다.

2025년 11월 3일 오후 6시 18분
지속 메모리와 맞춤형 에이전틱 AI 시스템을 어떻게 설계할까요? (Decay와 Self-Evaluation과 함께)

이 튜토리얼에서는 우리에게 기억하고 배우며 시간이 지남에 따라 적응하는 지능적 에이전트를 구축하는 방법을 탐구합니다. 우리는 단순한 규칙 기반 논리를 사용하여 지속 메모리 및 개인화 시스템을 구현하고, 현대적인 에이전틱 AI 프레임워크가 맥락 정보를 저장하고 호출하는 방식을 시뮬레이션합니다.

2025년 11월 3일 오전 12시 13분
AI-ready API를 만드는 방법은?

Postman이 AI-ready API를 구축하기 위한 포괄적인 체크리스트와 개발자 가이드를 발표했는데, 가장 간단한 진실을 강조했다: 가장 강력한 AI 모델조차도 받는 데이터만큼 좋다. 엔드포인트가 일관성 없거나 명확하지 않거나 신뢰할 수 없으면 모델은 나쁜 입력을 수정하는 데 시간을 낭비한다.

2025년 11월 2일 오후 7시 42분
LongCat-Flash-Omni: 560B 매개변수를 갖고 27B 활성화된 SOTA 오픈소스 옴니 모달 모델, 실시간 오디오-비주얼 상호작용에서 뛰어남

Meituan의 LongCat 팀이 LongCat Flash Omni를 발표했다. 이 모델은 5600억 개 매개변수와 토큰 당 약 27억 개 활성화를 갖춘 오픈소스 옴니 모달 모델로, 텍스트, 이미지, 비디오, 오디오를 실시간으로 듣고 보고 읽고 응답할 수 있는 효율적인 단일 모델을 설계하는 방법이다.

2025년 11월 2일 오전 10시 44분
2025년 최고의 OCR (Optical Character Recognition) 모델/시스템 비교

2025년 현대 시스템은 스캔 및 디지털 PDF를 한 번에 읽고 레이아웃을 보존하며 표를 감지하고 키-값 쌍을 추출하고 여러 언어를 처리해야 합니다. 많은 팀들은 이제 OCR이 RAG 및 에이전트 파이프라인에 직접 공급되는 것을 원합니다.

2025년 11월 2일 오전 3시 49분
기업 AI 벤치마킹 프레임워크 코딩 구현: 실제 업무 과제에서 규칙 기반 LLM 및 하이브리드 에이전트 AI 시스템 평가

이 튜토리얼에서는 다양한 종류의 에이전트 AI 시스템을 실제 기업 소프트웨어 과제에서 평가하기 위한 포괄적인 벤치마킹 프레임워크를 개발한다. 데이터 변환, API 통합, 워크플로 자동화, 성능 최적화 등 다양한 도전 과제를 설계하고, 규칙 기반, LLM 기반, 하이브리드 에이전트를 포함한 다양한 에이전트가 이러한 작업들에서 어떻게 수행되는지 평가한다.

2025년 11월 1일 오후 11시 03분
DeepAgent: 단일 추론 프로세스 내에서 자율 사고, 도구 발견 및 작업 실행을 수행하는 깊은 추론 AI 에이전트

DeepAgent는 사전 정의된 Reason, Act, Observe 루프를 실행하는 대부분의 에이전트 프레임워크와는 달리, 에이전트는 프롬프트에 주입된 도구만 사용할 수 있습니다. 이는 작은 작업에는 작동하지만, 도구 세트가 크거나 작업이 길거나, 추론 중에 전략을 변경해야 하는 경우 실패합니다.

2025년 11월 1일 오후 6시 01분
Anthropics의 새로운 연구, Claude가 주입된 개념을 감지할 수 있지만 제어된 층에서만 가능

Anthropics의 새 연구는 대형 언어 모델인 Claude가 자체 내부 상태를 인지하는지 아니면 훈련 데이터에서 반복하는지 구별하는 방법을 살펴봅니다. 현재 Claude 모델이 자신의 능력에 대해 이야기하는 것 이상을 할 수 있는지 살펴보며, 주입된 개념을 감지할 수 있는지에 대해 질문을 제기합니다.

2025년 11월 1일 오전 5시 10분
Apache Spark와 PySpark를 사용한 엔드 투 엔드 데이터 엔지니어링 및 머신 러닝 파이프라인 구축하는 방법

이 튜토리얼에서는 Apache Spark의 기술을 Google Colab에서 PySpark를 사용하여 직접 활용하는 방법을 탐구합니다. 로컬 Spark 세션 설정부터 변환, SQL 쿼리, 조인, 창 함수까지 단계적으로 진행하며 사용자 구독 유형을 예측하는 간단한 머신 러닝 모델을 구축하고 평가합니다.

2025년 11월 1일 오전 3시 11분
구글 AI, 지도 강화 학습 (SRL) 공개: 전문가 궤적을 통해 작은 언어 모델에 어려운 문제 해결 능력 가르치기

구글 클라우드 AI 연구팀과 UCLA 연구원들이 ‘지도 강화 학습’ (SRL) 프레임워크를 발표했습니다. 이를 통해 7B 규모의 모델이 어려운 수학 및 에이전트 작업에서 학습할 수 있게 되었습니다.

2025년 10월 31일 오후 10시 58분
OpenAI, ‘gpt-oss-safeguard’의 연구 미리보기 공개: 안전 분류 작업을 위한 두 개의 오픈 웨이트 추론 모델

OpenAI가 gpt-oss-safeguard의 연구 미리보기를 공개했습니다. 두 개의 오픈 웨이트 안전 추론 모델은 사용자가 추론 시 사용자 정의 안전 정책을 적용할 수 있도록 합니다. 모델은 gpt-oss에서 파인 튜닝된 gpt-oss-safeguard-120b와 gpt-oss-safeguard-20b 두 가지 크기로 제공되며 Apache 2.0 라이선스로 배포되었으며 Hugging Face에서 로컬 사용을 위해 제공됩니다.

2025년 10월 31일 오전 4시 08분
경량 Qwen 모델을 활용한 효율적 파이프라인 인텔리전스를 위한 자율 다중 에이전트 데이터 및 인프라 전략 시스템 설계 방법

Qwen2.5-0.5B-Instruct 모델을 활용해 자율 다중 에이전트 데이터 및 인프라 전략 시스템을 설계하는 방법에 대한 튜토리얼. 유연한 LLM 에이전트 프레임워크를 만들고 데이터 관리의 다양한 레이어를 처리하는 특수 에이전트를 개발하여 효율적인 실행을 달성함.

2025년 10월 31일 오전 12시 27분
Ant Group, 각 활성화가 추론 능력을 향상시키는 원칙에 따라 구축된 추론 중심 MoE 언어 모델 시리즈인 Ling 2.0 출시

Ant Group의 Inclusion AI 팀이 Ling 2.0을 출시했다. 이 모델은 각 토큰의 계산을 거의 바꾸지 않으면서 용량이 증가하는 언어 모델로, 추론 능력을 향상시키는 원리에 기반한다.

2025년 10월 30일 오후 4시 39분
오픈 소스 모델을 사용하여 가치지향적 추론과 자기 수정 결정을 통해 윤리적으로 일치하는 자율 에이전트 구축하는 방법

이 튜토리얼에서는 윤리적 및 조직적 가치와 일치하는 자율 에이전트를 구축하는 방법을 탐구합니다. Colab에서 로컬로 실행되는 오픈 소스 Hugging Face 모델을 사용하여 목표 달성과 도덕적 추론을 균형있게 고려하는 의사 결정 과정을 시뮬레이션합니다. 이 구현을 통해 “정책” 모델을 통합하는 방법을 보여줍니다.

2025년 10월 30일 오전 1시 47분
IBM AI 팀이 출시한 Granite 4.0 Nano 시리즈: 엣지 AI용 소형 오픈소스 모델

IBM AI 팀이 Granite 4.0 Nano를 출시했다. 이 모델은 로컬 및 엣지 추론을 대상으로 하는 소형 모델로, 기업 제어 및 오픈 라이선스를 갖추고 있으며, 350M과 1B 정도의 두 가지 크기의 8개 모델로 구성되어 있다.

2025년 10월 30일 오전 12시 10분
Microsoft, 새 AI 프레임워크 ‘에이전트 라이트닝’ 출시

Microsoft AI 팀이 출시한 ‘에이전트 라이트닝’은 기존 AI 에이전트 스택을 변경하지 않고도 강화 학습을 통해 정책 LLM을 개선하는 데 도와주는 오픈소스 프레임워크이다. 훈련과 실행을 분리하여 강화 학습을 모든 AI 에이전트에 대해 가능케 한다.

2025년 10월 29일 오후 5시 39분
Liquid AI, LFM2-ColBERT-350M 출시: 다국어 및 교차언어 RAG에 늦은 상호작용 검색 기능 제공하는 새로운 소형 모델

Liquid AI사가 LFM2-ColBERT-350M을 출시했다. 이 모델은 다국어 및 교차언어 검색을 위한 소형 late interaction retriever로, 한 언어로 문서를 색인하고 다른 언어로 쿼리를 작성해도 높은 정확도로 검색 결과를 반환한다.

2025년 10월 29일 오전 2시 32분
탐사 에이전트인 Q-Learning, UCB 및 MCTS가 동적 그리드 환경에서 지능적 문제 해결 전략을 협력하여 학습하는 방법

Q-Learning, UCB 및 MCTS와 같은 탐사 전략이 지능적 의사 결정 형성에 어떻게 영향을 미치는지 탐구합니다. 세 가지 에이전트를 구축하고 훈련하여 그리드 세계를 탐색하고 장애물을 피하면서 효율적으로 목표지에 도달하도록 합니다.

2025년 10월 28일 오후 8시 01분
미니맥스, 미니맥스 M2 공개: 최대 코딩 및 에이전틱 워크플로에 최적화된 미니 오픈 모델 출시, 8% 클로드 소네 가격 및 약 2배 빠름

미니맥스팀이 코딩과 에이전트 워크플로에 최적화된 전문가 모델인 MiniMax-M2를 공개했다. 이 모델은 최대 모델 비용의 일부분으로 오랜 기간 동안 MCP, 쉘, 브라우저, 검색 및 코드 작업을 지원한다.

2025년 10월 28일 오후 6시 21분