2026년 6월 7일 일요일
오늘의 신문
2026년 6월 7일 일요일 오늘의 신문
파랄락스는 LLA의 쿼리별 솔버를 학습된 프로젝터로 대체하여 산술 강도를 두 배로 늘리고, 0.6B 및 1.7B에서 혼란도를 개선합니다.
2026년 6월 1일 오후 1시 36분
NVIDIA가 X-Token을 발표하며 GOLD의 두 가지 구조적 문제를 해결하고 GSM8k 정확도를 2.56에서 15.54로 향상시켰습니다.
2026년 5월 30일 오전 8시 19분
NUS, MIT, A*STAR의 연구진이 LLM 파라미터를 수정하지 않고 새로운 지식을 훈련할 수 있는 MEMO라는 모듈형 프레임워크를 제안했다.
2026년 5월 27일 오후 2시 24분
NVIDIA가 NVFP4 마이크로 스케일링 포맷을 기반으로 한 4비트 사전 훈련 방법론을 소개했습니다. 이 방법론은 12B 하이브리드 맘바-트랜스포머에서 10조 개의 토큰으로 검증되었습니다.
2026년 5월 18일 오후 5시 42분
NVIDIA가 SANA-WM을 소개했습니다. 이 오픈소스 모델은 60초 길이의 720p 비디오를 생성하며, 6자유도 카메라 제어를 지원합니다. 64개의 H100 GPU로 훈련되었고, 단일 RTX 5090에서 배포 가능합니다.
2026년 5월 16일 오후 4시 52분
메타 AI 팀이 NeuroAI 모델을 벤치마킹하기 위한 오픈소스 프레임워크 NeuralBench를 출시했습니다. 이 프레임워크는 36개의 EEG 작업과 94개의 데이터셋을 포함하며, 9,478명의 피험자와 13,603시간의 뇌 기록을 기반으로 합니다.
2026년 5월 7일 오후 5시 37분
마이크로소프트 리서치가 텍스트-비디오 모델에 3D 일관성을 주입하기 위해 강화 학습을 활용한 World-R1을 발표했다. 이 기술은 구조적 변경 없이도 기하학적 일관성을 확보할 수 있다.
2026년 5월 1일 오전 9시 40분
메타 리얼리티 랩스가 포즈 추정, 세분화 및 3D 기하학을 새로운 수준으로 끌어올리는 인간 중심 비전 모델 Sapiens2를 발표했다. 이 모델은 단일 백본으로 다양한 기능을 지원한다.
2026년 4월 27일 오전 4시 47분
문샷 AI와 칭화대 연구진이 대규모 언어 모델(LLM) 서비스 방식을 혁신적으로 변화시킬 PrfaaS 아키텍처를 제안했습니다. 이 아키텍처는 데이터 센터 간의 KVCache 구조를 통해 LLM의 추론 방식을 개선하는 데 중점을 두고 있습니다.
2026년 4월 19일 오후 8시 51분
구글이 LLM 기반의 자동 진단 도구인 'Auto-Diagnose'를 발표했다. 이 도구는 통합 테스트 로그를 자동으로 분석하여 오류를 찾아내는 기능을 제공한다.
2026년 4월 18일 오전 2시 00분
NVIDIA와 메릴랜드 대학교 연구팀이 오디오 언어 모델 'AF-Next'를 공개했습니다. 이 모델은 음성, 환경 소음, 음악 등을 이해하는 데 강력한 성능을 발휘합니다.
2026년 4월 14일 오전 4시 24분
메타 AI와 킹 압둘라 과학기술대학교(KAUST) 연구진이 신경망이 직접 컴퓨터 역할을 하는 신경 컴퓨터(NC)를 제안했다. 이 연구는 이론적 틀과 함께 두 가지 모델을 소개한다.
2026년 4월 12일 오후 5시 52분
메타 AI가 1억 미만의 파라미터를 가진 새로운 비전 인코더 EUPE를 출시했습니다. 이 모델은 이미지 이해, 밀집 예측 및 언어-비전 모델 작업에서 전문 모델과 경쟁할 수 있는 성능을 자랑합니다.
2026년 4월 7일 오전 12시 41분
MaxToki는 세포의 노화를 예측하고 그에 대한 대처 방법을 제시하는 인공지능입니다. 기존 생물학 모델의 한계를 극복하고 세포의 현재 상태를 분석하는 데 도움을 줍니다.
2026년 4월 5일 오후 4시 50분
기술 혁신 연구소(TII)가 자연어 프롬프트를 활용한 오픈 어휘 그라운딩 및 세분화를 위한 0.6B 매개변수 초기 융합 변환기 'Falcon Perception'을 발표했다. 이 기술은 언어와 비전 간의 상호작용을 개선할 것으로 기대된다.
2026년 4월 3일 오전 4시 49분
메타가 새로운 뇌 인코딩 모델 TRIBE v2를 발표했습니다. 이 모델은 비디오, 오디오, 텍스트 자극에 대한 fMRI 반응을 예측할 수 있는 기능을 갖추고 있습니다.
2026년 3월 27일 오전 12시 39분

최신뉴스 전체보기

레이블 없이 학습 가능한 LLMs: Tsinghua 대학과 상해 AI 연구소 연구진, 레이블이 없는 데이터를 사용하여 자가 진화 언어 모델을 가능하게 하는 테스트 시간 강화 학습(TTRL) 소개

대부분의 대형 언어 모델(LLMs)은 감독된 데이터 파이프라인에 근본적으로 의존하고 있지만, Tsinghua 대학과 상해 AI 연구소 연구진은 테스트 시간 강화 학습(TTRL)을 도입하여 레이블이 없는 데이터를 사용하여 자가 진화 언어 모델을 가능하게 했다. 이는 감독 없이 학습이 가능한 새로운 방법이다.

2025년 4월 23일 오전 1시 37분
Meta AI가 Perception Language Model (PLM)을 발표: 도전적인 시각 인식 작업 해결을 위한 오픈 및 재현 가능한 비전-언어 모델

Meta AI가 Perception Language Model (PLM)을 발표했다. 이 모델은 도전적인 시각 인식 작업을 해결하기 위한 오픈 및 재현 가능한 비전-언어 모델로, 과학적 투명성과 재현성을 높이는 데 기여한다.

2025년 4월 18일 오후 8시 23분