AI 논문 요약 보관 - 2 중 2 번째 페이지

파랄락스: 소프트맥스를 유지하고 학습된 공분산 보정 분기를 추가한 매개변수화된 로컬 선형 주의 메커니즘

파랄락스는 LLA의 쿼리별 솔버를 학습된 프로젝터로 대체하여 산술 강도를 두 배로 늘리고, 0.6B 및 1.7B에서 혼란도를 개선합니다.

2026년 6월 1일 오후 1시 36분

NVIDIA, X-Token 발표: Llama-3.2-1B에서 GOLD보다 평균 3.82점 향상

NVIDIA가 X-Token을 발표하며 GOLD의 두 가지 구조적 문제를 해결하고 GSM8k 정확도를 2.56에서 15.54로 향상시켰습니다.

2026년 5월 30일 오전 8시 19분

MEMO: 새로운 지식을 위한 전용 메모리 모델 훈련 모듈형 프레임워크

NUS, MIT, A*STAR의 연구진이 LLM 파라미터를 수정하지 않고 새로운 지식을 훈련할 수 있는 MEMO라는 모듈형 프레임워크를 제안했다.

2026년 5월 27일 오후 2시 24분

NVIDIA, NVFP4를 활용한 4비트 사전 훈련 방법론 발표

NVIDIA가 NVFP4 마이크로 스케일링 포맷을 기반으로 한 4비트 사전 훈련 방법론을 소개했습니다. 이 방법론은 12B 하이브리드 맘바-트랜스포머에서 10조 개의 토큰으로 검증되었습니다.

2026년 5월 18일 오후 5시 42분

NVIDIA, 단일 GPU에서 720p 비디오 생성하는 SANA-WM 공개

NVIDIA가 SANA-WM을 소개했습니다. 이 오픈소스 모델은 60초 길이의 720p 비디오를 생성하며, 6자유도 카메라 제어를 지원합니다. 64개의 H100 GPU로 훈련되었고, 단일 RTX 5090에서 배포 가능합니다.

2026년 5월 16일 오후 4시 52분

메타 AI, NeuroAI 모델 벤치마킹을 위한 오픈소스 프레임워크 NeuralBench 출시

메타 AI 팀이 NeuroAI 모델을 벤치마킹하기 위한 오픈소스 프레임워크 NeuralBench를 출시했습니다. 이 프레임워크는 36개의 EEG 작업과 94개의 데이터셋을 포함하며, 9,478명의 피험자와 13,603시간의 뇌 기록을 기반으로 합니다.

2026년 5월 7일 오후 5시 37분

마이크로소프트 리서치, 3D 일관성을 위한 새로운 접근법 발표

마이크로소프트 리서치가 텍스트-비디오 모델에 3D 일관성을 주입하기 위해 강화 학습을 활용한 World-R1을 발표했다. 이 기술은 구조적 변경 없이도 기하학적 일관성을 확보할 수 있다.

2026년 5월 1일 오전 9시 40분

메타 AI, 고해상도 인간 중심 비전 모델 Sapiens2 발표

메타 리얼리티 랩스가 포즈 추정, 세분화 및 3D 기하학을 새로운 수준으로 끌어올리는 인간 중심 비전 모델 Sapiens2를 발표했다. 이 모델은 단일 백본으로 다양한 기능을 지원한다.

2026년 4월 27일 오전 4시 47분

문샷 AI와 칭화대 연구진, LLM 서비스 방식을 재구성하는 PrfaaS 제안

문샷 AI와 칭화대 연구진이 대규모 언어 모델(LLM) 서비스 방식을 혁신적으로 변화시킬 PrfaaS 아키텍처를 제안했습니다. 이 아키텍처는 데이터 센터 간의 KVCache 구조를 통해 LLM의 추론 방식을 개선하는 데 중점을 두고 있습니다.

2026년 4월 19일 오후 8시 51분

구글 AI, 통합 테스트 실패 진단을 위한 자동 진단 도구 출시

구글이 LLM 기반의 자동 진단 도구인 'Auto-Diagnose'를 발표했다. 이 도구는 통합 테스트 로그를 자동으로 분석하여 오류를 찾아내는 기능을 제공한다.

2026년 4월 18일 오전 2시 00분

NVIDIA와 메릴랜드 대학교, 오디오 언어 모델 'AF-Next' 발표

NVIDIA와 메릴랜드 대학교 연구팀이 오디오 언어 모델 'AF-Next'를 공개했습니다. 이 모델은 음성, 환경 소음, 음악 등을 이해하는 데 강력한 성능을 발휘합니다.

2026년 4월 14일 오전 4시 24분

메타 AI와 KAUST 연구진, 계산과 메모리 통합한 신경 컴퓨터 제안

메타 AI와 킹 압둘라 과학기술대학교(KAUST) 연구진이 신경망이 직접 컴퓨터 역할을 하는 신경 컴퓨터(NC)를 제안했다. 이 연구는 이론적 틀과 함께 두 가지 모델을 소개한다.

2026년 4월 12일 오후 5시 52분

메타 AI, 1억 미만 파라미터의 컴팩트 비전 인코더 EUPE 출시

메타 AI가 1억 미만의 파라미터를 가진 새로운 비전 인코더 EUPE를 출시했습니다. 이 모델은 이미지 이해, 밀집 예측 및 언어-비전 모델 작업에서 전문 모델과 경쟁할 수 있는 성능을 자랑합니다.

2026년 4월 7일 오전 12시 41분

세포 노화를 예측하는 AI, MaxToki를 소개합니다

MaxToki는 세포의 노화를 예측하고 그에 대한 대처 방법을 제시하는 인공지능입니다. 기존 생물학 모델의 한계를 극복하고 세포의 현재 상태를 분석하는 데 도움을 줍니다.

2026년 4월 5일 오후 4시 50분

TII, 자연어 프롬프트 기반의 오픈 어휘 그라운딩 및 세분화를 위한 0.6B 매개변수 초기 융합 변환기 'Falcon Perception' 발표

기술 혁신 연구소(TII)가 자연어 프롬프트를 활용한 오픈 어휘 그라운딩 및 세분화를 위한 0.6B 매개변수 초기 융합 변환기 'Falcon Perception'을 발표했다. 이 기술은 언어와 비전 간의 상호작용을 개선할 것으로 기대된다.

2026년 4월 3일 오전 4시 49분

메타, 비디오·오디오·텍스트 자극에 대한 fMRI 반응 예측 모델 TRIBE v2 발표

메타가 새로운 뇌 인코딩 모델 TRIBE v2를 발표했습니다. 이 모델은 비디오, 오디오, 텍스트 자극에 대한 fMRI 반응을 예측할 수 있는 기능을 갖추고 있습니다.

2026년 3월 27일 오전 12시 39분

TinyLoRA: 13개 파라미터로 91.8% GSM8K 달성한 AI 연구

메타의 FAIR 연구팀과 코넬 대학교, 카네기 멜론 대학교의 연구자들이 극소수의 파라미터로도 대형 언어 모델이 추론을 학습할 수 있음을 입증했습니다. 이들은 TinyLoRA라는 새로운 방법을 소개했습니다.

2026년 3월 24일 오후 2시 49분

Mamba-3: 2배 작은 상태와 향상된 MIMO 디코딩 효율성을 갖춘 새로운 상태 공간 모델

카네기 멜론 대학교와 프린스턴 대학교의 연구팀이 새로운 상태 공간 모델 Mamba-3를 발표했습니다. 이 모델은 2배 작은 상태를 사용하며, MIMO 디코딩 하드웨어 효율성을 개선했습니다.

2026년 3월 19일 오전 2시 01분

구글 AI, ‘Groundsource’ 공개…Gemini 모델로 비정형 뉴스 데이터를 역사적 정보로 변환

구글 AI 연구팀이 Gemini 모델을 활용해 비정형 글로벌 뉴스에서 구조화된 역사 데이터를 추출하는 새로운 방법론 ‘Groundsource’를 발표했다. 이 프로젝트는 급작스러운 자연재해에 대한 역사 데이터 부족 문제를 해결하는 데 목적이 있다.

2026년 3월 13일 오전 4시 07분

최신뉴스 전체보기