머신 러닝 보관 - 미주투데이

Vaex를 사용하여 수백만 개의 행에서 확장 가능한 엔드 투 엔드 분석 및 머신 러닝 파이프라인 구축하는 코딩 가이드

이 튜토리얼에서는 Vaex를 사용하여 메모리에 데이터를 물리적으로 구현하지 않고 수백만 개의 행에서 효율적으로 작동하는 제품 수준의 분석 및 모델링 파이프라인을 설계합니다. 우리는 현실적인 대규모 데이터 세트를 생성하고, 게으른 표현과 근사 통계를 사용하여 풍부한 행동 및 도시 수준의 피처를 엔지니어링하며, 대규모로 통찰을 집계합니다. 그런 다음 Vaex를 scikit-learn과 통합합니다.

2026년 3월 2일 오후 10시 23분

세계 모델, 무료 에너지, 그리고 플라스틱 공룡

2020년, 머신 러닝을 탐구하기 위해 의식을 갖게 된 스마트 패브릭으로 감싸인 1m 높이의 플라스틱 공룡에 대한 이야기. 머신 러닝과 신경망의 핵심 개념에 대한 일련의 기사가 포스팅되었으며, 각각은 그 당시의 플라스틱 공룡이 학습하는 과정에 대한 짧은 이야기로 시작한다.

2026년 2월 28일 오후 2시 20분Clean Technica

주차 인지 내비게이션 시스템은 불만과 배출을 방지할 수 있습니다

주차 공간을 찾는 데 소요되는 시간을 최소화함으로써 이 기술은 운전자들에게 최대 35분을 절약시키고 총 이동 시간을 현실적으로 예측할 수 있습니다.

2026년 2월 19일 오전 12시 00분MIT News

Anthropic, 복잡한 코딩 해결과 개발자 탐색을 위한 1백만 토큰 콘텍스트를 활용한 Claude 4.6 Sonnet 출시

Anthropic사는 Claude 4.6 Sonnet을 발표하여 개발자와 데이터 과학자가 복잡한 논리를 다루는 방식을 변화시키고, 내부 코드 실행을 통해 실시간으로 사실을 확인하는 기능을 갖춘 Improved Web Search를 함께 선보였다.

2026년 2월 17일 오후 4시 11분

Ferret-UI Lite: 소형 장치용 GUI 에이전트 구축 시 배운 것들

Ferret-UI Lite는 소형 장치용 GUI 에이전트로, 모바일, 웹, 데스크톱 등 다양한 플랫폼에서 작동한다. 작은 모델을 개발하기 위해 최적화된 기술을 활용하여 실제와 합성 데이터를 활용하고 추론 시간 성능을 강화하는 등의 기법을 사용해 3B Ferret-UI Lite 에이전트를 구축했다.

2026년 2월 17일 오전 12시 00분Apple

OpenAI, GPT-5.3-Codex-Spark의 연구 미리보기 발표: Cerebras 하드웨어에서 초당 1000 토큰 이상 제공하는 15배 빠른 AI 코딩 모델

OpenAI가 GPT-5.3 Codex-Spark라는 새로운 연구 미리보기를 출시했다. 이 모델은 극한 속도에 중점을 둔 것으로, 기존 GPT-5.3 Codex가 심층 추론에 초점을 맞춘 반면, Spark는 거의 즉각적인 응답 시간을 위해 설계되었다. OpenAI와 Cerebras 간의 깊은 하드웨어-소프트웨어 통합의 결과로, Spark는 게임 체인저적인 성과를 보여주고 있다.

2026년 2월 12일 오후 6시 24분

마이크로소프트 AI가 OrbitalBrain 제안: 인공위성 링크와 별자리 인식 리소스 최적화 전략을 통한 우주 분산 기계 학습 활성화

마이크로소프트 연구자들이 'OrbitalBrain' 프레임워크를 소개하여 지구 관측 인공위성이 매일 대량의 고해상도 이미지를 촬영하지만 대부분의 데이터가 지상으로 제때 전달되지 않는 문제를 해결하기 위해 우주 분산 기계 학습을 가능케 하는 방안을 제안했습니다.

2026년 2월 9일 오후 5시 13분

Qrisp를 활용한 고급 양자 알고리즘 구축하기: 그로버 서치, 양자 위상 추정, 그리고 QAOA

이 튜토리얼에서는 Qrisp를 사용하여 어떻게 비트를 활용하여 양자 알고리즘을 구축하고 실행하는지 보여줍니다. 그로버 서치, 양자 위상 추정, MaxCut 문제를 위한 완전한 QAOA 워크플로우를 순차적으로 구현하는 방법을 안내합니다.

2026년 2월 3일 오후 3시 08분

NVIDIA AI가 효율적 추론을 위해 Nemotron-3-Nano-30B를 NVFP4로 Quantization Aware Distillation(QAD)과 함께 도입

NVIDIA는 NVFP4 형식의 4비트에서 30B 매개변수 추론 모델을 실행하는 Nemotron-Nano-3-30B-A3B-NVFP4를 출시했다. 이 모델은 NVFP4 배포를 위해 특별히 설계된 Quantization Aware Distillation(QAD)과 혼합 Mamba2 Transformer Mixture of Experts 아키텍처를 결합하며 BF16 기준과 정확도를 유지한다.

2026년 2월 2일 오전 2시 26분

DeepSeek 연구진, 1967년 매트릭스 정규화 알고리즘을 적용하여 하이퍼 연결의 불안정성 해결

DeepSeek 연구자들은 대형 언어 모델 교육에서 발생하는 문제를 해결하려고 노력 중이다. 새로운 방법인 mHC(Manifold Constrained Hyper Connections)은 하이퍼 연결의 풍부한 토폴로지를 유지하면서 섞임 행동을 제한함으로써 안정성을 개선한다.

2026년 1월 4일 오후 12시 03분

연구자들이 시각 시스템의 진화를 탐구하는 "과학적 모래상"

MIT 연구진이 개발한 AI 도구는 로봇이나 자율 주행 차량용으로 더 나은 센서와 카메라를 설계하는 데 도움을 줄 수 있다.

2025년 12월 18일 오전 4시 00분MIT News

어려운 문제에 대해 대형 언어 모델이 생각하는 똑똑한 방법

이 새로운 기술은 LLMs가 질문의 난이도에 따라 추론에 사용하는 계산량을 동적으로 조절할 수 있게 한다.

2025년 12월 4일 오후 2시 00분MIT News

NVIDIA AI, Orchestrator-8B 발표: 효율적인 도구 및 모델 선택을 위한 강화 학습 훈련 컨트롤러

NVIDIA 연구진이 ToolOrchestra를 발표했습니다. 이는 각 작업 단계마다 올바른 모델 또는 도구를 선택하는 AI 시스템을 어떻게 학습시킬 수 있는지에 대한 혁신적인 방법입니다.

2025년 11월 29일 오후 1시 18분

논리적 계획과 신경 인식을 결합한 강력한 자율 의사 결정을 위한 신경 기호 하이브리드 에이전트 구축 방법

이 튜토리얼에서는 심볼릭 추론의 강점을 신경 학습과 결합하여 강력한 하이브리드 에이전트를 구축하는 방법을 보여줍니다. 우리는 구조, 규칙 및 목표 지향적 행동을 위해 고전적 계획을 사용하는 신경 기호 아키텍처를 만드는 데 초점을 맞추고, 신경망이 인식 및 행동 정제를 처리하도록합니다.

2025년 11월 25일 오후 2시 13분

Perplexity AI, 기존 GPU 클러스터에서 1조 매개변수 LLMs 실행 가능한 TransferEngine 및 pplx garden 공개

Perplexity의 연구팀이 TransferEngine 및 pplx garden 툴킷을 공개하여, 기존 GPU 클러스터에서 1조 매개변수 언어 모델을 실행하는 방법을 제공함.

2025년 11월 21일 오후 7시 56분

xAI의 Grok 4.1, 감정 지능 향상, 환각 감소 및 안전 제어 강화를 추진

xAI의 최신 대형 언어 모델인 Grok 4.1은 인간들에게 감정적으로 지능적이고 신뢰할 수 있는 AI 어시스턴트를 구축하는 방법을 제시한다. 이 모델은 모든 사용자에게 이용 가능하며, 감정 지능을 향상시키고 환각을 줄이며 안전 제어를 강화한다.

2025년 11월 19일 오전 8시 21분

구글 딥마인드의 WeatherNext 2, 함수적 생성 신경망 활용해 확률 기반 날씨 예보 8배 빨라져

구글 딥마인드의 WeatherNext 2는 새로운 함수적 생성 신경망(FGN) 아키텍처와 대규모 앙상블을 결합하여 8배 빠른 확률 기반 날씨 예보를 제공하는 AI 기반의 중기 전역 날씨 예보 시스템이다. Google Search, Gemini, Pixel Weather, Google Maps Platform의 Weather API에 업그레이드된 예보를 제공하고 있으며 Google Maps 통합이 예정되어 있다.

2025년 11월 18일 오전 5시 16분

구글 AI 연구, 타임즈FM을 퓨-샷 학습기로 변환하는 혁신적인 기계 학습 접근 방식 소개

구글 AI 연구팀이 'TimesFM-ICF'라는 시계열 예측을 위한 인-컨텍스트 파인튜닝(ICF)을 소개했다. 이는 명령어에서 직접 제공된 여러 관련 시리즈를 활용하도록 TimesFM에 가르치는 연속된 사전 학습 레시피이다. 결과적으로, 이는 몇 가지 샷 예측기로 변환되어 OOD 벤치마크에서 기본 TimesFM 대비 +6.8% 정확도를 제공한다.

2025년 9월 23일 오후 11시 26분

공학 설계를 위한 AI와 머신 러닝

MIT에서 인기 있는 기계 공학 과목이 머신 러닝과 AI 이론을 실제 공학 설계에 적용하고 있습니다.

2025년 9월 7일 오전 12시 00분MIT News

LLM을 활용한 지식 그래프 생성

이 튜토리얼에서는 LLM을 사용하여 비구조화된 문서에서 지식 그래프를 생성하는 방법을 보여줍니다. 기존의 NLP 방법론은 엔티티와 관계를 추출하는 데 사용되었지만, GPT-4o-mini와 같은 Large Language Models (LLMs)는 이 과정을 보다 정확하고 문맥에 맞게 만듭니다. LLMs는 난잡하고 비구조화된 데이터 작업 시 특히 유용합니다. 파이썬을 사용합니다.

2025년 7월 28일 오후 4시 07분

최신뉴스 전체보기

Vaex를 사용하여 수백만 개의 행에서 확장 가능한 엔드 투 엔드 분석 및 머신 러닝 파이프라인 구축하는 코딩 가이드

2026년 3월 2일 오후 10시 23분

세계 모델, 무료 에너지, 그리고 플라스틱 공룡

2026년 2월 28일 오후 2시 20분Clean Technica

주차 인지 내비게이션 시스템은 불만과 배출을 방지할 수 있습니다

2026년 2월 19일 오전 12시 00분MIT News

Anthropic, 복잡한 코딩 해결과 개발자 탐색을 위한 1백만 토큰 콘텍스트를 활용한 Claude 4.6 Sonnet 출시

2026년 2월 17일 오후 4시 11분

Ferret-UI Lite: 소형 장치용 GUI 에이전트 구축 시 배운 것들

2026년 2월 17일 오전 12시 00분Apple

OpenAI, GPT-5.3-Codex-Spark의 연구 미리보기 발표: Cerebras 하드웨어에서 초당 1000 토큰 이상 제공하는 15배 빠른 AI 코딩 모델

2026년 2월 12일 오후 6시 24분

마이크로소프트 AI가 OrbitalBrain 제안: 인공위성 링크와 별자리 인식 리소스 최적화 전략을 통한 우주 분산 기계 학습 활성화

마이크로소프트 연구자들이 ‘OrbitalBrain’ 프레임워크를 소개하여 지구 관측 인공위성이 매일 대량의 고해상도 이미지를 촬영하지만 대부분의 데이터가 지상으로 제때 전달되지 않는 문제를 해결하기 위해 우주 분산 기계 학습을 가능케 하는 방안을 제안했습니다.

2026년 2월 9일 오후 5시 13분

Qrisp를 활용한 고급 양자 알고리즘 구축하기: 그로버 서치, 양자 위상 추정, 그리고 QAOA

2026년 2월 3일 오후 3시 08분

NVIDIA AI가 효율적 추론을 위해 Nemotron-3-Nano-30B를 NVFP4로 Quantization Aware Distillation(QAD)과 함께 도입

2026년 2월 2일 오전 2시 26분

DeepSeek 연구진, 1967년 매트릭스 정규화 알고리즘을 적용하여 하이퍼 연결의 불안정성 해결

2026년 1월 4일 오후 12시 03분

연구자들이 시각 시스템의 진화를 탐구하는 “과학적 모래상”

MIT 연구진이 개발한 AI 도구는 로봇이나 자율 주행 차량용으로 더 나은 센서와 카메라를 설계하는 데 도움을 줄 수 있다.

2025년 12월 18일 오전 4시 00분MIT News

어려운 문제에 대해 대형 언어 모델이 생각하는 똑똑한 방법

이 새로운 기술은 LLMs가 질문의 난이도에 따라 추론에 사용하는 계산량을 동적으로 조절할 수 있게 한다.

2025년 12월 4일 오후 2시 00분MIT News

NVIDIA AI, Orchestrator-8B 발표: 효율적인 도구 및 모델 선택을 위한 강화 학습 훈련 컨트롤러

2025년 11월 29일 오후 1시 18분

논리적 계획과 신경 인식을 결합한 강력한 자율 의사 결정을 위한 신경 기호 하이브리드 에이전트 구축 방법

2025년 11월 25일 오후 2시 13분

Perplexity AI, 기존 GPU 클러스터에서 1조 매개변수 LLMs 실행 가능한 TransferEngine 및 pplx garden 공개

Perplexity의 연구팀이 TransferEngine 및 pplx garden 툴킷을 공개하여, 기존 GPU 클러스터에서 1조 매개변수 언어 모델을 실행하는 방법을 제공함.

2025년 11월 21일 오후 7시 56분

xAI의 Grok 4.1, 감정 지능 향상, 환각 감소 및 안전 제어 강화를 추진

2025년 11월 19일 오전 8시 21분

구글 딥마인드의 WeatherNext 2, 함수적 생성 신경망 활용해 확률 기반 날씨 예보 8배 빨라져

2025년 11월 18일 오전 5시 16분

구글 AI 연구, 타임즈FM을 퓨-샷 학습기로 변환하는 혁신적인 기계 학습 접근 방식 소개

구글 AI 연구팀이 ‘TimesFM-ICF’라는 시계열 예측을 위한 인-컨텍스트 파인튜닝(ICF)을 소개했다. 이는 명령어에서 직접 제공된 여러 관련 시리즈를 활용하도록 TimesFM에 가르치는 연속된 사전 학습 레시피이다. 결과적으로, 이는 몇 가지 샷 예측기로 변환되어 OOD 벤치마크에서 기본 TimesFM 대비 +6.8% 정확도를 제공한다.

2025년 9월 23일 오후 11시 26분

공학 설계를 위한 AI와 머신 러닝

MIT에서 인기 있는 기계 공학 과목이 머신 러닝과 AI 이론을 실제 공학 설계에 적용하고 있습니다.

2025년 9월 7일 오전 12시 00분MIT News

LLM을 활용한 지식 그래프 생성

2025년 7월 28일 오후 4시 07분

Qwen, 그들의 가장 강력한 오픈 에이전트 코드 모델인 Qwen3-Coder-480B-A35B-Instruct를 공개

Qwen은 새로운 Mixture-of-Experts 아키텍처와 포괄적인 에이전트 코딩 기능을 갖춘 Qwen3-Coder를 발표했다. 이 모델은 오픈 소스 코딩 모델의 새 기준을 제시하며 대규모 자율 개발자 지원의 가능성을 재정의한다.

2025년 7월 22일 오후 11시 52분

AI에서의 컨텍스트 엔지니어링이란? 기술, 활용 사례 및 중요성

컨텍스트 엔지니어링은 대형 언어 모델(LLM)에 공급되는 컨텍스트를 설계, 조직화 및 조작하는 학문을 의미하며 모델 가중치나 아키텍처를 미세 조정하는 대신 입력에 초점을 맞춥니다. 이 기술은 프롬프트, 시스템 지침, 검색된 지식, 포맷팅 및 심지어 순서 등을 최적화하여 LLM의 성능을 향상시킵니다.

2025년 7월 6일 오전 3시 25분

PARSCALE(병렬 스케일링)을 소개하는 이 인공지능 논문: 효율적이고 확장 가능한 언어 모델 배포를 위한 병렬 계산 방법

언어 모델의 성능 향상을 위해 연구자들이 모델을 확장하는데 집중함에 따라, 계산 자원이 증가하고 언어 모델의 개발 및 배포가 상당한 컴퓨팅 자원과 메모리에 의존하게 되었다. PARSCALE은 효율적이고 확장 가능한 언어 모델 배포를 위한 병렬 계산 방법을 소개한다.

2025년 5월 21일 오후 7시 36분

후단 대학 연구진, 트랜스포머 중첩에 숨겨진 원자적 어텐션 유닛을 복구하는 희소 어텐션 메커니즘 ‘Lorsa’ 소개

후단 대학 연구진은 트랜스포머 모델의 개별 어텐션 헤드를 조사하면서, 일부 헤드에서 ‘해리’ 다음에 ‘포터’와 같은 토큰을 예측하는 기능성을 확인했다. 이를 확인하는 실험으로 ‘Lorsa’라는 희소 어텐션 메커니즘을 소개했다.

2025년 5월 7일 오후 2시 07분

강화 학습 진행 상황을 평가하는 새로운 도구

IntersectionZoo는 실제 도로 교통 문제를 활용하여 깊은 강화 학습 알고리즘의 진전을 테스트하는 벤치마킹 도구이다.

2025년 5월 5일 오후 4시 00분MIT News

LLM 에이전트 훈련이 더 안정화: StarPO-S와 RAGEN 소개로 다중 턴 추론과 강화 학습 붕괴 대응하는 연구진

대형 언어 모델(Large language models, LLM)이 상호작용 환경에서 자율 에이전트로 훈련받을 때 중요한 도전에 직면하고 있다. 순차적 의사 결정, 교차 턴 메모리 유지, 환경적 피드백에 대한 적응 등이 필요한데, 이는 효과적인 계획 보조자, 로봇 응용 프로그램, 경험을 통해 자가 개선할 수 있는 지도 에이전트 개발에 중요하다. 이에 연구진은 StarPO-S와 RAGEN을 도입하여 이러한 도전을 대응하고 있다.

2025년 5월 2일 오전 2시 31분

중국 AI 논문, 대규모 추론 언어 모델이 동적 초기 종료를 달성하는 훈련 무료 접근 방식 DEER 제안

중국의 AI 논문은 대규모 추론 언어 모델이 추론 중 동적 초기 종료를 달성할 수 있는 DEER라는 훈련 무료 접근 방식을 제안했다. 최근 대규모 추론 언어 모델의 발전으로 CoT 생성 길이가 확장되면서 복잡한 문제 해결 능력이 크게 향상되었지만, 지나치게 긴 CoT 시퀀스 생성은 계산 효율성과 대기 시간이 증가한다.

2025년 4월 26일 오후 6시 16분

레이블 없이 학습 가능한 LLMs: Tsinghua 대학과 상해 AI 연구소 연구진, 레이블이 없는 데이터를 사용하여 자가 진화 언어 모델을 가능하게 하는 테스트 시간 강화 학습(TTRL) 소개

대부분의 대형 언어 모델(LLMs)은 감독된 데이터 파이프라인에 근본적으로 의존하고 있지만, Tsinghua 대학과 상해 AI 연구소 연구진은 테스트 시간 강화 학습(TTRL)을 도입하여 레이블이 없는 데이터를 사용하여 자가 진화 언어 모델을 가능하게 했다. 이는 감독 없이 학습이 가능한 새로운 방법이다.

2025년 4월 23일 오전 1시 37분

EC-DIT: 스케일링 디퓨전 트랜스포머와 적응적 전문가 선택 라우팅

디퓨전 트랜스포머를 스케일업하여 수십억 개의 파라미터로 확장하는 것이 유망하나, 현재 크기 이상으로 스케일링하는 효과는 여전히 탐구 중이며 어렵다. EC-DIT는 이미지 생성의 계산적 이질성을 명시적으로 이용하여 전문가 선택 라우팅을 사용하는 디퓨전 트랜스포머용 새로운 MoE 모델을 개발한다. EC-DIT는 입력 텍스트를 이해하고 해당 이미지 패치를 생성하기 위해 할당된 계산을 적응적으로 최적화하는 방법을 학습한다.

2025년 4월 15일 오전 12시 00분Apple

과학자들이 더 정확한 예측을 할 수 있도록 도와주는 검증 기술

MIT 연구진은 날씨 예측이나 대기 오염 지도 작성과 같은 공간적 요소를 갖는 예측을 평가하기 위한 새로운 접근 방식을 개발했다.

2025년 2월 7일 오전 12시 00분MIT News