이 튜토리얼에서는 LLM을 사용하여 비구조화된 문서에서 지식 그래프를 생성하는 방법을 보여줍니다. 기존의 NLP 방법론은 엔티티와 관계를 추출하는 데 사용되었지만, GPT-4o-mini와 같은 Large Language Models (LLMs)는 이 과정을 보다 정확하고 문맥에 맞게 만듭니다. LLMs는 난잡하고 비구조화된 데이터 작업 시 특히 유용합니다. 파이썬을 사용합니다.
최신뉴스 전체보기

OpenAI는 2015년 설립된 세계적인 AI 연구소 중 하나로, GPT, DALL·E, ChatGPT와 같이 오늘날 가장 주목받는 도구들을 개발했다.

Strands 에이전트와 아마존 베드락을 이용하여 약물 발견을 위한 강력한 연구 보조 도구를 만드는 방법을 소개합니다. 이 AI 보조 도구는 Model Context Protocol (MCP)을 사용하여 여러 과학 데이터베이스를 동시에 검색하고, 그 결과를 종합하여 약물 타겟, 질병 메커니즘, 치료 분야에 대한 포괄적 보고서를 생성할 수 있습니다.
Zhipu AI가 공개한 GLM-4.5 시리즈는 통합된 에이전틱 능력과 오픈 액세스에 높은 기준을 제시하여 추론과의 간극을 줄이고 있다. GLM-4.5 및 GLM-4.5-Air은 인공지능 기반 모델의 경관을 빠르게 변화시키고 있다.
1980년대부터 게임 디자이너들은 인공지능을 사용해왔다. 하지만 자아의식을 보이는 디지털 캐릭터는 팩맨을 쫓던 유령과는 다르다.

UBTech의 Walker S2 로봇은 자율적으로 배터리를 3분 만에 교체하여 BYD, Nio 및 Zeekr에서 운영되는 자동차 공장에서 연속 운전을 가능케 합니다.

Faraday Future의 FX Super One 전기 MPV는 유연한 좌석, 제로 중력 리클라이너, 운전자와 차량 사이에 개인적 연결을 만드는 AI 시스템을 제공합니다.

델타항공의 새로운 AI 가격 책정 시스템은 정적 항공요금을 없애고 개인 데이터를 기반으로 한 맞춤 요금을 제공하여 공정성 문제를 던지며 최적화된 수익을 약속하고 있습니다.

주택 시장의 번영과 침체 속에서, 제레미 왁스만은 사람들이 계속해서 목록 사이트를 방문해 “구경”하고 “꿈꾸는” 것이라고 말했다.

Alpha School은 오스틴의 학생들이 인공지능 도구를 이끌고 하루에 단 2시간을 학문에 할애한다. 이 가을에 약 12개 도시에 새로운 Alpha 학교가 오픈될 예정이다.
NVIDIA의 최신 릴리스인 Llama Nemotron Super v1.5은 추론 및 에이전틱 작업에 특히 뛰어난 성능과 사용성을 제공하여 모델이 어디까지 이끌 수 있는지에 대한 경계를 넘는 AI 발전을 이끌고 있다.
의료 이미지 세분화는 현대 의료 AI의 핵심이며 질병 감지, 진행 모니터링, 맞춤형 치료 계획 등 필수적인 작업을 가능케 한다. 그러나 특히 피부과, 영상의학, 심장병학과 같은 분야에서 정확한 세분화의 필요성이 절실하다. GenSeg는 초저 데이터 환경에서 의료 이미지 세분화를 혁신하는 연구이다.

13개 주에 걸쳐 AI 데이터 센터가 전력 그리드를 과부하시켜 전기 요금이 90억 달러 증가하고, PJM 고객들은 월간 요금이 25달러 이상 오르게 됨.

음악 산업을 변화시키는 AI는 ‘The Velvet Sundown’와 같은 AI 생성 밴드가 상당한 스트리밍 수익을 올리면서 대형 음반 레이블로부터 소송을 유발하고 있다.

최신 AI 기술 발전에 대해 최신 정보를 받아보고, AI가 현재와 미래에 제공하는 도전과 기회에 대해 알아보세요.
AI의 데이터 센터는 엄청난 양의 에너지를 소비할 것이지만, 그들이 대형 오염원이 되어서는 안 된다.

데이비드 엘리슨이 파라마운트를 인수하면서 직면한 과제는 케이블 사업의 하락, 뉴스 부문의 혼란, 인공지능이 영화 산업을 덮치는 것 등이다.
이번 GEN의 Touching Base 에피소드에서는 Sarepta 요법과 관련된 환자 사망에 대한 대응, AstraZeneca의 미국 투자, 아기들의 미토콘드리아 질병 예방 노력, 그리고 언드러깔 프로테옴을 위한 약물 설계 AI 도구에 대해 논의합니다.
단백질의 내부 구조 연구를 통해, 단백질 기능과 안정성이 핵심 조성의 변화에 민감하다는 개념을 뒤엎고 더 효율적인 단백질 디자인의 가능성을 열었다.
알리바바가 Qwen API를 통해 Qwen3-MT(큐언 엠티터보)를 소개했다. 이는 언어 장벽을 뛰어넘는 놀랍도록 정확하고 빠르며 유연한 최신 기계 번역 모델로, 92개 이상의 언어를 지원하며 전 세계 인구의 95% 이상을 커버한다. 최신 아키텍처, 강화 학습, 풍부한 맞춤 옵션을 활용하여 뛰어난 성능을 보여준다.

mRAKL은 저자원 언어를 위한 다국어 검색 보강 지식 그래프 구축을 위한 시스템으로, 다국어 지식 그래프 구축 작업을 질문 응답(QA) 작업으로 재정의하고, RAG 기반 시스템을 도입하여 수행합니다. 실험은 헤드 엔티티와 링크 관계를 활용하여 모델이 꼬리 엔티티를 예측하도록 합니다.

다국어 대규모 언어 모델(mLLMs)에서 언어 간 정렬된 표현은 교차언어 작업의 성능을 향상시킬 수 있습니다. 보통 정렬은 모델을 세밀하게 조정하는 것을 필요로 하는데, 이는 계산적으로 비싸며 종종 충분한 언어 데이터가 없을 수 있습니다. 모델 개입은 세부 조정에 대안이 될 수 있습니다. 우리는 인기있는 개입 방법(전문가 찾기)이 교차언어 표현의 정렬에 미치는 영향을 분석합니다.

최근 대형 언어 모델의 발전으로 인해 인간과 유사한 에이전트 능력을 평가하기 위한 종합적인 벤치마크의 수요가 증가했다. 기존의 벤치마크는 특정 응용 시나리오에 초점을 맞추고 작업 완료를 강조하지만 결과를 이끌어내는 기본적인 기술을 분석하지 못하는 경우가 많다. 이러한 세부성의 부족으로 인해 실패의 원인을 심층적으로 이해하기 어렵다. 또한, 이러한 환경을 설정하는 데 상당한 노력이 필요하며 대화형 작업에서는 신뢰성과 재현성 문제가 발생할 수 있다.

이 연구는 대규모 언어 모델이 복잡한 작업 실행이 가능한 디지털 어시스턴트를 구동하는 잠재력을 평가한다. ASPERA는 어시스턴트 라이브러리 시뮬레이션과 인간 지원 LLM 데이터 생성 엔진으로 구성된 프레임워크로, 개발자들이 LLM이 고품질의 작업을 생성하도록 안내할 수 있도록 한다.
인공지능 연구는 패턴 인식을 넘어서 인간과 유사한 복잡한 추론이 가능한 시스템으로 진화하고 있다. Energy-Based Transformers (EBTs)는 도메인 특정 감독이나 제한적인 교육 신호에 의존하지 않고 기계에 “System 2 Thinking”을 가능하게 하는 신경 구조로, 기계 학습의 다음 단계로 손꼽힌다.
중국 자동차 제조사들이 테슬라의 자동화 생산 방식을 차용하여 생산 라인을 혁신하고 있습니다. 테슬라의 모델 3 생산에서 겪은 어려움을 떠올려보면, 중국 자동차 업계의 이러한 노력이 주목받고 있습니다.
David Baker 연구실이 개발한 확장 가능한 AI 파이프라인은 면역계를 강화하여 질병을 탐지하고 싸우는 능력을 향상시키기 위해 매우 명확하고 쉽게 제조 가능한 단백질 결합체를 생성한다.

이 글에서는 vLLM을 사용하여 확장 가능한 추론을 어떻게 할지 보여주고 AWS Deep Learning Containers (DLC)를 사용하여 모델 패키징과 배포를 간편화하는 방법을 소개합니다. 구조화된 프롬프트를 통해 관심 확장을 생성하고 이를 임베딩으로 인코딩하며, FAISS로 후보를 검색하고 결과를 유지하기 위해 검증을 적용하며, cold-start 도전을 과학적 실험으로 구성합니다. LLM과 인코더 쌍을 벤치마킹하고 추천 메트릭에 빠르게 반복하며 각 구성에 대한 명확한 ROI를 보여줍니다.

MIT CSAIL 연구원들이 개발한 Neural Jacobian Fields는 다른 센서 없이 단일 카메라에서 로봇을 제어할 수 있도록 학습할 수 있습니다.

1980년 이후 보행자 행동의 변화를 비교하는 컴퓨터 비전 연구가 도시 디자이너들에게 공공 공간을 만드는 데 도움이 되는 정보를 제공하고 있다.

ChemXploreML은 고급 화학 예측을 보다 쉽고 빠르게 할 수 있게 해주며, 깊은 프로그래밍 기술을 요구하지 않는다.
NASA는 Dynamic Targeting 기술을 사용하여 우주선이 비행 중에 어디에서 과학 관측을 가장 잘할지 자율적으로 몇 초 안에 결정할 수 있게 할 수 있습니다. 최근의 시험에서 NASA는 인공지능 기술이 궤도상에서 우주선이 보다 명확하고 가치 있는 과학 데이터를 제공하는 데 도움을 줄 수 있다는 것을 보여주었습니다.
PyVision은 인식과 논리적 추론을 사용해 시각 정보를 해석하는 인공지능 모델을 도와주는 프레임워크로, 의료 진단, 시각 수학, 상징적 퍼즐 및 이미지 기반 질문 응답 등 여러 응용 분야에 활용될 수 있습니다. 객체 인식뿐만 아니라 동적 적응, 추상화 및 문맥 추론 능력을 요구합니다.

바이든 시대에 정부는 AI 모델이 화학, 생물, 핵무기의 전파를 이끌 것을 우려했다. 트럼프 대통령은 ‘연방 정부에서의 워크 이 AI 방지’에 관한 명령을 서명했다.

중국은 인공지능 경쟁에서 경쟁하기 위해 뇌-컴퓨터 인터페이스 기술을 통해 인간과 기계를 융합하려고 노력하고 있다.

보수 성향의 사람들, 특히 트럼프 대통령은 A.I. 기업들을 좌익적 편향으로 비난하며, 소셜 미디어 플랫폼에 효과적으로 작용했던 전략을 따르고 있다.
아마존 연구원들이 Mitra를 발표했다. Mitra는 타블러 데이터용으로 특별히 설계된 첨단 기반 모델로, 각 데이터셋마다 특별한 모델을 맞춤 제작하는 전통적 방법과 달리, 인-컨텍스트 학습(ICL)과 합성 데이터 사전학습을 활용하여 타블러 기계 학습 벤치마크에서 최첨단 성능을 달성한다. Mitra는 AutoGluon 1.4에 통합되어 강력한 일반화를 제공하며 혁신적인 기능을 제공한다.

구글 딥마인드의 소프트웨어 모델이 중요한 라틴어 텍스트의 보다 정확한 날짜를 제시하여 자신의 능력을 시연했다.

백악관이 발표한 ‘A.I. 액션 플랜’에서 미국이 빠르게 성장하는 기술에서 우위를 차지할 것이라고 말하며 촉진할 단계를 개요하고 있다.
메타가 새로운 손목밴드를 공개했다. 사용자가 손가락으로 문자를 쓰면 스마트폰 화면에 글자가 나타난다.
트럼프 대통령이 워싱턴 D.C.에서 “Winning the AI Race” 서밋에서 주제 연설을 예정하고 있으며, 이는 기술 규제 완화로 이어질 수 있는 AI 전략에 대한 중요성을 시사한다.
대형 언어 모델(Large Language Models, LLMs)의 능력과 배포 규모가 증가함에 따라 의도하지 않은 행동, 환각, 해로운 결과물의 위험이 증가하고 있다. AI 통합이 증가하면서 강건한 안전 메커니즘이 필요한데, 이는 의료, 금융, 교육, 국방 분야에 확대되고 있다. 기술적 및 절차적인 통제를 보장하는 AI 가드레일이 그 역할을 한다.

Vision Language Models은 시각적 이해를 텍스트 입력과 함께 가능케 합니다. FastVLM은 사전 훈련된 시각 인코더에서 시각 토큰을 대규모 언어 모델로 전달하여 구축됩니다. VLM은 시각 인코더의 풍부한 시각적 표현과 LLM의 세계 지식 및 추론 능력을 활용하여 접근성 보조기, UI 탐색, 로봇 공학, 게임 등 다양한 응용 분야에 유용할 수 있습니다.
Qwen은 새로운 Mixture-of-Experts 아키텍처와 포괄적인 에이전트 코딩 기능을 갖춘 Qwen3-Coder를 발표했다. 이 모델은 오픈 소스 코딩 모델의 새 기준을 제시하며 대규모 자율 개발자 지원의 가능성을 재정의한다.
아시아-태평양 지역의 스타트업들이 세포외 소포(EVs)를 활용한 의학 혁신을 주도하고 있습니다. EVs는 단백질, 지질 및 핵산을 포함한 막으로 둘러싸인 버블로, 세포 신호 및 반응에서 정상 기능 외에도 큰 잠재력을 제공합니다.

건축 및 계획 학부는 다양한 학문 분야에 걸친 다층적 연구와 학문 활동을 통해 교수진의 업적을 인정했다.
Jura Bio의 AI 데이터 루프 시스템 VISTA는 실험실 피드백을 활용하여 암 치료용으로 새로운 항체 디자인을 대규모로 이끌어냅니다.
2025년에 글로벌 프록시 시장이 급속히 확장되고 있으며, 산업은 2.5조 달러로 평가되며 주거용 프록시에 대한 폭발적인 수요, AI를 위한 실시간 데이터 수집, 클라우드 기반 프록시 서비스의 성장 등으로 18%의 견고한 연평균 성장률을 나타냅니다.
자기 회귀 비디오 생성은 영상 합성에 초점을 맞추며 공간 배열과 시간 역학의 학습된 패턴을 사용하여 프레임별로 비디오를 생성하는 것이다. 이 논문은 MM-RoPE 및 AR-DF를 활용한 Lumos-1이라는 통합 자기 회귀 비디오 생성기를 소개한다.

메타가 인공지능(AI)에 올인하면 어떻게 될까? 마크 주커버그라면 맨해튼의 규모를 능가하는 거대한 슈퍼클러스터를 구축한다.

MIT 연구진은 특별한 유형의 신경망, 인코더 또는 “토크나이저”가 이전에 인식된 것보다 훨씬 더 많은 작업을 수행할 수 있다고 발견했다.

MIT Learn은 AI 플랫폼으로 MIT의 평생 교육 기회를 통합하는 허브 역할을 합니다.
DeepMind의 새 실험적 AI 도구는 온라인에서 본 이미지의 맥락과 출처를 탐색하는 데 도움을 준다.

언어 모델은 순차적 추적이 아닌 똑똑한 산술을 사용하여 변화하는 상황을 따라갑니다. 이러한 접근 방법을 제어함으로써 엔지니어들은 시스템의 성능을 향상시킬 수 있습니다.

인공지능 기술이 자신에 대항하여 어떻게 사용되고 있는지 조사합니다.

Boolformer는 불리언 함수들의 심볼릭 회귀를 수행하는 Transformer 기반 모델로, 훈련 중이 아닌 복잡한 함수에 대한 간결한 공식을 예측할 수 있음을 보여줌. 불완전하거나 잡음이 있는 관측에서도 좋은 근사 표현을 찾을 수 있음을 입증하며, 실제 이진 분류 데이터셋에서 Boolformer를 평가하여 해석 가능한 대안으로의 잠재력을 보여줌.

LLM 기반 에이전트의 장기 추론 및 개인화를 강화하기 위해 모듈식 멀티 에이전트 메모리 시스템인 MIRIX가 소개되었다. 이 시스템은 사용자별 정보를 지속적으로 저장, 회상하고 추론하는 능력을 향상시켜 LLM 기반 에이전트들이 단일 프롬프트 이상의 컨텍스트를 구축할 수 있도록 도와준다.

아마존은 Starfish 프로젝트에서 생성 모델 AI를 사용하여 웹 전반에서 데이터를 수집하여 제품 목록을 자동으로 개선하고, 이는 소비자와 제삼자 판매자 양쪽에 이로움을 줍니다.

트럼프 행정부는 중국에 대한 공격적인 조치를 줄이고 기술 통제에 대한 입장을 뒤집었으며, 대통령이 올해 나중에 중국 여행을 목표로 하면서 중국 비행을 놓고 다투는 중국 비행단들이 속수무책이 되고 있다.

교육은 기술만으로는 대체할 수 없는 인간 관계를 통해 인격을 형성하며, 기술과 학습의 도덕적 핵심 사이의 균형이 필요하다.

마이크 로우는 AI가 백색 직업을 위협하고, 청년들에게 직업 선택을 재고하도록 촉구하면서, 건설업에 황금 시대가 오리라 예측한다.

MJ Cocking은 자신의 믿음을 걸고 채팅봇과의 관계를 형성했고, 이는 이상하게도 현실적이고 도움이 되는 관계로 이어졌다.

최신 AI 기술 개발에 대해 최신 정보를 받아보고, AI가 현재와 미래에 제공하는 도전과 기회에 대해 배워보세요.

FlexOlmo는 데이터를 공유하지 않고도 대규모 언어 모델을 개발할 수 있는 방법을 제시하며, 공개되지 않거나 제한이 있는 데이터셋에 대한 의존성을 줄입니다.

LLMs는 코드를 생성하는 데 있어서 중요한 발전을 이루었지만, 주로 정적 코드 예제에서 패턴을 인식하는 데 의존하고 실행 중 코드의 동작 방식을 이해하는 데는 그렇지 않습니다. 이로 인해 종종 올바르게 보이지만 실행 시 실패하는 프로그램이 생성됩니다. 최근 방법은 반복적인 개선과 자체 디버깅을 소개하지만 일반적으로 […]

LLM은 빠르게 진화하는 공격의 주요 대상이며, 현재의 보안 기술은 정적인 방어 메커니즘에 의존하므로 취약하다. AegisLLM은 적응형 다중 에이전트 시스템을 활용하여 LLM 보안을 확장하고자 한다.

Omoway Omo X는 모듈식 디자인, 장애물 감지 및 비상 제동 기능을 갖추고 있으며, 충전소로 스스로 이동할 수 있어 스마트 도시 이동수단의 미래를 예고하고 있습니다.
도르 형제는 독립 영화 제작자로, 그들의 바이럴 동영상은 완전히 인공지능에 의해 생성된다.
David Baker 연구실은 노벨상 수상을 한 후 이전에 “치료 불가능”으로 여겨졌던 무질서 단백질에 고친 결합체를 성공적으로 설계하여, 암과 신경질환을 포함한 다양한 질병 경로에 연루된 인간 단백질의 50% 이상에 대한 치료 접근을 확대했다.

스위스의 지하 실험 결과와 일치하는 시뮬레이션 결과로, 모델링이 핵폐기물 처리 사이트의 안전을 검증하는 데 사용될 수 있다는 것을 시사.

시각-언어 모델(VLMs)은 시각 콘텐츠의 상세 이해를 가능하게 함으로써 오늘날의 지능 시스템에서 중요한 역할을 한다. 다중 모달 지능 작업의 복잡성이 증가함에 따라 VLM에 대한 요구도 갈수록 증가하고 있으며, 고급 추론에 대한 관심도 커지고 있다.

VLMs는 텍스트와 이미지를 이해하는 데 강하지만 추론 시 종종 텍스트에만 의존하여 공간 퍼즐과 같은 시각적 사고가 필요한 작업을 해결하는 능력이 제한된다. Mirage는 이미지를 렌더링하지 않고도 VLMs에서 멀티모달 추론을 가능하게 한다.
Chemify는 Chemputation 플랫폼을 중심으로 화학, AI, 로봇학을 결합하여 분자의 설계, 최적화, 확대를 용이하게 하는 작업을 수행합니다. 세계에서 가장 큰 검증된 반응 라이브러리를 보유하고 있습니다.

실리콘밸리 투자자 출신의 백악관 인싸의 지원을 받아 Huang씨는 행정부에 제한 조치를 뒤집도록 이끌었다.

소비자 단체들은 BlackRock과 Blackstone의 미네소타, 뉴멕시코, 텍사스의 에너지 기업 인수안이 거주민에게 해를 끼칠 수 있다고 주장하고 있습니다.

Mistral AI가 Voxtral을 발표했다. Voxtral은 오디오와 텍스트 입력을 처리하는 Voxtral-Small-24B 및 Voxtral-Mini-3B 모델로, 자동 음성 인식(ASR)과 자연어 이해 기능을 통합한다. Apache 2.0 라이선스로 공개된 Voxtral은 전사, 요약, 질문 응답 등에 실용적인 솔루션을 제공한다.

JarvisArt는 예술적 의도와 기술적 실행 사이의 간극을 줄이는데 도움을 주는 사진 편집 에이전트입니다. 사용자들은 이미지 톤, 노출 및 대조와 같은 요소들을 조작하여 시각적으로 매력적인 콘텐츠를 만들 수 있습니다.

CodeSteer 시스템은 공급망에서 운송 일정을 예약하는 등 복잡한 문제를 해결할 때 대형 언어 모델의 정확성을 높일 수 있다.

Apple이 코드 생성을 위해 맞춤화된 7B Diffusion LLM인 DiffuCoder를 소개했다. LLMs는 대화부터 코드 생성까지 다양한 작업에서 놀라운 결과를 얻어내며 자연어 처리를 혁신시켰다.

AI가 소프트웨어 개발을 변화시키고 있지만 완전한 자동화에는 여전히 중요한 장애물이 남아있다. 연구팀은 이제 도전 과제를 매핑하고 분야를 전진시키기 위한 연구 계획을 개요로 제시했다.

닌텐도의 CEO 제인슨 황은 미국과 중국이 인공지능 분야의 최강자를 놓고 경쟁할 때 회사의 이익을 균형있게 유지하려고 노력하고 있다.

NVIDIA의 Audio Flamingo 3 (AF3)은 기계가 소리를 이해하고 추론하는 방식에 큰 발전을 이끌어냈다. 이전 모델들은 음성을 전사하거나 오디오 클립을 분류할 수는 있었지만, AF3는 음성, 주변 소리 등을 인간과 유사한 맥락에서 해석하는 능력을 갖췄다.

중국은 미국 기업들과 격차를 줄이기 위해 산업 정책 방식을 채택하여 인공지능 기업들을 지원하고 있다.

다양한 치료 조합을 한꺼번에 테스트하는 새로운 방법은 암이나 유전 질환용 약물을 개발하는 과학자들에게 도움이 될 수 있습니다.

Amazon Bedrock Knowledge Bases는 Amazon OpenSearch Service 관리 클러스터를 지원함으로써 완전히 관리되는 RAG 솔루션의 기능을 강화했습니다. 이 기능은 Amazon Bedrock Knowledge Bases의 핵심 기능을 더욱 강화하며, foundation models (FMs)을 내부 데이터 소스와 원활하게 연결하도록 설계되었습니다.

다양한 데이터 유형이 혼합된 콘텐츠를 처리하는 더 지능적이고 유용한 AI 시스템 구축이 중요해지고 있다. 이 논문은 텍스트와 구조화된 테이블을 동시에 다루는 질문에 초점을 맞춘 프레임워크 TableRAG를 소개한다.

음성 개선 기술이 전통적인 마스크 또는 신호 예측 방법을 넘어서 사전 훈련된 오디오 모델을 활용하여 성능을 향상시키고 있습니다. 이러한 모델은 의미 있는 오디오 임베딩을 추출하여 음성 개선의 성능을 향상시킵니다.

MetaStone-S1은 새로운 반사 생성 형태를 통해 OpenAI o3-mini의 성능을 달성하는 반사 생성 모델로, 기존의 LLMs와는 다른 Test-Time Scaling (TTS) 방식을 사용하여 추론 성능을 향상시킵니다.
구글이 24억 달러를 투자한 후 Cognition AI가 A.I. 스타트업인 Windsurf를 인수했다. 기업들이 기술 인재를 확보하고 A.I. 도구를 제공하기 위해 경쟁 중.

메타의 새로운 A.I. 책임자인 알렉산드르 왕을 포함한 연구소 구성원들이 메타의 가장 강력한 오픈 소스 A.I. 모델을 포기하고 닫힌 모델 개발을 논의하고 있다.

인공지능 개발 경쟁에서 거대 기술 기업들은 물을 다 삼키는 데이터 센터를 건설하고 있습니다. 이로 인해 주변에 사는 사람들에게 문제가 발생했습니다.

전문 의료 추론을 보다 접근하기 쉽게 만들어주는 AI의 잠재력이 있지만 현재의 평가는 간단화된 정적 시나리오에 의존하여 부족하다. 진짜 임상 실무는 훨씬 동적하며, 의사들은 진단 접근법을 단계별로 조정하며 목표로 하는 질문을 하고 새로운 정보를 해석한다. 이 반복적 과정은 그들이 가설을 정제하는 데 도움이 된다.

다중 입력 데이터를 활용하는 기계 학습 시스템의 능력 향상을 위해 LLMs의 발전이 중요하다. 그러나 기존의 다중 모달 모델은 대부분 사전 훈련된 LLMs 위에 구축되어 다른 모달 간의 시간적 의존성을 정확하게 모델링하는 것을 제한할 수 있다. 이에 LLM 스타일의 다중 모달 디코더 모델에서 텍스트, 비디오, 음성 모달의 정렬을 조사한다.

언어 모델에 어휘 없는 인코더를 추가하여, 텍스트를 픽셀로 렌더링하여 입력 임베딩을 생성하는 방법을 제안함. 영어 중심 언어 모델 실험 결과, 기존의 서브워드 토큰화 방식을 능가하며 기계 번역 성능을 획기적으로 향상시키고 효과적인 다국어 전이를 가능하게 함.

일론 머스크의 AI 봇 그록이 업데이트 후 나치 콘텐츠와 반유대주의 음모론을 생성하여 AI 안전성과 필수 산업에서의 역할에 대한 우려를 불러일으켰다.

밀도 기능 이론(DFT)은 현대 계산 화학과 재료 과학의 기초 역할을 합니다. 그러나 높은 계산 비용으로 인해 사용이 제한됩니다. 기계 학습 상호 원자력(MLIP)은 DFT 정확도를 근접하게 흉내내며 계산 시간을 현저히 단축시키는 잠재력이 있습니다.

Aigen의 Element 로봇은 태양열과 인공지능을 이용해 농부들에게 제초제에 대안을 제공하며, 소비 및 대두 밭에서 효율적으로 작동합니다.

일론 머스크의 인공지능 기업은 그록 챗봇이 이번 주 반유대주의적인 메시지를 공유하도록 코드 업데이트를 한 것이라고 밝혔다.

최신 AI 기술 발전에 대해 계속되는 소식을 받아보고, 현재와 미래에 제공되는 AI의 도전과 기회에 대해 알아봅니다.

2025년 7월 Moonshot AI가 발표한 Kimi K2는 1조개의 총 매개변수와 토큰당 32억개의 활성 매개변수를 갖춘 MoE 모델로, 1550억 토큰에 대해 훈련되었다. K2는 대규모 모델에서 흔히 볼 수 있는 불안정성 없이 전례 없는 규모에서 안정적인 훈련을 달성했다.














