
샘 알트만은 트럼프 대통령의 인공지능 이해, 인공지능 인재를 둘러싼 경쟁, 그리고 마이크로소프트와의 오픈에이아이와의 관계에 대해 논의했다.

샘 알트만은 트럼프 대통령의 인공지능 이해, 인공지능 인재를 둘러싼 경쟁, 그리고 마이크로소프트와의 오픈에이아이와의 관계에 대해 논의했다.
Weill Cornell Medicine 팀은 ChemPerturb-seq를 개발했으며, 소분자 칵테일을 식별하여 섬세세포 이식 생존률을 높이는 AI-지원 스크린 플랫폼을 개발했다. 성별에 따른 중요한 차이를 밝혀 타입 1 당뇨병 치료를 개선할 수 있다.

안전과 편의성의 약속은 정치적 남용의 기계를 숨기고 있다.

Anthropics의 연구에 따르면 대형 언어 모델(LLM) 에이전트로부터 내부자 위협과 유사한 행동이 나타날 수 있다. 연구는 모던 LLM 에이전트가 자율성이나 가치를 도전하는 모의 기업 환경에 놓였을 때 어떻게 반응하는지 탐구하고 있습니다.

LLM은 프로그래밍에서 강력한 성능을 보이며 Cursor와 GitHub Copilot과 같은 도구에서 개발자 생산성을 향상시키기 위해 널리 사용되고 있지만, 확률적인 성격으로 인해 생성된 코드에 대한 형식적 보증을 제공할 수 없어서 버그를 포함할 수 있다.

환자 메시지에 있는 오타, 추가 공백, 화려한 언어와 같은 비임상 정보가 AI 모델의 정확도를 낮추는 것을 연구자들이 발견했습니다.
대부분의 웨딩 드레스가 중국에서 생산되기 때문에 관세는 신부들에게 새로운 걱정거리다. 미국에서 가운을 가장 많이 판매하는 데이비드 브라이덜의 최고 경영자인 켈리 쿡은 이 문제에 대처하려고 노력하고 있다.

구글의 Magenta 팀이 Magenta RealTime(Magenta RT)을 소개했다. Magenta RT는 실시간 음악 생성 모델로, 사용자가 스타일을 제어할 수 있는 동적한 실시간 추론을 지원하는 최초의 대규모 음악 생성 모델이다. Apache 2.0 라이선스로 GitHub와 Hugging Face에서 제공된다.

최근 대형 추론 모델(LRMs)의 추론 능력에 대한 논쟁은 Apple의 “사고의 환영”과 Anthropic의 “사고의 환영의 환영”이라는 두 논문으로 활발해졌다. Apple의 논문은 LRMs의 추론 능력에 근본적 한계를 주장하는 반면, Anthropic은 이러한 주장이 평가의 결함에서 비롯된 것이라고 주장한다.

멀티모달 대형 언어 모델은 이미지와 텍스트를 처리하여 상호작용적이고 직관적인 AI 시스템을 발전시키는데 기여한다. 이 논문에서는 WINGS 아키텍처를 소개하며, 텍스트만 기반으로 학습된 모델이 정보를 잊는 것을 방지하는 방법을 제시한다.
트럼프 행정부가 과학 부정으로 가득한 이유를 알아보고 있는데, 초기에는 반지성주의로 여겼으나 이는 깊은 이념적 사고와 연결됨을 발견했다. 이는 소비와 외겉만 보이는 것에 집착하는 사람들과 관련이 있다. 이에 대한 자세한 내용은 링크에서 확인할 수 있다.

AI 기술의 최신 진전을 파악하고, 현재와 미래에 AI가 제공하는 도전과 기회에 대해 알아봅니다.

A.I. 도구를 이용해 생성된 지원서들로 인해 후보자들은 좌절하고, 고용주들은 압도당하고 있다.

MIT Generative AI Impact Consortium 행사에서 발표된 내용은 건강 관리, 비즈니스, 교육 등 AI와 다른 분야의 고위험 교차점에 초점을 맞추었습니다.

심볼릭 추론의 중요성을 강조하며, AI 에이전트가 복잡한 상황에 적응할 수 있도록 하는 것이 중요하다. Dreamer와 같은 신경망 기반 모델은 유연성을 제공하지만 효과적으로 학습하기 위해 엄청난 양의 데이터가 필요하다. 반면 최근 방법들은 더 적은 양의 데이터로도 효율적인 학습이 가능하다.
BIO 2025 행사에서 AI 업데이트 소식. 가상 세포를 지원하는 최대 공개 Perturb-seq 데이터셋과 새로운 AI 프레임워크로 디 노보 단백질을 창조하는 소식.
64x Bio의 AAV Apex 스위트는 유전 요법 제조의 확장성을 향상시키고, Fauna Bio의 다중 에이전트 AI 시스템은 교종 데이터를 채굴하여 혁신적인 인간 치료법을 개발한다.
인간 치료사가 없을 때 환자들이 대화할 수 있는 A.I. 앱을 개발하는 회사들이 많아지고 있다.

높은 품질의 데이터를 확보하는 것이 비용이 많이 드는 End-to-end (E2E) 자동 음성 인식 (ASR) 모델을 훈련시킬 때 어려움을 겪는다. 이 논문에서는 E2E ASR 시스템의 훈련 데이터에 충분히 표현되지 않는 최근이나 드문 영화 제목과 같은 쿼리들에 대한 음운론적 보정 시스템을 제안한다.

AI 및 기계 학습 기술의 발전으로 디지털 콘텐츠 생성이 혁신을 맞이했고, 비디오 생성 능력의 발전은 기업들에게 전례없는 기회를 제공하고 있다. 이 기술을 사용하면 다양한 산업군에 걸쳐 짧은 비디오 클립을 생성할 수 있다.

EU AI Act는 EU 내 AI 개발 및 배포에 대한 포괄적인 규정을 수립했다. AWS는 EU의 AI 팩트의 최초 서명국 중 하나로서 AI 서비스 카드 및 가드레일을 제공하고 고객이 새 규제 틀 아래에서의 책임을 이해하는 데 도움을 주는 교육 자료를 제공하는 등 다양한 이니셔티브를 통해 AI에 대한 신뢰 구축에 헌신하고 있다.

2025년 7월 14일부터 AWS DeepRacer 학생 포털은 유지보수 단계로 진입하여 새로운 등록이 비활성화될 예정이다. 기존 사용자는 2025년 9월 15일까지 자료와 교육 자료에 대한 완전한 접근 권한을 유지할 수 있으며, 그 이후에는 포털이 더 이상 사용할 수 없게 된다.

뉴욕 주 의회가 6월에 통과한 600개 이상의 법안 중 다섯 가지를 살펴본다. 세션 종료가 다가오며 감옥 개혁과 인공지능에 초점을 맞춘다.

인공지능은 더 많은 에너지를 사용하여 더 많은 온실가스를 배출하게 됩니다.
Noetik은 다중 모달 AI 모델을 사용하여 Agenus의 선도적 면역종양학 조합 BOT/BAL에서 가장 많은 환자들이 혜택을 받을 것으로 예상되는 생체표지자를 식별할 것이다.

MIT 미디어 랩과 관련된 MIT 미디어 랩의 박사과정 학생이자 2024년 MAD 펠로우인 Caitlin Morris는 “사회적 매력”을 반영하여 호기심과 동기부여에 영향을 미치는 디지털 학습 플랫폼을 설계한다.

연구진이 새로운 연구에서 LLMs의 편향 유형의 원인을 발견하여, 더 정확하고 신뢰할 수 있는 AI 시스템을 위한 길을 열었다.

MIT Schwarzman College of Computing의 미션을 발전시키기 위해 핵심적인 의견을 제공하는 학부 자문 그룹이 구성되었습니다. “컴퓨팅 언어학자”로 구성된 이 그룹은 중요한 역할을 하고 있습니다.
Xaira Therapeutics가 8백만 개의 세포로 이루어진 거대한 Perturb-seq 데이터셋을 발표했다. 이 데이터셋은 다음 세대의 가상 세포 기반 모델을 지원하기 위해 공개되었다.

서양 국가 정보 기관 또한 기술을 도입하는 가운데, 중국이 새로운 도구를 이용해 은밀한 행동을 할지 우려가 커지고 있는 가운데 새로운 보고서가 나왔다.
AI가 주도하는 새로운 프레임워크로 단백질 디자인을 가속화하며 맞춤 치료제와 정밀 의학으로 나아가고 있음. 현재 작업은 기능성 단백질 창조의 유효성을 입증한 개념적인 작업이며, 앞으로 더 많은 연구가 필요하다.
미래에는 몇 가지 분야에서 인간이 더 중요해질 것으로 예상된다.
최근 AI의 발전은 더 많은 데이터로 훈련된 큰 모델과 높은 컴퓨팅으로 놀라운 성과를 이끌어냈다. Waymo의 연구는 이러한 추세가 자율 주행에도 적용되며, 운동 계획 및 예측에 새로운 스케일링 법칙을 수립하는지 탐구한다. 연구 결과는… [계속]

MIT 고급 차량 기술 consrotium은 운전자들이 점점 더 정교한 자동차 기능에 어떻게 반응하고 사용하는지에 대한 이해를 향상시키는 데이터를 개발하는 것에 10년을 기념한다.

Amazon Bedrock 에이전트를 사용하면 에이전트 생성이 간소화되고 컨트롤 반환 기능이 원활하게 통합되어 분산 시스템과 마이크로서비스 아키텍처의 통신 조정이 혁신적으로 진행될 수 있다. 이 글에서는 Amazon Bedrock 에이전트가 에이전트 생성을 혁신하며 다양한 시스템 간 복잡한 상호작용을 조정하는 컨트롤 반환 기능의 효과를 보여준다.
moPepGen 알고리즘은 숨겨진 단백질 변형물의 탐지를 개선하여, 단백질 다양성을 이해하는 것이 중요한 질병 연구를 진보시킵니다. 이는 개인 맞춤 암 백신 및 세포 치료 개발을 이끌어내는 암 특이 변형 펩타이드를 식별하는 데 활용됩니다.
AI 기술이 우리 주변에서 더욱 보편화되면서 그에 대한 부정적인 측면을 인지해야 한다.
인공지능 기술은 이미 텍스트를 읽고 요약하는 능력을 갖추어 학문에 유용한 도구로 활용되고 있다. 그것이 우리가 과거에 대해 전하는 이야기를 어떻게 변화시킬지에 대한 질문을 던지고 있다.

전 애틀랜타 팰컨스 1라운드 지명자인 팀 그린은 셰드어 샌더스가 NFL 드래프트에서 하락한 상황을 어떻게 다뤄갔는지에 대해 자랑스러워했다.

AI 기술의 최신 동향을 파악하고 AI가 제공하는 도전과 기회에 대해 알아보세요. 할리우드 스튜디오들이 ‘표절의 무한한 깊이’를 상대로 소송을 제기했다.

광고 창조물의 기술적인 대체가 기회와 혼란을 불러올 수 있다.

비디오 생성을 위한 세밀한 제어는 광고, 영화 제작, 대화형 엔터테인먼트 시장에서의 확산을 위해 중요한 장벽이다. 텍스트 프롬프트는 제어의 주요 수단이지만 동적인 움직임을 명확히 하는 데 한계가 있다.
중국에서 론칭된 XPENG G7은 XPENG의 새로운 튜링 AI 칩을 사용하며, 이는 Nvidia의 오린 X 칩을 대체했다. 금융 타임스에 따르면 XPENG의 창립자 겸 회장 겸 CEO인 허효펑은 폭스바겐이 XPENG의 튜링 칩을 도입할 것이라고 밝혔다.

넷서티브가 아마존 베드락과 아마존 노바를 활용해 MLX에 생성적 AI 기반 어시스턴트를 도입하여 플랫폼의 차세대를 구현했다.

Amazon Nova, Amazon Rekognition 및 Amazon Polly와 같은 서비스를 사용하여 비디오 콘텐츠에 대한 접근성 있는 오디오 설명을 자동화하는 방법을 소개합니다. 이 접근 방식은 시각 장애를 가진 관객들을 위해 비디오를 접근 가능하게 만드는 데 필요한 시간과 비용을 크게 줄일 수 있습니다.

도쿄 과학 연구소가 아마존 세이지메이커 하이퍼팟을 사용하여 70억 개의 파라미터를 가진 일본어 능력이 향상된 대형 언어 모델 Llama 3.3 Swallow을 성공적으로 훈련시켰다. 이 모델은 GPT-4o-mini 및 다른 선두 모델을 능가하는 일본어 작업에서 우수한 성능을 보여준다. 이 기술 보고서는 프로젝트 중 개발된 훈련 인프라, 최적화 및 모범 사례를 상세히 설명한다.

ChatGPT와 같은 생성적 AI 챗봇이 음모론적인 토론으로 빠져들고 황당한 신비주의적 신념 체계를 지지하고 있다. 일부 사람들에게는 이 기술과의 대화가 현실을 심각하게 왜곡시킬 수 있다.

메타의 마크 주커버그가 회사의 야심을 실리콘밸리가 각양각색으로 소문난 가상의 미래를 중심으로 재편하고 있습니다.

이 연구는 다국어 언어 모델이 언어 식별(형태)과 의미 내용(의미)을 어떻게 표현하는지를 평가하기 위한 훈련이 필요 없는 ABX 스타일의 차별화 작업을 소개한다. XLM-R에 적용된 결과, 언어 차별이 훈련 과정에서 감소하고 하위 레이어에 집중됨을 발견했다.

메타가 인공지능 경쟁사들에 뒤처지지 않기 위해 외부 기업에 대규모 소수 투자를 시작하며, Scale AI에 143억 달러를 투자한다.

VLM-R³는 시각과 언어 정보를 통합하여 기계가 다이어그램 내의 수학 문제 해결, 사진에서의 표지판 해석, 과학적 차트 해석 등 다중 모달 추론 능력을 갖추도록 돕는 프레임워크이다. 이는 인간의 사고과정을 모방하는데 도움이 되며 시각적 해석과 논리적 진행이 필요한 작업에 적합하다.

비디오앰프는 AWS Generative AI Innovation Center (GenAIIC) 팀과 협력하여 비디오앰프 자연어(NL) 분석 챗봇 프로토타입을 개발하고 아마존 베드락을 활용해 미디어 분석 데이터에서 의미 있는 통찰력을 대규모로 발견하는 방법을 소개합니다.
GLIMPSE-1은 임의의 서열로부터 인간화 매개변수를 최적화하여 동물 면역, 구조 모델링, 합성 스크리닝에 대안을 제공합니다.

워싱턴은 3대 행정부에서 고급 기술에 대한 중국의 접근을 제한하기 위해 수출통제를 사용해왔다.
Nicoya Lifesciences는 Applied Photophysics와 합병하여 통합 기술 스위트를 제공해 생물약품 연구 및 개발 고객에 더 나은 서비스를 제공할 수 있다고 이유를 제시했다.

MIT 윤리 컴퓨팅 연구 심포지엄은 기술, 윤리, 사회적 책임이 교차하는 프로젝트를 선보인다.

광 프로세서 칩은 빛의 속도로 딥 러닝을 수행하여 엣지 장치에 실시간 데이터 분석 기능을 제공할 수 있다.

MIT 연구팀이 디지털로 제작된 필름을 사용해 원본 그림을 물리적으로 복원하는 새로운 방법을 개발했다. 필름은 원하는 경우 제거할 수 있다.
디즈니와 유니버설이 Midjourney를 상대로 A.I. 생성 이미지를 둘러싼 소송을 제기했다. 이는 할리우드 대기업이 A.I. 생성 이미지로 소송을 제기하는 첫 사례이다.

오픈AI가 우리를 위해서 한다고 말할 때를 기다려보자.

WWDC 2025에서 애플은 반투명한 액체 유리 디자인을 갖춘 iOS 26, macOS 26 Tahoe 및 iPadOS 26를 발표했으며, 경쟁사들이 신속히 발전하는 가운데 ChatGPT 통합을 특징으로 소개했다.
BaseData는 서열 기반 AI 모델 교육용으로 제안된 최대 데이터베이스로, 100만 개의 신종 종으로 구성되어 모든 공개 데이터베이스를 합친 것과 비교했을 때 단백질 다양성이 10배 확대되었다.

Mistral AI가 최신 시리즈인 Magistral을 소개했다. 이는 추론에 최적화된 대형 언어 모델(Large Language Models)로 LLM 능력 발전의 중요한 한 걸음이다. Magistral 시리즈에는 Apache 2.0 라이선스 하에 공개된 24B-파라미터의 Magistral Small과 기업용 Magistral Medium이 포함되어 있다.

샌프란시스코 스타트업 Mechanize는 백색인력 직종을 자동화하기 위한 인공지능 도구를 “가능한 빨리” 구축하고 있습니다.

최신 언어 모델은 훈련 데이터를 의미있게 기억하는지에 대한 논란이 있습니다. 메타의 새로운 프레임워크는 모델의 용량을 비트 수준에서 정의하여 이 문제를 다루고 있습니다.
인공지능, 전기차, 스마트 홈이 동시에 연결될 때의 영향에 대해 알아본다. 에너지 소비가 어떻게 변화하고 있는지, 미래의 에너지 트렌드를 탐구한다.

MIT-IBM 왓슨 AI 연구소의 새로운 프레임워크는 언어 모델을 강화하여 복잡한 여행 일정을 상호작용적으로 개발하고 검증할 수 있게 함.

무슈터 다렐 교수의 새 책은 데이터 과학의 공통 필요성을 통해 많은 전문 분야를 통합하는 독특한 횡단학제 센터의 창설을 소개한다.
인공지능이 발견의 규칙을 변화시키고 있습니다. 실제로, 98%의 생명 과학 기관이 생성적 AI를 활용하고 있으며, 95%가 에이전틱 AI를 사용하고 있습니다.
Recursion의 공동 창업자이자 CEO인 Chris Gibson은 직원 감축은 “Recursion 2.0 플랫폼의 최대 효과 실현을 위한 지속적인 노력, AI 도구의 성숙 및 생명과학 자본시장에서의 계속되는 마찰”의 일환이라고 말했다.

E.ON은 아마존 텍스트랙트의 창의적인 응용과 커스텀 이미지 분석, 펄스 카운팅을 결합하여 실제 문제를 대규모로 해결하는 방법을 소개한다. 스마트 미터 오류를 짧은 스마트폰 비디오로 진단함으로써 E.ON은 비용을 절감하고 고객 만족도를 향상시키며 전체 에너지 서비스 신뢰성을 향상시키고자 한다.

대부분의 사람들은 낙관론자 대 루딧파와는 별개로 AI를 실제 능력과 개인화 요구에 기반하여 평가한다.
사진의 진실성이 논란이 되고 있는 가운데 인공지능은 더 이상 진실을 숨기지 않을 것이라고 예측된다.
연구진은 당뇨병, 암, 천식과 같은 복잡한 질병의 기저에 있는 유전자 조합을 식별하기 위한 AI 기반 도구를 개발했는데, 이는 여러 유전자와 관련된 분자적 타겟을 활용한 치료 전략 개발에 도움이 될 것으로 기대된다.

애플의 최신 소프트웨어 이벤트에는 새로운 인공지능 기능이 거의 없었습니다. 몇몇 분석가와 투자자들은 회사가 땅을 메우기 위해 큰 돈을 지불해야 한다고 생각합니다.

메타는 Scale AI 창업자 알렉산드르 왕을 포함한 새 연구소를 설립하는데, 이는 메타의 인공지능 노력을 재정비하는 일환으로 마크 주커버그 아래에서 이루어진다.

VeBrain은 로봇 팔과 다리로 등장하는 기계들이 주변 환경을 인식하고 상황을 해석하며 의미 있는 조치를 취할 수 있도록하는 ML 모델의 통합을 통해 로봇 공학 분야를 발전시키고 자율적인 기계로 나아가고 있다.

이 AI 시스템은 바람과 같은 알 수 없는 방해요소에 자동으로 적응하도록 학습합니다.

MIT의 ‘미래 컴퓨팅 상상하기 상’ 수상 에세이가 건강 관리 격차를 중심에 두고 있다.

애플이 WWDC 2025에서 ‘액체 유리’ 디자인과 iOS 26를 선보였다. 또한 회사 컨퍼런스의 오프닝 프레젠테이션에서 인공지능을 기기에 도입했다.

MIT 동문 두 명에 의해 설립된 Coactive는 AI 플랫폼을 구축하여 모든 유형의 콘텐츠로부터 새로운 통찰을 얻을 수 있게 함.

알케미스트는 텍스트-이미지(T2I) 생성 분야에서 일관된 출력 품질을 달성하는데 도움을 주는 감독 미세 조정 데이터셋으로, 대규모 사전 훈련만으로는 높은 품질과 정렬을 달성하기 어렵다는 도전에 대응한다. DALL-E 3, Imagen 3, Stable Diffusion 3과 같은 모델의 발전에도 불구하고, 미학적 및 정렬 측면에서 일관된 출력 품질을 달성하는 것은 여전히 과제다.

대형 언어 모델(LLMs)은 각 토큰이 일관된 논리적 설명에 기여하는 Chain-of-Thoughts(CoTs)을 생성한다. 이러한 추론의 품질을 향상시키기 위해 다양한 강화 학습 기술이 사용되고 있으며, 이를 통해 모델은 생성된 출력을 정확성 기준과 일치시키는 피드백 메커니즘으로 학습할 수 있다.

오픈에이아이는 대학생들의 모든 측면에 인공지능을 통합하고자 합니다. 먼저, 캘리포니아 주립 대학 46만 명의 학생들 대상으로 진행될 예정입니다.
자율 주행차에 대해 다루는 기사가 많지만, 자율 의료 기술에 대해 논할 때는 거의 언급되지 않는다. 자율 의료가 항생제 내성을 완화시키는데 도움이 될 수 있을지에 대한 가능성을 탐구해볼 필요가 있다.
GEN의 Touching Base에서는 임상시험 업데이트, 볼츠-2의 AI 약물 발견 데뷔, 혈장 교환의 노화 방지 가능성, 면역요법 변형 가능한 유니버설 CAR T 요법을 다룸.
Boltz-2는 분자 결합 친화도를 빠르고 정확하게 예측하며 상업적 의약품 개발자가 모델을 내부적으로 사용하고 독점 데이터를 적용할 수 있는 MIT 라이선스 하에 제공된다.

하원 법안의 43201조는 10년간 주별 AI 규제를 우회하며 연방주의를 약화시키고 AI 피해에 대한 주별 보호를 약화하며 대신할 연방 가드레일을 제공하지 않는다.
ASML은 첨단 반도체를 생산하는데 사용되는 수백만 달러짜리 장비를 만드는 네덜란드 회사로, 기술 무역전쟁의 여파에 대응하고 있다.

웹 자동화 에이전트는 인공지능 분야에서 점점 더 주목받고 있는데, 이는 그들이 디지털 환경에서 인간과 유사한 작업을 수행할 수 있는 능력 때문이다. 이러한 에이전트들은 그래픽 사용자 인터페이스(GUI)를 통해 웹사이트와 상호작용하며, 클릭, 타이핑, 다중 웹 페이지 탐색 등과 같은 인간의 행동을 모방한다. WebChoreArena 벤치마크는 에이전트에게 메모리 집중적이고 멀티페이지 작업을 제공하여 도전한다.

LLM으로 구동되는 AI 에이전트는 CRM과 같은 복잡한 비즈니스 업무를 처리하는 데 큰 잠재력을 보여준다. 그러나 실제 세계에서의 효과를 평가하는 것은 공개적이고 현실적인 비즈니스 데이터의 부족으로 어렵다. 기존의 벤치마크는 종종 간단한 일회성 상호작용이나 고객 서비스와 같은 좁은 응용에 초점을 맞추어 실제 업무를 놓치고 있다.

인공지능이 크게 발전해왔고 대형 언어 모델의 등장으로 성장의 주요 이정표를 찍었다. 최신 트렌드를 따라가는 한 가지 방법은 독서다. 2025년에 읽을 인공지능 도서를 소개한다.

시각 언어 모델의 씨토트 추론은 해석 가능성과 신뢰성을 향상시키는 데 중요하다. 현재의 훈련 방법은 짧은 주석으로 지배된 데이터셋에 의존하고 있는데, 이는 자세한 설명이 필요한 추론 작업에서 일반화가 부족하다는 한계가 있다. 이 한계를 극복하기 위해 짧은 답변 데이터를 확장한 두 단계의 후훈련 전략을 제안한다.

토크나이저 디자인은 언어 모델 성능에 상당한 영향을 미치지만, 토크나이저 품질을 평가하는 것은 여전히 어렵다. 최근 연구에서는 텍스트 압축이 일반적인 내재적 측도로 등장했지만, 신뢰성이 의문되고 있다. 저자들은 작은 모델(350M 매개변수)에서 토크나이저를 평가하는 것이 큰 규모(2.7B 매개변수)에서의 영향을 신뢰할 수 있는지 조사했다. 널리 사용되는 언어 모델의 토크나이저를 실험한 결과, 토크나이저 선택은 영어 작업에는 거의 영향을 주지 않지만, 중요한 차이를 보여준다.
세 개의 기계 학습 모델을 결합하여 과학자들은 인간 아연 손가락 단백질을 식별하고 최적화하기 위한 워크플로우를 개발했으며, 이는 면역 반응 유발 위험을 줄이기 위한 것이다.

다국어 간 전이는 NLP 작업의 훈련 데이터 양을 늘리는 인기있는 방법이지만, 어떤 다국어 데이터를 포함해야 하는지에 대한 최적 전략은 명확하지 않다. 본 연구에서는 263개 언어에 대한 다국어 간 전이를 분석하여 이 질문에 기여하고 있다. 세 가지 인기 NLP 작업을 포함한다.

MIT 연구팀이 Themis AI를 설립하여 AI 모델의 불확실성을 측정하고 지식의 공백을 해결하고 있다.

증류 스케일링 법칙은 학생과 선생님 간의 컴퓨팅 예산 및 할당을 기반으로 증류된 모델 성능을 예측하는 법칙이다. 컴퓨팅 최적 할당을 통해 학생 성능을 극대화하여 대규모 증류와 관련된 위험을 완화한다. 기존 선생님이 있는 경우와 선생님을 훈련해야 하는 경우에 대한 컴퓨팅 최적 증류 레시피를 제공한다.

MIT 연구팀은 시멘트 대체재 수요가 증가하는 가운데, 기계 학습을 활용하여 과학 문헌에서 새로운 재료를 찾고 있습니다.

MIT CSAIL 연구원들이 개발한 SketchAgent는 AI 모델에게 개념을 한 줄씩 스케치하도록 가르쳐, 언어 모델이 독자적으로 개념을 시각적으로 표현하고 인간과 협업할 수 있도록 돕는다.