
Amazon의 다음 세대 추론 엔진인 Mantle이 제로 오퍼레이터 액세스(ZOA) 디자인을 구현하여 AWS 오퍼레이터들이 고객 데이터에 액세스할 수 있는 기술적 수단을 제거하는 방법을 탐색합니다.

Amazon의 다음 세대 추론 엔진인 Mantle이 제로 오퍼레이터 액세스(ZOA) 디자인을 구현하여 AWS 오퍼레이터들이 고객 데이터에 액세스할 수 있는 기술적 수단을 제거하는 방법을 탐색합니다.

AWS AI 리그 챌린지를 통해 기관들이 AI 개발에 접근하는 방식을 변화시키고 있는 내용을 살펴보고, AWS re:Invent 2025에서의 대장정이 그들의 창의력과 기술을 진열한 것을 다룸.

Amazon Bedrock의 Foundation Models(FMs)와 Amazon Bedrock AgentCore를 사용하여 W&B Weave와 함께 기업용 AI 솔루션을 구축, 평가 및 모니터링하는 방법을 소개. 개별 FM 호출 추적부터 복잡한 에이전트 워크플로우 모니터링까지 전체 개발 주기 다룸.

dLocal은 AWS 팀과 긴밀히 협력하여 제품 로드맵을 구상하고 산업 혁신가로서의 역할을 강화하며 글로벌 핀테크 분야의 운영 우수성에 대한 새로운 기준을 설정했습니다.

Qbtech는 Amazon SageMaker AI와 AWS Glue를 활용하여 머신러닝 워크플로우를 최적화했고, 특징 공학 시간을 주간에서 몇 시간으로 단축하면서도 의료 공급자가 요구하는 높은 임상 기준을 유지했다.

이 게시물은 Amazon Nova를 사용하여 생성 AI를 통해 마케팅 캠페인 작성을 간소화하고 가속화하는 방법에 초점을 맞추고 있습니다. 콜롬비아 최대 은행 중 하나인 Bancolombia가 Amazon Nova 모델을 활용하여 마케팅 캠페인을 위한 시각 자료를 생성하는 방법을 소개합니다.

AWS와 Visa가 협력하여 Visa Intelligent Commerce를 통해 에이전틱 상거래를 가능하게 하고, Amazon Bedrock AgentCore를 활용하는 방법을 탐구합니다. 자율 AI 에이전트가 자연어를 통해 이뤄지는 단순한 엔드투엔드 워크플로로 쇼핑 및 여행 경험을 변화시킬 수 있는 방법을 보여줍니다.

이 포스트는 Zoom AI Research 논문 ‘Chain of Draft: Thinking Faster by Writing Less’에서 소개된 혁신적인 프롬프팅 기술인 Chain-of-Draft (CoD)를 탐구하며, 모델이 추론 작업에 접근하는 방식을 혁신적으로 변화시키는 방법을 살펴봅니다. 체인 오브 씨오트 (CoT) 프롬프팅이 모델 추론을 향상시키는 데 사용되어 왔지만, CoD는 인간의 문제 해결 패턴을 모방하여 간결하고 신호가 강한 사고 단계를 사용하는 더 효율적인 대안을 제공합니다.

이 포스트에서는 vLLM과 Bring Your Own Container (BYOC) 접근 방식을 사용하여 Amazon SageMaker AI 엔드포인트에 Voxtral 모델을 호스팅하는 방법을 보여줍니다. vLLM은 대규모 언어 모델(LLM)을 제공하는 고성능 라이브러리로, 향상된 메모리 관리를 위한 페이지드 어텐션과 여러 GPU에 걸쳐 모델을 분산하는 텐서 병렬성을 특징으로 합니다.

GenAI IDP 가속기에 통합된 새로운 기능 Analytics Agent를 소개합니다. 사용자는 SQL 또는 데이터 분석 전문 지식 없이 자연어 쿼리를 사용하여 고급 검색과 복잡한 분석을 수행할 수 있습니다. 이 기능을 통해 비전문가도 대규모로 처리한 문서를 자연어로 분석하고 이해할 수 있습니다.

이 글에서는 Amazon Bedrock에서 Foundation Models (FMs)을 활용하여 예측 정비 솔루션을 구현하는 방법과, 아마존의 제조 장비를 사례로 들어 그 활용성을 보여줍니다. 이 솔루션은 유연하며 다른 산업에 맞게 맞춤화할 수 있습니다.

아마존은 세이지메이커 스튜디오를 위한 새로운 기능인 SOCI(Seekable Open Container Initiative) 인덱싱을 소개했다. SOCI는 컨테이너 이미지의 지연 로딩을 지원하여 초기에 이미지의 필요한 부분만 다운로드하고 전체 컨테이너를 다운로드하지 않는다.

Strands 에이전트, Amazon Bedrock AgentCore 및 NVIDIA NeMo Agent Toolkit의 강력한 조합을 사용하여 AWS에서 AI 에이전트를 초기 개발부터 프로덕션 배포까지 구축, 평가, 최적화 및 배포하는 방법을 보여줍니다.

이 게시물에서는 양방향 스트리밍에 대해 알아보고 웹소켓 구현을 위한 전제조건에 대해 소개합니다. 또한 Strands Agents를 사용하여 음성 에이전트를 위한 양방향 스트리밍 솔루션을 구현하는 방법을 알아봅니다.

이 포스트에서는 조직이 모델 개발 및 배포 수명주기를 추적하고 관리하는 데 도움이 되는 새로운 기능과 핵심 개념을 탐구합니다. 데이터셋 업로드 및 버전 관리부터 모델 세밀 조정, 평가 및 원활한 엔드포인트 배포까지 자동 종단간 계보를 갖춘 모델을 훈련하는 방법을 안내합니다.

이 포스트에서는 Amazon SageMaker에서 MLflow를 관리하여 이러한 실험을 기록하고 진행 상황을 모니터링하는 통합 시스템을 제공하는 방법을 보여줍니다.

기업이 첫 번째 생성 AI 응용 프로그램을 배포한 후 규모를 확대하기로 계획할 때 일관된 보안 강화, 모델 편향 방지, AI 응용 프로그램이 증가함에 따라 통제를 유지하는 방법에 대한 중요한 질문들이 제기됩니다.

타타 파워 CoE와 Oneture Technologies가 AWS 서비스를 활용하여 검사 프로세스를 자동화하는 방법을 탐구합니다.

TwelveLabs Marengo 임베딩 모델이 Amazon Bedrock에서 비디오 이해력을 향상시키는 방법을 소개합니다. 이 모델을 사용하여 비디오 의미 검색 및 분석 솔루션을 구축하고 Amazon OpenSearch Serverless를 벡터 데이터베이스로 활용하여 간단한 메타데이터 일치 이상의 의미 검색 기능을 제공합니다.

아마존 세이지메이커 하이퍼팟에서의 체크포인트 없는 트레이닝은 모델 트레이닝에서 기존의 체크포인팅 필요성을 줄이고, 동료 간 상태 복구를 통해 생산 규모 검증 결과에서 복구 시간을 80~93% 단축하고, 수천 대의 AI 가속기로 이루어진 클러스터에서 최대 95%의 훈련 처리량을 달성했다.

Amazon SageMaker HyperPod는 이제 탄력적 훈련을 지원하여 기계 학습(ML) 워크로드가 자동으로 자원 가용성에 기반해 확장될 수 있게 합니다. 이 글에서는 탄력적 훈련이 GPU 활용률을 극대화하고 비용을 줄이며 모델 개발을 가속화하는 방법을 보여줍니다. 동적 자원 적응을 통해 훈련 품질을 유지하고 수동 개입을 최소화합니다.

Strands 에이전트를 사용한 두 가지 강력한 조율 패턴을 탐구합니다. 여행 계획 도구를 사용하여 다양한 조율 전략이 동일한 문제를 해결하는 방법을 보여줍니다.

이 두 파트 시리즈의 첫 번째에서 기존의 데브옵스 아키텍처를 발전시키고 생성 모델 AI 워크로드를 위한 GenAIOps 실천 방법을 구현하는 방법을 배웁니다. 다양한 생성 모델 AI 채택 수준에 대한 실용적인 구현 전략을 소개하며, 기초 모델 소비에 초점을 맞춥니다.

이 게시물에서는 Amazon S3 일반 버킷에서 직접 데이터를 읽는 ML 훈련 워크로드의 처리량을 최적화하기 위한 실용적인 기술과 권장 사항을 제시합니다.

Amazon Nova Sonic을 사용하여 음성 처리를 하고 Strands Agents를 사용하여 다중 에이전트 오케스트레이션을 구축하여 고급 음성 기반 AWS 운영 어시스턴트를 만드는 방법을 탐구한다. 자연어 음성 상호작용이 클라우드 운영을 변화시켜 AWS 서비스를 더 접근 가능하게 하고 운영을 더 효율적으로 만드는 솔루션을 소개한다.

Harmonic Security가 Amazon SageMaker AI, Amazon Bedrock 및 Amazon Nova Pro를 활용하여 ModernBERT 모델을 세밀하게 조정하여 저지연, 정확하고 확장 가능한 데이터 누출 감지를 달성하는 방법에 대한 내용입니다.

Swisscom은 Amazon Bedrock AgentCore를 도입하여 고객 지원 및 영업용 기업 AI 에이전트를 구축하고 확장하는 방법을 소개합니다. 스위스컴은 AWS 유럽 지역(취리히)의 Amazon Bedrock 초기 도입 업체로, Rasa를 기반으로 한 대화형 AI 및 Amazon SageMaker의 fine-tuned LLM을 포함한 다양한 AI 프로젝트를 성공적으로 구축하고 있습니다.

Amazon SageMaker AI with MLflow가 새로운 서버리스 기능을 도입했다. 이로써 AI 및 머신러닝 작업을 위한 인프라 프로비저닝, 확장 및 운영을 동적으로 관리할 수 있게 되었다. 이번 포스팅에서는 이러한 새로운 기능이 SageMaker AI with MLflow를 통해 개선된 성능, 자동화, 보안을 제공하며 대규모 MLflow 워크로드를 실행하는 방법을 탐구한다.

아마존 베드락 에이전트코어에 랑퓨즈 감시 기능을 통합하여 AI 에이전트의 성능을 심층적으로 파악하고 문제를 빠르게 해결하며 비용을 최적화하는 방법을 설명합니다. Strands 에이전트를 AgentCore Runtime에 배포한 후 단계별 코드 예제를 통해 완벽한 구현을 안내합니다.

이 포스트는 CI/CD 파이프라인에서 Amazon Nova Act 헤드리스 모드를 활용하여 자동화된 스모크 테스트를 구현하는 방법을 소개합니다. 우리는 데모를 위해 샘플 전자 상거래 애플리케이션인 SauceDemo를 대상으로 사용합니다. 헤드리스 브라우저 자동화를 위한 Amazon Nova Act 설정, 핵심 사용자 워크플로를 검증하는 스모크 테스트 생성, 병렬 실행 구현, GitLab CI/CD 구성, 테스트 자동 실행 및 유지보수 가능하고 확장 가능한 테스트 자동화를 위한 모범 사례 적용 방법을 보여줍니다.

아마존 노바 라이트 2.0의 추론 능력을 평가하는 글로, Lite 1.0, Micro, Pro 1.0, Premier과 비교하여 최신 버전이 추론 품질과 일관성을 어떻게 개선하는지 밝힘.

아마존 퀵 스위트를 사용하여 챗 에이전트를 구축하는 방법을 소개하고, 신원, 지침, 지식 세 가지 계층 구조를 통해 퀵 스위트 챗 에이전트를 지능적인 기업용 AI 어시스턴트로 변환하는 과정을 안내합니다. 예시를 통해 챗 어시스턴트가 기능 발견을 안내하고, 기업 데이터를 활용하여 추천을 제공하며, 영향 가능성과 팀의 채택 준비도에 따라 솔루션을 맞춤화하는 방법을 보여줍니다.

AWS의 전문가들이 생성 모델 AI를 통해 조직이 우수한 성과를 거둘 수 있도록 도와주는 전략을 소개합니다.

S&P Global과 Amazon Quick Research 간의 새로운 통합이 발표되었습니다. 이 통합으로 Quick Research 고객들은 S&P Global Energy 뉴스, 연구 및 통찰력과 S&P Global Market Intelligence 데이터를 하나의 심층적인 연구 에이전트에서 이용할 수 있습니다.

AgentCore Gateway가 이제 API Gateway를 지원합니다. 기업은 에이전트 애플리케이션의 가능성을 탐색하면서, 대규모 언어 모델(LLM)에 대한 호출 요청에서 기업 데이터를 안전하게 사용하고 기업 정책과 일치시키는 도전을 해결하고 있습니다. 이 게시물에서는 이러한 새로운 기능을 다루고 구현하는 방법을 보여줍니다.

이 포스트에서는 CRM 시스템 및 데이터베이스 간의 데이터 통합, 규제 준수를 위한 설명 가능하고 감사 가능한 AI 결정 제공, 일관된 보험 가입 규칙으로 자동 사기 탐지를 가능케 하는 지능형 보험 가입자 에이전트를 구축하는 방법을 소개합니다. 이 솔루션은 투명한 위험 평가를 위한 Amazon Nova 2 Lite, 관리형 MCP 서버 인프라를 위한 Amazon Bedrock AgentCore, 자연어 상호작용을 위한 Amazon Quick Suite를 결합하여 30분 이내에 배포할 수 있는 생산 준비 시스템을 제공합니다.

Myriad Genetics는 AWS Generative AI 혁신 센터와 협력하여 Amazon Bedrock 및 Amazon Nova foundation 모델을 활용해 건강 관련 문서 처리 파이프라인을 개선했으며, 98%의 분류 정확도를 달성하고 비용을 77% 줄이고 처리 시간을 80% 단축했다. AWS의 오픈소스 GenAI Intelligent Document Processing Accelerator를 사용한 기술적 구현과 문서 분류 및 핵심 정보 추출에 대한 최적화 전략, 그리고 Myriad의 사전 승인 업무에 미친 실제 비즈니스 영향을 상세히 설명한다.

CBRE와 AWS가 Amazon Bedrock을 활용하여 부동산 관리를 변혁하고, 통합 검색 및 디지털 어시스턴트를 구축한 방법을 소개한다. 이를 통해 전문가들은 자연어 질의를 통해 수백만 건의 문서와 다중 데이터베이스에 액세스할 수 있게 되었고, 670만 건 이상의 문서에 대한 처리 시간을 67% 줄이면서 기업급 보안을 유지했다.

Amazon SageMaker HyperPod를 위한 관리형 Tiered KV 캐시 및 지능적 라우팅 기능 소개. 이 기능은 장문 프롬프트 및 다중 대화에서 최대 40%의 첫 토큰 시간 감소와 최대 25%의 컴퓨팅 비용 절감을 제공한다. 이 기능은 분산된 KV 캐싱 인프라와 지능적인 요청 라우팅을 자동으로 관리하여 엔터프라이즈급 성능으로 제품 규모의 LLM 추론 워크로드를 배포하는 것을 쉽게 하며 운영 오버헤드를 크게 줄인다.

Amazon Bedrock AgentCore Gateway에 대한 새로운 기능인 게이트웨이 인터셉터를 출시했습니다. 이 강력한 기능은 세밀한 보안, 동적 접근 제어 및 유연한 스키마 관리를 제공합니다.

Condé Nast가 Amazon Bedrock과 Anthropic의 Claude를 활용하여 계약 처리와 권리 분석 업무를 가속화하는 방법을 탐구한다. 다수의 브랜드와 지역을 아우르는 회사의 포트폴리오는 점점 복잡해지는 계약, 권리, 라이선싱 계약을 관리해야 했다.

Amazon Nova Sonic은 Amazon Bedrock 양방향 스트리밍 API를 통해 비즈니스 데이터 및 외부 도구에 연결되며 전화 시스템과 직접 통합될 수 있다. 이 포스트에서는 가장 일반적인 전화 시나리오에 대한 샘플 구현을 소개한다.

UCLA의 OARC 및 REMAP 팀이 AWS의 서버리스 인프라, 관리형 서비스 및 생성 AI 서비스를 활용하여 솔루션을 신속하게 설계하고 배포하는 방법을 설명하며, Amazon SageMaker AI의 사용법과 몰입형 실시간 경험에서 안정적으로 활용하는 방법을 소개합니다.

Mobileye 팀은 AWS Graviton을 활용하여 REM™을 최적화하는 방법에 대해 설명합니다. 이를 통해 ML 추론과 Triton 통합에 초점을 맞추고 있습니다.

아마존 세이지메이커 AI의 새로운 아마존 노바 모델 평가 기능을 소개하는 블로그 포스트입니다. 이 업데이트는 사용자 정의 메트릭 지원, LLM 기반 선호도 테스트, 로그 확률 캡처, 메타데이터 분석, 대규모 평가를 위한 다중 노드 스케일링을 추가했습니다.

AI를 조직에 효과적으로 통합하기 위한 세 가지 전략을 살펴보고 있다. 조직적 채무 해결, “문어 조직” 모델을 통한 분산 의사 결정 수용, AI 기반 워크플로에 부합하는 관리 역할 재정의가 중요하다. 기술과 직원 준비에 투자해야 하며 프로세스를 간소화하고 팀에 자율적인 의사 결정 권한을 부여하고 전통적인 감독에서 멘토십, 품질 보증, 전략 비전 설정으로 발전시켜야 한다.

Amazon Bedrock Custom Model Import를 사용할 때 엔드 투 엔드 대기 시간이 줄고, 첫 번째 토큰까지의 시간이 단축되며, 고급 PyTorch 컴파일 및 CUDA 그래프 최적화를 통해 스루풋이 향상되어 성능이 크게 향상되었습니다. Amazon Bedrock Custom Model Import를 사용하면 자체 기반 모델을 Amazon Bedrock로 가져와 규모 확장 가능한 배포 및 추론이 가능합니다.

아마존 세이지메이커 AI가 EAGLE을 기반으로 한 적응형 추측 디코딩을 지원하며, 이 기술은 출력 품질을 유지하면서 대형 언어 모델 추론 속도를 최대 2.5배 가속화합니다. 이 글에서는 아마존 세이지메이커 AI에서 EAGLE 2 및 EAGLE 3 추측 디코딩을 사용하는 방법, 솔루션 아키텍처, 데이터셋 최적화 워크플로우, 그리고 증가된 처리량과 낮은 대기 시간을 보여주는 벤치마크 결과에 대해 설명합니다.

Amazon Lookout for Vision에서 Amazon SageMaker AI로 컴퓨터 비전 작업을 이전하고, AWS Marketplace에서 제공되는 사전 훈련된 모델을 사용하여 사용자 정의 하자 검출 모델을 훈련하는 방법을 소개합니다. SageMaker Ground Truth로 데이터셋 라벨링, 유연한 하이퍼파라미터 구성으로 모델 훈련, 실시간 또는 일괄 추론을 위한 배포까지 단계별 안내를 제공하여 자동 품질 검사에 대한 제어와 유연성을 높입니다.

AWS 고객 성공 센터는 AI 투자로부터 현실적인 가치를 얻도록 돕습니다. 사람, 프로세스, 기술을 함께 고려하는 AI 전략을 구축하는 고객들이 더 자주 성공하는 경향이 있습니다. 본문에서는 AI 가치 격차를 줄일 수 있는 실용적인 고려사항을 공유합니다.

Amazon SageMaker AI 추론에 양방향 스트리밍을 도입했는데, 이는 추론을 단방향 교환이 아닌 지속적인 대화로 변환시킵니다. 본문에서는 SageMaker AI 엔드포인트에 양방향 스트리밍 기능을 갖춘 컨테이너를 구축하고 배포하는 방법을 안내하며, Deepgram의 미리 구축된 모델과 컨테이너를 사용해 실시간 추론을 위한 양방향 스트리밍 기능을 활성화하는 방법을 보여줍니다.

Warner Bros. Discovery가 AWS Graviton을 활용하여 ML 추론 워크로드에 대해 60%의 비용 절감과 다양한 모델에서 7%에서 60%의 지연 시간 개선을 달성했다.

이 블로그 글에서는 데이터 수집과 모델 학습부터 엣지 배포에 이르는 물리적 AI의 완전한 개발 생명주기를 탐구하며, 이러한 지능 시스템이 지속적인 피드백 루프를 통해 물리적 세계를 이해하고 추론하며 상호작용하는 방법을 살펴본다. Diligent Robotics의 Moxi를 통해 이 워크플로우를 설명하며, 병원에서 120만 건 이상의 배달을 완료하면서 임상 직원들에게 거의 60만 시간을 절약하고 의료 물류를 혁신하며 환자 치료에 소중한 시간을 돌려주고 있다.

Amazon SageMaker HyperPod가 NVIDIA Multi-Instance GPU(MIG) 기술을 지원함으로써 강력한 GPU를 여러 격리된 인스턴스로 분할하여 추론, 연구, 상호작용 개발과 같은 동시 작업을 실행할 수 있게 되었습니다. GPU 활용도를 극대화하고 낭비되는 자원을 줄이는 MIG는 기업이 다양한 머신러닝 작업에서 성능 격리와 예측 가능한 서비스 품질을 유지하면서 비용을 최적화할 수 있도록 도와줍니다.

캐나다의 고객들이 아마존 베드락을 통해 Anthropic의 최신 기반 모델에 액세스할 수 있게 되었다. 이를 통해 AI 프로젝트를 가속화할 수 있는데, 이를 위해 캐나다 지역의 교차 지역 추론 프로필을 활용하는 방법과 이에 대한 가이드가 소개된다.

Amazon SageMaker HyperPod 클러스터는 Amazon Elastic Kubernetes Service (EKS) 조정을 통해 JupyterLab 및 오픈 소스 Visual Studio Code와 같은 대화형 개발 환경을 생성하고 관리할 수 있어서, 익숙한 도구를 데이터 과학자들에게 제공하여 ML 개발 수명주기를 간소화합니다. 이 게시물에서는 HyperPod 관리자가 클러스터용 Spaces를 구성하는 방법과 데이터 과학자가 이러한 Spaces를 만들고 연결하는 방법을 보여줍니다.

Anthropic의 최신 foundation 모델인 Claude Opus 4.5가 Amazon Bedrock에서 사용 가능하다. 이 모델의 특징, 주요 비즈니스 응용 프로그램 및 Amazon Bedrock에서 Opus 4.5의 새로운 도구 사용 능력을 시연한다.

이 포스트에서는 Amazon Bedrock를 사용하여 GPT-OSS-20B 모델을 배포하는 방법을 소개하며, 기존 응용 프로그램과 완전한 API 호환성을 유지합니다.

이 게시물에서는 다중 제공업체 생성 AI 게이트웨이 참조 아키텍처를 소개하며, 이를 통해 LiteLLM을 AWS 환경에 배포하여 여러 모델 제공업체 간의 제너레이티브 AI 워크로드의 관리와 거버넌스를 최적화하는 방법에 대한 지침을 제공합니다. 이 중앙 집중식 게이트웨이 솔루션은 Amazon Bedrock, Amazon SageMaker AI 및 외부 제공업체를 지원하면서 포괄적인 보안, 모니터링 및 제어 기능을 유지하며 제공자 단편화, 분산형 거버넌스, 운영 복잡성 및 비용 관리와 같은 일반적인 기업 과제에 대응합니다.

Foursquare Spatial H3 Hub의 지리 데이터와 Amazon SageMaker AI에 배포된 추론 모델을 결합하여, 공간 질문에 대한 복잡한 답변을 몇 분 내에 얻을 수 있는 지리 AI 에이전트를 배포하는 방법을 배웁니다. 이를 통해 비기술적인 도메인 전문가들이 지리 정보 시스템(GIS) 전문 지식이나 사용자 정의 데이터 엔지니어링 파이프라인이 필요하지 않은 자연어 쿼리를 통해 정교한 공간 분석을 수행할 수 있는 에이전트를 구축할 수 있습니다.

와이프로가 아마존 베드락을 활용해 산업 자동화 코드 개발을 최적화하는 방법을 소개하고, 실제 제조 작업에 미치는 변화를 보여주는 결과를 공유합니다.

MSD는 생성 모델 AI와 데이터베이스의 파워를 활용하여 제조 이탈 관리 프로세스를 최적화하고 변형하는 방법을 탐구하고 있습니다. 지난 사건, 이탈 및 발견에 대한 정확하고 다면적인 지식 기반을 만들어 새로운 사례당 소요되는 시간과 노력을 현저히 줄이면서 최고 수준의 품질과 규정 준수를 유지하려고 합니다.

이 블로그 포스트에서는 에이전트 워크플로우가 자연어 인터페이스를 활용하여 규모 확장 가능한 유전체 파이프라인의 처리 및 해석을 가속화하는 방법을 소개합니다. 우리는 자동화된 데이터 처리와 지능적 분석을 결합한 포괄적 유전체 변이 해석기 에이전트를 시연하여, 원시 VCF 파일 수용부터 대화형 쿼리 인터페이스까지 전체 워크플로우를 다룹니다.

아마존 팀이 만든 AI 쇼핑 어시스턴트 Rufus는 지능적인 대화형 경험을 제공하여 고객을 기쁘게 합니다. 이번 연도에 2억 5천만 명 이상의 고객이 Rufus를 사용했으며, 월간 이용자가 전년 대비 140% 증가하고 상호작용은 210% 증가했습니다. 또한, Rufus를 사용하는 고객은 쇼핑 여정 중에 60% 더 많은 가능성으로 상품을 구매합니다.

Care Access가 Amazon Bedrock 프롬프트 캐싱 기술을 도입하여 의료 기록 처리를 최적화하고 규정 요구 사항을 준수하는 방법을 소개합니다.

이 포스트에서는 클로드 코드의 배포 패턴과 아마존 베드락과의 최상의 실천 방안에 대해 알아보며, 인증 방법, 인프라 결정 및 모니터링 전략을 다룹니다. 기업이 안전하고 확장 가능하게 배포할 수 있도록 돕기 위해 직접 IdP 통합, 인프라용 전용 AWS 계정 및 종합적인 모니터링을 권장합니다.

아마존 베드락 가드레일이 12가지 프로그래밍 언어로 코드 생성을 보호하는 안전 제어를 확장했다. AI 지원 소프트웨어 개발 중요 보안 도전 과제를 해결하기 위해 내용 필터, 공격 탐지, 거부 주제, 민감 정보 필터를 구성하는 방법을 살펴본다.
AWS Well-Architected 책임 있는 AI 렌즈는 적절한 질문과 모범 사례를 제공하여 개발 및 운영 과정에서 책임 있는 AI 문제를 해결하는 데 도움을 줍니다.

아마존의 AI 기반 Amazon Compliance Screening 시스템은 복잡한 규정 준수 문제를 자율 에이전트를 통해 분석하고 해결함으로써 정확도를 높였다. 이 블로그 포스트에서는 아마존의 규정 준수팀이 AWS에서 구축한 AI 기반 조사 시스템에 대해 탐구한다.

Snowflake AI Data Cloud와 Amazon Web Services(AWS) 도구를 활용하여 조직이 데이터 기반 의사결정을 내리고 운영 효율을 높이며 경쟁 우위를 확보할 수 있는 생성적 AI 솔루션을 구축하는 방법에 대해 다루고 있습니다.

Spectrum을 사용하여 리소스 사용을 최적화하고 학습 시간을 단축하는 방법을 배우고, Amazon SageMaker AI 학습 작업에서 Spectrum Featuning을 구현하는 방법을 알아봅니다. 또한 QLoRA와 Spectrum Featuning 사이의 트레이드오프에 대해 논의하며, QLoRA가 리소스를 더 효율적으로 사용하는 반면 Spectrum은 전반적으로 더 높은 성능을 제공한다고 보여줍니다.

RoboTic-Tac-Toe는 두 대의 로봇이 틱택토 보드를 움직이는 대화형 게임으로, LLMs가 게임 플레이와 로봇 움직임을 조율합니다. 자연어 명령을 사용해 로봇을 제어하고, 플레이어는 자신의 표시를 게임 보드에 놓을 수 있습니다. 이 게시물에서는 틱택토 게임을 이해하고 현재 플레이어를 위한 최적의 게임 전략과 움직임 계획을 결정하기 위해 사용된 구조와 프롬프트 엔지니어링 기술을 탐구합니다.

Amazon SageMaker HyperPod에 두 가지 주요 기능이 도입되어 대규모 머신 러닝 인프라의 보안 및 저장 기능이 강화되었습니다. 새로운 기능으로는 기업이 제어하는 암호화 키를 사용하여 EBS 볼륨을 암호화하는 고객 관리 키(CMK) 지원 및 AI 워크로드에서 Kubernetes 볼륨에 대한 동적 저장소 관리를 지원하는 Amazon EBS CSI 드라이버 통합이 포함됩니다.

플랫폼 엔지니어링 원칙을 생성 AI에 적용하여 가치 실현 시간 단축, 비용 통제, 확장 가능한 혁신을 어떻게 가능케 하는지에 대해 설명합니다.

2025년 12월 1일부터 5일까지 라스베이거스에서 열리는 re:Invent에서 Amazon Quick Suite의 포괄적인 세션 카탈로그를 탐색하고 주간 일정을 계획하는 데 도움이 되는 가이드입니다. 비즈니스 및 기술 리더, 제품 및 엔지니어링 팀, 데이터 및 분석 팀을 위한 세션이 제공되며, 팀과 조직 전반에 걸쳐 AI 능력을 통합하려는 관심이 있는 사용자를 대상으로 합니다.

AWS 프로페셔널 서비스가 특화된 AI 에이전트를 도입한 것을 발표했다. 이는 지능적인 에이전트를 컨설팅 수명 주기 전반에 포함시켜 고객에게 더 큰 가치를 제공하는 컨설팅 경험의 변화를 의미한다.

Amazon Bedrock AgentCore와 Claude가 기업들에게 생산 준비가 된 에이전틱 AI 시스템을 배포하여 최대 63%의 자율 문제 해결과 58% 빠른 응답 시간을 실현하고 있다. Claude의 선도적 AI 능력과 AgentCore의 기업급 인프라를 결합한 기술 기반을 탐구하며, 조직이 복잡한 운영 시스템을 처음부터 구축하는 대신 에이전트 논리에 집중할 수 있도록 도와준다.

Biomni의 전문 도구를 Amazon Bedrock AgentCore Gateway와 통합하여 생산 준비가 완료된 바이오의료 연구 에이전트를 구축하는 방법을 소개합니다. 이를 통해 연구자들은 안전하고 확장 가능한 인프라를 통해 30개 이상의 생체 의학 데이터베이스에 액세스할 수 있습니다. 이 구현은 연구 프로토 타입을 기업급 시스템으로 변환하는 방법을 보여주며, 과학적 재현 가능성을 위해 지속적인 메모리, 의미론적 도구 발견 및 포괄적인 관측 가능성을 갖추고 있습니다.

그래픽 사용자 인터페이스는 수십 년 동안 발전해 왔지만, 오늘날 사용자들은 점점 애플리케이션과 대화를 주고받기를 원합니다. 이 글에서는 루틴 작업 관리를 유동적이고 무선으로 전환하는 참조 애플리케이션인 스마트 할 일 앱에 진정한 음성 중심 경험을 추가하는 방법을 소개합니다.

Druva는 Amazon Web Services와 협력하여 고객 경험을 재정의하는 생성 모델 AI 기반의 멀티 에이전트 코파일럿을 개발 중이다.

이 블로그에서는 서로 다른 프레임워크로 구축된 AI 에이전트가 원활하게 협업할 수 있는 A2A 프로토콜을 어떻게 사용하는지를 보여줍니다. AgentCore 런타임에 A2A 서버를 배포하는 방법, 에이전트 검색 및 인증 구성, 사건 대응을 위한 실제 멀티 에이전트 시스템 구축 방법 등을 학습할 수 있습니다.

Amazon Bedrock에서 Cohere Embed 4 다중 모달 임베딩 모델을 완전히 관리되는 서버리스 옵션으로 제공한다. 기업 검색용 Embed 4의 이점과 독특한 기능에 대해 살펴보며 Strands Agents, S3 Vectors, Amazon Bedrock AgentCore와의 통합을 통해 강력한 agentic retrieval-augmented generation (RAG) 워크플로우를 구축하는 방법을 안내한다.

GxP 규정 준수를 위한 규제 환경이 AI의 고유한 특성을 고려하도록 발전하고 있습니다. 본문에서는 위험 기반 구현, 다양한 위험 수준에 따른 실용적 구현 고려 사항, AWS의 규정 준수를 위한 공유 책임 모델, 위험 완화 전략의 구체적 예시 등을 다룹니다.

본문에서는 다중 에이전트, 다중 모달 인공지능 시스템을 위한 네 가지 핵심 협업 패턴을 탐구하며 – 도구로서의 에이전트, 스왐 에이전트, 에이전트 그래프, 에이전트 워크플로우 – 각각을 언제, 어떻게 적용해야 하는지에 대해 오픈소스 AWS Strands Agents SDK와 아마존 노바 모델을 사용하는 방법에 대해 논의합니다.

VLMs를 세밀하게 조정하면 문서 이해 능력을 자동화하고 크게 향상시킬 수 있다. Focused fine-tuning을 사용하면 작은 다중 모달 모델이 훨씬 큰 모델과 효과적으로 경쟁할 수 있음을 보여준다 (Qwen2.5 VL 3B로 98% 정확도).

클라리오는 아마존 베드락과 기타 AWS 서비스를 활용하여 AI 솔루션을 구축하여 COA 인터뷰의 분석을 자동화하고 개선하는 방법을 소개합니다.
기업은 지능적인 AI 에이전트를 구동하기 위해 구조화된 데이터 저장소에 원활하게 접근해야 합니다. 그러나 이러한 자원이 여러 AWS 계정에 걸쳐있는 경우 통합 문제가 발생할 수 있습니다. 이 게시물에서는 Amazon Bedrock 에이전트를 서로 다른 AWS 계정에 있는 Amazon Redshift 클러스터의 지식베이스에 연결하는 실용적인 솔루션을 탐구합니다.

톰슨 로이터가 아마존 베드락과 같은 AWS 서비스로 구동되는 노코드 AI 솔루션인 오픈 아레나를 통해 핵심 비즈니스 사례를 해결하는 방법을 탐구합니다. 아키텍처 설계부터 사용 사례와 사용자 프로필까지 설명합니다.

Amazon Bedrock의 Custom Model Import에 구조화된 출력이 추가되었습니다. 구조화된 출력은 모델의 생성 프로세스를 실시간으로 제한하여 생성되는 모든 토큰이 사용자가 정의한 스키마와 일치하도록합니다. prompt-engineering 트릭이나 후속 처리 스크립트 대신 이제 추론 시에 직접 구조화된 출력을 생성할 수 있습니다.

Amazon Bedrock AgentCore Gateway는 MCP 도구 서버를 중앙 집중식으로 제공하여 에이전트가 도구를 발견, 액세스 및 호출할 수 있는 통합 인터페이스를 제공합니다. 새로운 기능으로 기존 MCP 서버를 AgentCore Gateway의 새로운 대상 유형으로 지원하여 여러 작업별 MCP 서버를 단일 관리 가능한 MCP 게이트웨이 인터페이스 뒤에 그룹화할 수 있습니다.

Amazon Search는 AWS Batch를 활용하여 GPU 인스턴스 활용을 최적화하여 SageMaker 학습 작업을 두 배로 늘렸습니다. P5, P4 등 GPU 가속 인스턴스 패밀리에서 기계 학습(ML) 학습 워크로드를 조정하는 관리 솔루션을 소개하며, 사용 사례 구현의 단계별 안내도 제공할 예정입니다.

Amazon Bedrock AgentCore Runtime은 안전하게 대규모로 효과적인 에이전트를 구축, 배포 및 운영할 수 있는 플랫폼이다. 에이전트 및 도구를 배포할 수 있는 저지연 서버리스 환경을 제공하며, 세션 격리를 제공하고 인기 있는 오픈소스 프레임워크를 지원한다.

Switchboard, MD는 임상 환경에서 전사 정확도와 비용 효율성을 확장하는 과제를 겪었고, 올바른 전사 솔루션을 선택하기 위한 평가 과정, Amazon Connect 및 Amazon Kinesis Video Streams를 사용한 기술 아키텍처를 구현한 경험을 살펴본다. 이를 통해 자동 EMR 매칭을 구현하고 의료 스태프가 환자 진료에 더 많은 시간을 할애할 수 있었던 인상적인 결과를 소개한다.

규제 산업에서는 각 AI 응답이 정책과 도메인 지식을 준수하는지를 수학적으로 확신해야 합니다. Amazon Bedrock Guardrails의 자동 추론 기능을 이용하여 신뢰성 있는 AI 시스템을 구축하는 방법에 대한 내용입니다.

2024년, AWS Generative AI 혁신 센터 내 Custom Model 프로그램을 시작하여 모델 맞춤화 및 최적화 과정 전반에서 포괄적인 지원을 제공했다. 이 프로그램은 지난 2년간 글로벌 기업 및 스타트업과 협력하여 법률, 금융 서비스, 헬스케어 및 생명 과학 분야를 포함한 다양한 산업에서 탁월한 결과를 이끌어냈다.

Clario는 아마존 베드락을 활용한 AI 솔루션을 개발하여 임상시험을 가속화했고, 소프트웨어 구성 및 아티팩트 생성을 단순화하는 혁신적인 솔루션에 집중하며 고품질의 임상 증거를 제공하고 있다.

Anthropic의 클로드 소네 4.5와 하이쿠 4.5가 아마존 베드락에서 출시되어, 생성 AI 모델의 혁신을 이루어냈다. 이러한 최첨단 모델은 복잡한 작업, 코딩, 기업 작업에서 뛰어난 성과를 보여주며 개발자들에게 향상된 기능을 제공한다.

AI 에이전트가 웹을 탐색할 때 CAPTCHA, 속도 제한, 차단 등을 만날 때가 있다. AWS가 이를 해결하기 위한 솔루션인 Amazon Bedrock AgentCore 브라우저의 Web Bot Auth 기능을 소개하고 있다.

이 포스트에서는 Amazon SageMaker AI에 NVIDIA의 Parakeet ASR 모델을 배포하는 방법을 탐구하며 비동기 추론 엔드포인트를 사용하여 대량의 오디오 데이터를 처리하는 확장 가능하고 비용 효율적인 파이프라인을 만드는 방법을 살펴봅니다. 이 솔루션은 최신 음성 인식 능력과 Lambda, S3, Bedrock 같은 AWS 관리형 서비스를 결합하여 오디오 파일을 자동으로 변환하고 지능적인 요약을 생성하여 기업이 고객 통화, 회의 녹음 및 기타 오디오 콘텐츠에서 가치 있는 통찰력을 대규모로 끌어낼 수 있습니다.

의료 및 생명 과학 분야에서 책임 있는 AI 시스템을 구축하기 위한 중요한 설계 고려 사항을 탐구하며, 건강한 AI 응용 프로그램의 안전하고 효과적인 보장을 위해 거버넌스 메커니즘, 투명성 아티팩트 및 보안 조치에 초점을 맞춥니다. 이 글은 오류와 편향과 같은 위험을 완화하기 위한 필수 정책들을 다루며, AI 개발 수명 주기 전반에 걸쳐 신뢰, 책임, 환자 안전을 증진합니다.