OpenAI, 배포 시뮬레이션 도입으로 에이전틱 코딩의 위험 평가 확대

OpenAI는 2026년 6월 16일 배포 시뮬레이션을 도입했다고 발표했습니다. 이 방법은 새로운 후보 모델이 출시되기 전에 과거의 대화를 재생하여, 그 결과를 평가함으로써 배포 시 원치 않는 행동의 비율을 추정하는 방식입니다. 이 과정에서 모델의 응답을 평가하여, 보고된 바에 따르면 1.5배의 중앙 곱셈 오류가 발생한다고 합니다. 이러한 배포 시뮬레이션은 에이전틱 코딩의 위험을 사전에 평가하는 데 도움을 줄 것으로 기대됩니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자