NVIDIA garak 튜토리얼: 맞춤형 프로브와 탐지기를 활용한 방어적 LLM 레드팀 워크플로우 구축
NVIDIA garak 튜토리얼에서는 방어적 LLM 레드팀을 위한 종합적인 워크플로우 구축 방법을 소개합니다. 이 과정은 설정 단계에서 시작하여 플러그인 탐색, 드라이 런, Hugging Face 생성기를 이용한 실제 모델 스캔, 다중 프로브 평가까지 포함됩니다. 이후에는 안전 점수와 공격 성공률을 분석하고, 플래그가 지정된 출력을 점검하며, 맞춤형 프로브와 탐지기로 garak을 확장하는 방법을 다룹니다. 마지막으로, 결과를 AVID 형식으로 내보내어 구조화된 취약성을 기록하는 방법도 설명됩니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자