다중 주파수 퓨전을 이용한 견고한 비디오 얼굴 위조 검출

현재의 얼굴 비디오 위조 감지기는 넓거나 이중 스트림 백본을 사용함. 하지만 우리는 두 가지 수작업 신호를 결합하는 경량화된 퓨전 모델을 활용하여 더 작은 모델로 더 높은 정확도를 달성할 수 있는 것을 보여줬다. Xception 기본 모델(21.9백만 파라미터)을 기반으로 LFWS와 LFWL 두 가지 감지기를 만들었다. LFWS는 저주파수 웨이블릿-노이즈 제거 특징(WDF)와 위상만을 가진 공간-위상 얕은 학습(SPSL) 맵을 결합하기 위해 1×1 컨볼루션을 추가하였고, LFWL은 WDF를 지역 이진 패턴(LBP)과 동일한 방식으로 병합했다. 이 추가 모듈은 292개의 파라미터만을 추가하여 전체 파라미터 수를 21.9백만으로 유지하였다.
출처: Apple
요약번역: 미주투데이 서현진 기자