강화 학습에서 보상 통합을 통한 이미지 생성 및 편집 개선 UniGen-1.5

Apple의 연구팀은 UniGen-1.5를 발표했다. 이는 이미지 이해, 생성, 편집을 위한 통합된 다중 모달 대형 언어 모델(MLLM)이다. UniGen을 기반으로 하되, 모델 아키텍처와 교육 파이프라인을 개선하여 이미지 생성 및 편집 능력을 강화했다. 특히, 이미지 생성과 편집을 둘 다 향상시키는 통합 강화 학습(RL) 전략을 제안했다. 이를 통해 이미지 생성과 편집 능력을 함께 향상시킬 수 있게 되었다. 추가로, 이미지 편집 성능을 더 향상시키기 위해 가벼운 편집 지시어 정렬 단계를 제안했다. 이를 통해 UniGen-1.5는 이미지 생성, 편집 분야에서의 혁신을 이끌어내고 있다.
출처: Apple
요약번역: 미주투데이 서현진 기자