본문 바로가기
웹툰AI

스테이블 디퓨전 웹UI에서 CFG Scale값 설정하기

by Kwoon 2024. 2. 22.
반응형

스테이블 디퓨전 웹UI를 사용하다 보면 여러 가지 설정해야 하는 것들이 많습니다. 오늘은 그중에 CFG Scale에 대해 알아 봅니다.

 

이미지 생성형 AI에서 프롬프트는 어떤 이미지를 만들도록 하는가에 대한 중요한 지시사항입니다. 하지만 프롬프트를 100% 정확하게 명령할 수 없는 점과, 제시한 단어에 대한 AI의 이해 정도에 따라 결과 이미지가 달라집니다. 때문에 이러한 예측할 수 없는 오류를 방지하기 위해 프롬프트의 적용 강도를 설정하여 AI로 하여금 유연한 이미지 생성이 가능하도록 해줍니다.

 

이러한 역할을 하는 기능이 CFG Scale입니다. 일반적으로 CFG Scale에 대해 이렇게 이해하시면 될 것입니다. CFG Scale는 1~30까지의 수치 사이에 값을 입력하여 그 강도를 반영하도록 하고 있습니다. 적절한 수치값은 본문의 마지막에 제시하고 있습니다. 

 

CFG Scale의 기능 설명을 보면 수치가 낮아질수록 프롬프트 반영률이 낮아지고 수치가 높아질수록 프롬프트 반영률이 높다고 합니다. 이것은 수치가 높으면 오류가 있는 프롬프트도 그대로 반영한다는 뜻이기도 합니다.

 

https://youtu.be/TiTY7MGxpC8?si=W-EPlSxZC2IjZO3r 

 

CFG Scale 테스트는 1부터 3 단위로 높여가며 테스트하였습니다. 15부터는 거의 대동소이하게 결과가 나오므로 단계를 건너뛰었습니다. 여러 번 다양한 프롬프트로 테스트하지 않는 한 정확한 결과를 얻을 수 없습니다만, 설명된 기능을 이해하는 정도의 테스트입니다.

 

대부분의 스테이블 디퓨전 사용자들은 6~7 정도의 CFG Scale 값을 설정하고 있다고 합니다. 또한 프롬프트에 과도한 단어의 나열에서 오는 오류를 줄이기 위해 중복되는 단어를 피하는 것도 중요하다고 합니다.

 

결과에 따라 피치 못하게 단어를 중복하여 사용한 경우 AI가 거를 수 있도록 CFG 수치를 낮추는 방법도 생각해 볼 수 있습니다. 사실은 사용자가 생성된 이미지의 결과값을 정확히 예측할 수 없다는 점에서 이러한 CFG 조절을 통해 원하는 결과에 근접하도록 유도하는 것도 좋은 방법이 될 수 있습니다.

테스트 결과 생성 이미지 좌로부터 1 ~ 30까지 결과 입니다.