테크트리(TechTree)

[무료, 로그인 없음] 고성능 이미지 생성 AI, 스테이블 디퓨전 웹에서 사용하기 본문

정보/소프트웨어

[무료, 로그인 없음] 고성능 이미지 생성 AI, 스테이블 디퓨전 웹에서 사용하기

Alternative_TechTree 2024. 4. 1. 12:53

 

안녕하세요, Alternative입니다.

 

생성형 AI의 발전은 끊임이 없고, 그만큼 인기도 식을 줄 모릅니다.

여러 생성형 AI 중 유명한 장르 중 하나인 '이미지 생성 AI'는 원하는 텍스트를 입력하면 그대로 이미지를 그려 주는 AI입니다.

가장 유명한 모델로 스테이블 디퓨전(Stable diffusion), 그리고 그걸 기반으로 하는 Dall-E가 있습니다.

 

최근에는 구글 검색만 해도 이런 이미지 생성 AI를 써볼 수 있는 웹사이트를 찾을 수 있습니다. 하지만 대부분은 수익화를 위해 처음 몇 번의 시도만 무료이고 그 이후로는 크레딧을 결제해야만 사용할 수 있는 시스템을 채택하고 있습니다. 이미지 생성의 특성상 내가 원하는 이미지를 정확히 생성하기 위해서 몇 번 정도 프롬프트 수정과 시도가 필요한데, 이 점을 악용한 것이죠. 게다가 이런 웹사이트의 경우 무료로 사용할 시 속도가 매우 느리고 광고도 많아 사용하기 불편하다는 단점도 있습니다.

 

이미지 생성을 위해 GPU, 전기 등 자원이 꽤 많이 들어가는 것을 생각하면 유료로 하는 것도 이해가 됩니다. 하지만 사용자 입장에서 몇 번 정도 시도해 보고 원하는 이미지 한두 개만 만들고 싶은데 결제를 해야 한다는 건 아무래도 심리적인 부담이 클 수밖에 없습니다.

 

그래서 이 글에서는 최신 생성형 AI를 무료로, 로그인 없이 웹브라우저에서 바로 여러 번 사용할 수 있는 방법을 소개해 드리려고 합니다.

 


 

HuggingFace

HuggingFace는 개발자들이 자신만의 생성형 AI를 만들고 테스트해볼 수 있는 개발자 허브입니다. 당연히 이미지 생성 AI도 많습니다.

개발자 공간이라는 특성답게, 각 기업이 내놓은 최신 모델들을 기반으로 빌드한 고성능의 AI가 많습니다. 따라서 흔한 웹사이트의 이미지 생성 AI 모델보다 눈에 띄게 성능이 좋고 빠르다는 장점이 있습니다. 따로 로그인 없이도 체험해볼 수 있다는 점도 굉장히 좋습니다.

아래에서 HuggingFace에 올라와 있는 이미지 생성 AI를 몇 개 소개해드리겠습니다.

 

DALL-E 3 XL

https://huggingface.co/spaces/ehristoforu/dalle-3-xl-lora-v2

 

DALLE 3 XL v2 - a Hugging Face Space by ehristoforu

Running on Zero

huggingface.co

우리가 가장 흔하게 들어본 DALL-E입니다. 이 개발자는 DALL-E 3를 포크해 자신만의 튜닝을 조금 추가한 것 같네요.

사용방법은 간단합니다. 텍스트 입력 창에 원하는 데로 설명한 뒤, Run을 누르면 됩니다.

원하는 사진이 나오면 우클릭한 후 이미지 저장을 누르면 됩니다.

 

SDXL-Lightning

https://fastsdxl.ai/

 

SDXL Lightning - by fal.ai

Lightning fast SDXL API demo by fal.ai

fastsdxl.ai

틱톡의 개발자인 ByteDance에서 내놓은 AI 모델입니다. 이름답게 매우 빠른, 거의 실시간에 가까운 이미지 생성 성능이 특징입니다.

마찬가지로 텍스트 입력 창에 원하는 데로 설명하면 바로 이미지가 생성됩니다.

 

Animagine-XL

https://huggingface.co/spaces/cagliostrolab/animagine-xl-3.1

 

Animagine XL 3.1 - a Hugging Face Space by cagliostrolab

Running on Zero

huggingface.co

일본 애니/만화 풍의 그림을 전문적으로 그리는 AI입니다. 여러 가지 세부 설정이 있어 원하는 데로 미세 조정을 할 수 있다는 점이 장점입니다.

Prompt에 원하는 데로 설명하고 Generate를 누르면 이미지가 생성됩니다.

 

 

이 외에도 HuggingFace의 'Text-to-Image' 모델 페이지를 살펴보면 다양한 모델들이 있으니 여러 가지를 직접 찾아 시도해 보는 것도 좋습니다.

https://huggingface.co/models?pipeline_tag=text-to-image

 

Models - Hugging Face

 

huggingface.co

 


 

사용 시 주의사항

  • 기본적으로 HuggingFace의 GPU 자원을 소모하는 것이기 때문에, 생성 횟수 제한이 있습니다. Animagine-XL 기준으로 약 100번 이미지를 생성했을 때 제한이 걸리기 시작하므로 넉넉하긴 하지만 무제한은 아닙니다. 제한에 걸리더라도 결제가 되거나 하진 않고, 이미지 생성 시 GPU 자원을 배정받을 때까지 30초-3분 정도 기다려야 합니다. 제한에 걸렸을 때 반나절 정도만 있으면 제한이 해제되니 다음날에 시도하면 됩니다. VPN 등을 통해 우회하는 방법도 있지만 보안 등의 문제로 추천드리진 않습니다.

생성 제한에 걸렸을 때 뜨는 메세지

  • AI 모델들은 전부 영어 기반입니다. 따라서 원하는 이미지를 설명할 때, 영어로 해야 가장 좋은 결과가 나옵니다. 대단한 영어 실력은 필요하지 않고, 영어 단어 단위로 원하는 것을 설명하면 됩니다. 예를 들어 스키 점프를 하는 강아지를 만화풍으로 그리고 싶으면 입력창에 Cartoon, Dog, Ski jump, Jumping, Snowy mountain 와 같이 쓰면 됩니다. 단어를 적당히 써 가며 제한을 둘수록 원하는 그림이 나올 확률이 높아집니다

Dall-E 3 XL 모델로 시도한 결과

  • 원하는 자세나 사물이 잘 나오지 않을 때가 있는데, 그럴 때는 동음이의어를 시도해 가며 하시면 됩니다. 예를 들어, 사람이 뒤돌아서 있는 모습을 그리고 싶으면 Looking at back 보다 Turned back가 더 좋은 결과를 보여 줍니다.

 


 

HuggingFace를 통해 이미지 생성 AI를 무료로 간단히 사용하는 법에 대해 알아보았습니다. 궁금해서 몇 번 시도해 보는 정도라면 HuggingFace의 기본 생성 횟수 제한 내에서도 충분히 잘 사용할 수 있을 것입니다. 만약 이 횟수 제한도 부족해진다면 HuggingFace에 회원가입해 GPU 자원을 결제하거나, 원하는 모델을 컴퓨터에 설치해 무제한으로 사용하는 방법도 있으니, 관심이 있다면 찾아보는 것도 좋겠습니다.

 

도움이 되셨기를 바랍니다!

Comments