플럭스 텍스트-이미지 AI 모델
놀랍도록 새로운 AI 모델로 텍스트에서 이미지 생성
최근 Black Forest Labs는 텍스트에서 이미지로 생성하는 AI 모델을 출시했습니다. 이 모델들은 매우 높은 출력 품질을 자랑한다고 알려져 있습니다. 시작해 보세요
이것은 Flux가 1분 이내에 생성할 수 있는 이미지입니다.
설치
FLUX.1-dev를 설치하려면 GPU에 16GB VRAM이 필요하고, FLUX.1-schnell은 8GB VRAM이 필요합니다.
-
아직 계정이 없다면 huggingface.co 사이트에 계정을 생성하세요
-
모델 발표 및 설명을 확인해 보세요 https://blackforestlabs.ai/announcing-black-forest-labs/
-
개발용 모델은 https://huggingface.co/black-forest-labs/FLUX.1-dev 페이지로 이동하고 schnell 모델은 https://huggingface.co/black-forest-labs/FLUX.1-schnell 페이지로 이동하세요
-
동의하시면 라이선스 계약을 수락하세요
-
https://huggingface.co/settings/tokens 페이지에서 Write access token을 생성하세요. 모델을 끌어오기 위해 필요합니다.
-
모델을 끌어오세요. 저는 dev 모델을 끌어옵니다
git clone https://huggingface.co/black-forest-labs/FLUX.1-dev
- 기다리세요
실행
diffusers, torch 및 기타 훌륭한 파이썬 라이브러리를 설치하세요.
pip install -U diffusers torch transformers protobuf accelerate sentencepiece
파이썬 파일을 생성하고 복사하여 붙여넣으세요:
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
# GPU 메모리 절약을 위해 모델을 CPU로 이동. 충분한 GPU 성능이 있다면 이 줄을 제거하세요
pipe.enable_model_cpu_offload()
pipe.enable_sequential_cpu_offload()
prompt = "A cat holding a sign that says hello world"
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=3.5,
num_inference_steps=50,
max_sequence_length=512,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")
더 자세한 내용은 diffusers 문서를 참조하세요
결과
- Perplexica를 위해 LLM을 테스트할 때
Perplexica에게 던진 질문 중 하나는
2024년 8월 27일에 호주에서 있었던 tradies 시위는 무엇에 대해 있었나요?
였습니다. 매우 모호한 프롬프트에 대해 Flux가 생성하는 이미지를 확인해 보세요
메لب에서 건설 노동자 시위대가 노동 조합을 지원하고 있습니다
- 그리고 이 이미지:
코로나19 팬데믹으로 인해 인권이 영향을 받고 있습니다
- 그리고 제 가장 좋아하는 테스트
밤에 멜버른 시티를 지나가는 트램
이 모든 이미지는 매우 잘 보입니다. 마지막 이미지에 대해 결함을 찾아보겠습니다:
- 이건 멜버른 시티입니다. 트램과 차량은 반드시 왼쪽 차선에서 주행해야 합니다.
- 트램의 색상이 올바르지 않습니다. 이건 너무 까다로운 요구일 수 있습니다.
- 트램의 전등이 붉은 색인가요?
- 트램에 운전자가 없습니다.
- 경로가 매우 이상합니다.
전체적으로 이 모델을 매우 좋아합니다!