플럭스 텍스트-이미지 AI 모델

놀랍도록 새로운 AI 모델로 텍스트에서 이미지 생성

Page content

최근 Black Forest Labs는 텍스트에서 이미지로 생성하는 AI 모델을 출시했습니다. 이 모델들은 매우 높은 출력 품질을 자랑한다고 알려져 있습니다. 시작해 보세요

이것은 Flux가 1분 이내에 생성할 수 있는 이미지입니다. Dolores

설치

FLUX.1-dev를 설치하려면 GPU에 16GB VRAM이 필요하고, FLUX.1-schnell은 8GB VRAM이 필요합니다.

  1. 아직 계정이 없다면 huggingface.co 사이트에 계정을 생성하세요

  2. 모델 발표 및 설명을 확인해 보세요 https://blackforestlabs.ai/announcing-black-forest-labs/

  3. 개발용 모델은 https://huggingface.co/black-forest-labs/FLUX.1-dev 페이지로 이동하고 schnell 모델은 https://huggingface.co/black-forest-labs/FLUX.1-schnell 페이지로 이동하세요

  4. 동의하시면 라이선스 계약을 수락하세요

  5. https://huggingface.co/settings/tokens 페이지에서 Write access token을 생성하세요. 모델을 끌어오기 위해 필요합니다.

  6. 모델을 끌어오세요. 저는 dev 모델을 끌어옵니다

git clone https://huggingface.co/black-forest-labs/FLUX.1-dev
  1. 기다리세요

실행

diffusers, torch 및 기타 훌륭한 파이썬 라이브러리를 설치하세요.

pip install -U diffusers torch transformers protobuf accelerate sentencepiece

파이썬 파일을 생성하고 복사하여 붙여넣으세요:

import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
# GPU 메모리 절약을 위해 모델을 CPU로 이동. 충분한 GPU 성능이 있다면 이 줄을 제거하세요
pipe.enable_model_cpu_offload() 
pipe.enable_sequential_cpu_offload()

prompt = "A cat holding a sign that says hello world"
image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=3.5,
    num_inference_steps=50,
    max_sequence_length=512,
    generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")

더 자세한 내용은 diffusers 문서를 참조하세요

결과

  1. Perplexica를 위해 LLM을 테스트할 때 Perplexica에게 던진 질문 중 하나는 2024년 8월 27일에 호주에서 있었던 tradies 시위는 무엇에 대해 있었나요?였습니다. 매우 모호한 프롬프트에 대해 Flux가 생성하는 이미지를 확인해 보세요
메لب에서 건설 노동자 시위대가 노동 조합을 지원하고 있습니다

topimage

  1. 그리고 이 이미지:
코로나19 팬데믹으로 인해 인권이 영향을 받고 있습니다

topimage

  1. 그리고 제 가장 좋아하는 테스트
밤에 멜버른 시티를 지나가는 트램

topimage

이 모든 이미지는 매우 잘 보입니다. 마지막 이미지에 대해 결함을 찾아보겠습니다:

  • 이건 멜버른 시티입니다. 트램과 차량은 반드시 왼쪽 차선에서 주행해야 합니다.
  • 트램의 색상이 올바르지 않습니다. 이건 너무 까다로운 요구일 수 있습니다.
  • 트램의 전등이 붉은 색인가요?
  • 트램에 운전자가 없습니다.
  • 경로가 매우 이상합니다.

전체적으로 이 모델을 매우 좋아합니다!