플럭스 텍스트-이미지 AI 모델

놀랍도록 새로운 AI 모델로 텍스트에서 이미지 생성

Page content

최근 Black Forest Labs는 텍스트에서 이미지로 생성하는 AI 모델을 출시했습니다. 이 모델들은 매우 높은 출력 품질을 자랑한다고 알려져 있습니다. 시작해 보세요

이것은 Flux가 1분 이내에 생성할 수 있는 이미지입니다. Dolores

설치

FLUX.1-dev를 설치하려면 GPU에 16GB VRAM이 필요하고, FLUX.1-schnell은 8GB VRAM이 필요합니다.

아직 계정이 없다면 huggingface.co 사이트에 계정을 생성하세요
모델 발표 및 설명을 확인해 보세요 https://blackforestlabs.ai/announcing-black-forest-labs/
개발용 모델은 https://huggingface.co/black-forest-labs/FLUX.1-dev 페이지로 이동하고 schnell 모델은 https://huggingface.co/black-forest-labs/FLUX.1-schnell 페이지로 이동하세요
동의하시면 라이선스 계약을 수락하세요
https://huggingface.co/settings/tokens 페이지에서 Write access token을 생성하세요. 모델을 끌어오기 위해 필요합니다.
모델을 끌어오세요. 저는 dev 모델을 끌어옵니다

git clone https://huggingface.co/black-forest-labs/FLUX.1-dev

기다리세요

실행

diffusers, torch 및 기타 훌륭한 파이썬 라이브러리를 설치하세요.

pip install -U diffusers torch transformers protobuf accelerate sentencepiece

파이썬 파일을 생성하고 복사하여 붙여넣으세요:

import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
# GPU 메모리 절약을 위해 모델을 CPU로 이동. 충분한 GPU 성능이 있다면 이 줄을 제거하세요
pipe.enable_model_cpu_offload() 
pipe.enable_sequential_cpu_offload()

prompt = "A cat holding a sign that says hello world"
image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=3.5,
    num_inference_steps=50,
    max_sequence_length=512,
    generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")

더 자세한 내용은 diffusers 문서를 참조하세요

결과

Perplexica를 위해 LLM을 테스트할 때 Perplexica에게 던진 질문 중 하나는 2024년 8월 27일에 호주에서 있었던 tradies 시위는 무엇에 대해 있었나요?였습니다. 매우 모호한 프롬프트에 대해 Flux가 생성하는 이미지를 확인해 보세요

메لب에서 건설 노동자 시위대가 노동 조합을 지원하고 있습니다

topimage

그리고 이 이미지:

코로나19 팬데믹으로 인해 인권이 영향을 받고 있습니다

topimage

그리고 제 가장 좋아하는 테스트

밤에 멜버른 시티를 지나가는 트램

topimage

이 모든 이미지는 매우 잘 보입니다. 마지막 이미지에 대해 결함을 찾아보겠습니다:

이건 멜버른 시티입니다. 트램과 차량은 반드시 왼쪽 차선에서 주행해야 합니다.
트램의 색상이 올바르지 않습니다. 이건 너무 까다로운 요구일 수 있습니다.
트램의 전등이 붉은 색인가요?
트램에 운전자가 없습니다.
경로가 매우 이상합니다.

전체적으로 이 모델을 매우 좋아합니다!