Flux tekst naar afbeelding AI-model

Innovatief nieuw AI-model om afbeeldingen te genereren op basis van tekst

Inhoud

Recentie Black Forest Labs heeft een set van tekst-naar-afbeelding AI-modellen gepubliceerd. Deze modellen worden gezegd te hebben veel hogere uitvoerkwaliteit. Laten we ze uitproberen

Dit is de afbeelding die Flux kan genereren in minder dan een minuut. Dolores

Installatie

Om het te installeren op je eigen PC heb je 16 GB VRAM op je GPU nodig voor FLUX.1-dev en 8 GB VRAM voor FLUX.1-schnell

  1. Maak een account aan op de site huggingface.co als je dat nog niet hebt

  2. Bekijk de modellen-uitgave en beschrijving https://blackforestlabs.ai/announcing-black-forest-labs/

  3. Ga naar de pagina https://huggingface.co/black-forest-labs/FLUX.1-dev voor de dev en naar de pagina https://huggingface.co/black-forest-labs/FLUX.1-schnell voor schnell

  4. Accepteer het licentieovereenkomst als je het eens bent

  5. Maak een schrijf toegangstoken aan op de pagina https://huggingface.co/settings/tokens . Je hebt dit nodig om het model te halen.

  6. Haal het model op. Ik haal dev op

git clone https://huggingface.co/black-forest-labs/FLUX.1-dev
  1. Wacht

Laat het draaien

Installeer diffusers, torch en andere geweldige python-bibliotheken.

pip install -U diffusers torch transformers protobuf accelerate sentencepiece

Maak een pythonbestand aan en kopieer- en plak:

import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
# spaar wat VRAM door het model naar de CPU te verplaatsen. Verwijder dit als je genoeg GPU kracht hebt
pipe.enable_model_cpu_offload() 
pipe.enable_sequential_cpu_offload()

prompt = "Een kat die een bord vasthoudt dat zegt hello world"
image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=3.5,
    num_inference_steps=50,
    max_sequence_length=512,
    generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")

Om meer te leren, raadpleeg de diffusers documentatie

Het resultaat

  1. Toen ik LLMs testte voor Perplexica was één van de vragen die ik Perplexica stelde: Wat was die vakbondsdemonstratie in Australië op 27-08-2024 over? Laten we zien wat afbeelding Flux genereert voor het zeer vaag prompt
Een groep vakbondsdemonstranten steunen
hun vakbond in Melbourne

topimage

  1. En deze:
Mensrechten worden beïnvloed door de pandemie van COVID-19

topimage

  1. En mijn favoriete test
Een tram rijdt door de Melbourne City 's nachts

topimage

Al deze afbeeldingen zien er erg goed uit. Laten we fouten zoeken in de laatste:

  • Het is een Melbourne stad. Trams en auto’s moeten op de linkerkant rijden.
  • De tramkleur is niet juist. Goed, dat kan te picky zijn
  • De voorkoplampen van de tram zijn van een rode kleur?
  • De tram heeft geen bestuurder
  • De route is erg vreemd

Over het algemeen hou ik van dit model!