Flux tekst naar afbeelding AI-model
Innovatief nieuw AI-model om afbeeldingen te genereren op basis van tekst
Recentie Black Forest Labs heeft een set van tekst-naar-afbeelding AI-modellen gepubliceerd. Deze modellen worden gezegd te hebben veel hogere uitvoerkwaliteit. Laten we ze uitproberen
Dit is de afbeelding die Flux kan genereren in minder dan een minuut.
Installatie
Om het te installeren op je eigen PC heb je 16 GB VRAM op je GPU nodig voor FLUX.1-dev en 8 GB VRAM voor FLUX.1-schnell
-
Maak een account aan op de site huggingface.co als je dat nog niet hebt
-
Bekijk de modellen-uitgave en beschrijving https://blackforestlabs.ai/announcing-black-forest-labs/
-
Ga naar de pagina https://huggingface.co/black-forest-labs/FLUX.1-dev voor de dev en naar de pagina https://huggingface.co/black-forest-labs/FLUX.1-schnell voor schnell
-
Accepteer het licentieovereenkomst als je het eens bent
-
Maak een schrijf toegangstoken aan op de pagina https://huggingface.co/settings/tokens . Je hebt dit nodig om het model te halen.
-
Haal het model op. Ik haal dev op
git clone https://huggingface.co/black-forest-labs/FLUX.1-dev
- Wacht
Laat het draaien
Installeer diffusers, torch en andere geweldige python-bibliotheken.
pip install -U diffusers torch transformers protobuf accelerate sentencepiece
Maak een pythonbestand aan en kopieer- en plak:
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
# spaar wat VRAM door het model naar de CPU te verplaatsen. Verwijder dit als je genoeg GPU kracht hebt
pipe.enable_model_cpu_offload()
pipe.enable_sequential_cpu_offload()
prompt = "Een kat die een bord vasthoudt dat zegt hello world"
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=3.5,
num_inference_steps=50,
max_sequence_length=512,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")
Om meer te leren, raadpleeg de diffusers documentatie
Het resultaat
- Toen ik LLMs testte voor Perplexica
was één van de vragen die ik Perplexica stelde:
Wat was die vakbondsdemonstratie in Australië op 27-08-2024 over?
Laten we zien wat afbeelding Flux genereert voor het zeer vaag prompt
Een groep vakbondsdemonstranten steunen
hun vakbond in Melbourne
- En deze:
Mensrechten worden beïnvloed door de pandemie van COVID-19
- En mijn favoriete test
Een tram rijdt door de Melbourne City 's nachts
Al deze afbeeldingen zien er erg goed uit. Laten we fouten zoeken in de laatste:
- Het is een Melbourne stad. Trams en auto’s moeten op de linkerkant rijden.
- De tramkleur is niet juist. Goed, dat kan te picky zijn
- De voorkoplampen van de tram zijn van een rode kleur?
- De tram heeft geen bestuurder
- De route is erg vreemd
Over het algemeen hou ik van dit model!