Model AI Flux teks ke gambar

Model AI baru yang menakjubkan untuk menghasilkan gambar dari teks

Konten Halaman

Baru-baru ini Black Forest Labs mempublikasikan serangkaian model AI teks-ke-gambar yang dikatakan memiliki kualitas output yang jauh lebih tinggi. Mari coba model tersebut

Ini adalah gambar yang dapat dihasilkan Flux dalam waktu kurang dari satu menit. Dolores

Pemasangan

Untuk memasangnya di PC Anda sendiri, Anda akan membutuhkan 16GB VRAM di GPU Anda untuk FLUX.1-dev dan 8 GB VRAM untuk FLUX.1-schnell

  1. Buat akun di situs huggingface.co jika Anda belum memiliki akun

  2. Lihat pengumuman dan deskripsi model di https://blackforestlabs.ai/announcing-black-forest-labs/

  3. Kunjungi halaman https://huggingface.co/black-forest-labs/FLUX.1-dev untuk versi dev dan halaman https://huggingface.co/black-forest-labs/FLUX.1-schnell untuk versi schnell

  4. Terima perjanjian lisensi jika Anda setuju

  5. Buat token akses tulis di halaman https://huggingface.co/settings/tokens . Anda membutuhkannya untuk menarik model.

  6. Tarik model. Saya sedang menarik versi dev

git clone https://huggingface.co/black-forest-labs/FLUX.1-dev
  1. Tunggu

Jalankan

Pasang diffusers, torch, dan perpustakaan python lainnya yang hebat.

pip install -U diffusers torch transformers protobuf accelerate sentencepiece

Buat file python dan salin-paste:

import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
#hemat beberapa VRAM dengan mengalihkan model ke CPU. Hapus ini jika Anda memiliki cukup daya GPU
pipe.enable_model_cpu_offload() 
pipe.enable_sequential_cpu_offload()

prompt = "Seekor kucing memegang sebuah papan tanda yang bertuliskan hello world"
image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=3.5,
    num_inference_steps=50,
    max_sequence_length=512,
    generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")

Untuk mempelajari lebih lanjut, lihat dokumentasi diffusers

Hasilnya

  1. Ketika saya menguji LLM untuk Perplexica salah satu pertanyaan yang saya berikan ke Perplexica adalah Apa yang terjadi pada protes tradie di Australia pada 27/08/2024? Mari lihat gambar apa yang dihasilkan Flux untuk prompt yang sangat ambigu ini
Kelompok demonstran tradie mendukung
serikat pekerja mereka di Melbourne

topimage

  1. Dan ini satu lagi:
Hak asasi manusia terdampak oleh pandemi COVID-19

topimage

  1. Dan uji coba favorit saya
Sebuah kereta api berjalan melalui kota Melbourne di malam hari

topimage

Semua gambar ini terlihat sangat bagus. Mari cari kelemahan pada yang terakhir:

  • Ini adalah kota Melbourne. Kereta api dan mobil harus berjalan di sisi kiri.
  • Warna kereta api tidak tepat. Baik, mungkin terlalu detail
  • Lampu depan kereta api berwarna merah?
  • Kereta api tidak memiliki pengemudi
  • Rute sangat aneh

Secara keseluruhan saya menyukai model ini!