Model AI Flux teks ke gambar
Model AI baru yang menakjubkan untuk menghasilkan gambar dari teks
Baru-baru ini Black Forest Labs mempublikasikan serangkaian model AI teks-ke-gambar yang dikatakan memiliki kualitas output yang jauh lebih tinggi. Mari coba model tersebut
Ini adalah gambar yang dapat dihasilkan Flux dalam waktu kurang dari satu menit.
Pemasangan
Untuk memasangnya di PC Anda sendiri, Anda akan membutuhkan 16GB VRAM di GPU Anda untuk FLUX.1-dev dan 8 GB VRAM untuk FLUX.1-schnell
-
Buat akun di situs huggingface.co jika Anda belum memiliki akun
-
Lihat pengumuman dan deskripsi model di https://blackforestlabs.ai/announcing-black-forest-labs/
-
Kunjungi halaman https://huggingface.co/black-forest-labs/FLUX.1-dev untuk versi dev dan halaman https://huggingface.co/black-forest-labs/FLUX.1-schnell untuk versi schnell
-
Terima perjanjian lisensi jika Anda setuju
-
Buat token akses tulis di halaman https://huggingface.co/settings/tokens . Anda membutuhkannya untuk menarik model.
-
Tarik model. Saya sedang menarik versi dev
git clone https://huggingface.co/black-forest-labs/FLUX.1-dev
- Tunggu
Jalankan
Pasang diffusers, torch, dan perpustakaan python lainnya yang hebat.
pip install -U diffusers torch transformers protobuf accelerate sentencepiece
Buat file python dan salin-paste:
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
#hemat beberapa VRAM dengan mengalihkan model ke CPU. Hapus ini jika Anda memiliki cukup daya GPU
pipe.enable_model_cpu_offload()
pipe.enable_sequential_cpu_offload()
prompt = "Seekor kucing memegang sebuah papan tanda yang bertuliskan hello world"
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=3.5,
num_inference_steps=50,
max_sequence_length=512,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")
Untuk mempelajari lebih lanjut, lihat dokumentasi diffusers
Hasilnya
- Ketika saya menguji LLM untuk Perplexica
salah satu pertanyaan yang saya berikan ke Perplexica adalah
Apa yang terjadi pada protes tradie di Australia pada 27/08/2024?
Mari lihat gambar apa yang dihasilkan Flux untuk prompt yang sangat ambigu ini
Kelompok demonstran tradie mendukung
serikat pekerja mereka di Melbourne
- Dan ini satu lagi:
Hak asasi manusia terdampak oleh pandemi COVID-19
- Dan uji coba favorit saya
Sebuah kereta api berjalan melalui kota Melbourne di malam hari
Semua gambar ini terlihat sangat bagus. Mari cari kelemahan pada yang terakhir:
- Ini adalah kota Melbourne. Kereta api dan mobil harus berjalan di sisi kiri.
- Warna kereta api tidak tepat. Baik, mungkin terlalu detail
- Lampu depan kereta api berwarna merah?
- Kereta api tidak memiliki pengemudi
- Rute sangat aneh
Secara keseluruhan saya menyukai model ini!