نموذج فلوكس لتحويل النص إلى صورة
نموذج الذكاء الاصطناعي الرائع الجديد لتوليد صورة من النص
في الآونة الأخيرة أصدرت مختبرات Black Forest مجموعة من نماذج الذكاء الاصطناعي لتحويل النص إلى صورة. تُقال إن هذه النماذج تنتج صورًا ذات جودة أعلى بكثير. لنحاول استخدامها
هذا هو الصورة التي يمكن لـ Flux توليدها في أقل من دقيقة.
التثبيت
لتنصيبه على جهاز الكمبيوتر الخاص بك، ستحتاج إلى ١٦ جيجابايت من الذاكرة العشوائية المخصصة للرسومات (VRAM) على وحدة معالجة الرسومات (GPU) الخاصة بـ FLUX.1-dev و٨ جيجابايت من الذاكرة العشوائية المخصصة للرسومات (VRAM) الخاصة بـ FLUX.1-schnell
-
إنشاء حساب على موقع huggingface.co إذا لم يكن لديك حساب بعد
-
تحقق من إعلانات النماذج ووصفها https://blackforestlabs.ai/announcing-black-forest-labs/
-
انتقل إلى الصفحة https://huggingface.co/black-forest-labs/FLUX.1-dev للنسخة التجريبية وإلى الصفحة https://huggingface.co/black-forest-labs/FLUX.1-schnell للنسخة السريعة
-
قبول اتفاقية الترخيص إذا وافقت على الشروط
-
إنشاء مفتاح الوصول المكتوب على الصفحة https://huggingface.co/settings/tokens. ستحتاج إليه لسحب النموذج.
-
سحب النموذج. أنا أقوم بسحب النسخة التجريبية
git clone https://huggingface.co/black-forest-labs/FLUX.1-dev
- انتظر
تشغيله
تثبيت diffusers و torch و غيرها من المكتبات الرائعة لغة Python.
pip install -U diffusers torch transformers protobuf accelerate sentencepiece
أنشئ ملفًا بلغة Python وقم بنسخ ولصق الكود التالي:
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
# احجز بعض الذاكرة العشوائية المخصصة للرسومات (VRAM) عن طريق نقل النموذج إلى وحدة المعالجة المركزية. قم بإزالة هذا إذا كان لديك قوة كافية لوحدة المعالجة الرسومية (GPU)
pipe.enable_model_cpu_offload()
pipe.enable_sequential_cpu_offload()
prompt = "قطة تحمل لافتة تقول 'مرحبا بالعالم'"
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=3.5,
num_inference_steps=50,
max_sequence_length=512,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")
للمزيد من المعلومات، تحقق من توثيق diffusers
النتيجة
- عندما كنت أختبر نماذج الذكاء الاصطناعي الممتدة (LLMs) لـ Perplexica
كانت إحدى الأسئلة التي قدمتها لـ Perplexica هي
ما كانت تلك مظاهرة الحرفيين في أستراليا في ٢٧/٠٨/٢٠٢٤ عن؟
لنرى ما الصورة التي ينتجها Flux للطلب المبهم للغاية
مجموعة من المحتجين الحرفيين يدعمون
اتحادهم المهني في ملبورن
- وهذا واحد:
حقوق الإنسان تتأثر بوباء فيروس كورونا (كوفيد-١٩)
- واختباري المفضل
قطار يمر عبر مدينة ملبورن في الليل
كل هذه الصور تبدو جيدة جدًا. دعنا نجد أخطاء في الأخيرة:
- إنها مدينة ملبورن. يجب أن تسير الحافلات والسيارات على الجانب الأيسر.
- لون الحافلة غير صحيح. حسنًا، قد يكون ذلك مبالغة
- مصابيح الأمامية للحافلة من اللون الأحمر؟
- الحافلة لا تحتوي على سائق
- المسار غريب جدًا
بشكل عام أحب هذا النموذج!