फ्लक्स टेक्स्ट से इमेज AI मॉडल

अद्भुत नई AI मॉडल पाठ से चित्र उत्पन्न करने के लिए

Page content

हाल ही में ब्लैक फॉरेस्ट लैब्स ने एक सेट
टेक्स्ट-टू-इमेज आर्टिफिशियल इंटेलिजेंस मॉडल का प्रकाशन किया है।
इन मॉडलों के उत्पादन गुणवत्ता बहुत अधिक है।
इन्हें आज़माएं

यह फ्लक्स द्वारा एक मिनट से कम समय में उत्पन्न छवि है।
डोलोरेस

इस्तामल करें

अपने अपने पीसी पर इसकी इंस्टॉल करने के लिए आपको फ्लक्स.1-डेव के लिए अपने ग्राफिक्स कार्ड पर 16 जीबी वीआरएएम और फ्लक्स.1-स्च्नेल के लिए 8 जीबी वीआरएएम की आवश्यकता होगी।

  1. यदि आपके पास अभी तक huggingface.co पर खाता नहीं है तो खाता बनाएं
  2. मॉडल घोषणा और विवरण देखें https://blackforestlabs.ai/announcing-black-forest-labs/
  3. डेव के लिए पृष्ठ पर जाएं https://huggingface.co/black-forest-labs/FLUX.1-dev
    और स्च्नेल के लिए पृष्ठ पर जाएं https://huggingface.co/black-forest-labs/FLUX.1-schnell
  4. यदि आप सहमत हैं तो लाइसेंस समझौता स्वीकार करें
  5. खाता बनाएं https://huggingface.co/settings/tokens पर। आपको मॉडल खींचने के लिए इसकी आवश्यकता होगी।
  6. मॉडल खींचें। मैं डेव खींच रहा हूं
git clone https://huggingface.co/black-forest-labs/FLUX.1-dev
  1. इंतजार करें

इसे चलाएं

diffusers, torch और अन्य अच्छे अद्भुत पायथन पुस्तकालयों की इंस्टॉल करें।

pip install -U diffusers torch transformers protobuf accelerate sentencepiece

पायथन फ़ाइल बनाएं और कॉपी-पेस्ट करें:

import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
# वीआरएएम को कम करने के लिए मॉडल को सीपीयू पर अनलोड करें। यदि आपके पास पर्याप्त ग्राफिक्स कार्ड शक्ति है तो इसे हटा दें
pipe.enable_model_cpu_offload() 
pipe.enable_sequential_cpu_offload()

prompt = "एक कुत्ता एक बोर्ड धारण करता है जिस पर हेलो वर्ल्ड लिखा है"
image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=3.5,
    num_inference_steps=50,
    max_sequence_length=512,
    generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")

अधिक जानने के लिए diffusers दस्तावेज़ी के अनुसरण करें

परिणाम

  1. जब मैं पर्प्लेक्सिका के लिए एलएलएम का परीक्षण कर रहा था
    पर्प्लेक्सिका के लिए मैंने दिए गए प्रश्नों में से एक था 2024 के 27 अगस्त को ऑस्ट्रेलिया में ट्रैडीज के प्रदर्शन के बारे में क्या था?
    चलो देखते हैं कि फ्लक्स बहुत अमूल्य प्रोम्प्ट के लिए क्या छवि उत्पन्न करता है
एक ट्रैडी प्रदर्शनकारी समूह मेलबर्न में अपने ट्रेड यूनियन का समर्थन कर रहा है

topimage

  1. और यह एक:
कोविड-19 महामारी द्वारा मानव अधिकारों पर प्रभाव पड़ रहा है

topimage

  1. और मेरा पसंदीदा परीक्षण
एक ट्रैम मेलबर्न शहर में रात के समय चल रहा है

topimage

इन सभी छवियों का बहुत अच्छा दिखता है। अंतिम एक में दोष ढूंढें:

  • यह मेलबर्न शहर है। ट्रैम और कार बाएं ओर चलनी चाहिए।
  • ट्रैम के रंग सही नहीं है। ठीक हो सकता है कि यह बहुत अतिरिक्त है
  • ट्रैम के सामने के रोशनी लाल रंग के हैं?
  • ट्रैम में ड्राइवर नहीं है
  • मार्ग बहुत अजीब है

सामान्यतः मुझे इस मॉडल पसंद है!