फ्लक्स टेक्स्ट से इमेज AI मॉडल
अद्भुत नई AI मॉडल पाठ से चित्र उत्पन्न करने के लिए
Page content
हाल ही में ब्लैक फॉरेस्ट लैब्स ने एक सेट
टेक्स्ट-टू-इमेज आर्टिफिशियल इंटेलिजेंस मॉडल का प्रकाशन किया है।
इन मॉडलों के उत्पादन गुणवत्ता बहुत अधिक है।
इन्हें आज़माएं
यह फ्लक्स द्वारा एक मिनट से कम समय में उत्पन्न छवि है।
इस्तामल करें
अपने अपने पीसी पर इसकी इंस्टॉल करने के लिए आपको फ्लक्स.1-डेव के लिए अपने ग्राफिक्स कार्ड पर 16 जीबी वीआरएएम और फ्लक्स.1-स्च्नेल के लिए 8 जीबी वीआरएएम की आवश्यकता होगी।
- यदि आपके पास अभी तक huggingface.co पर खाता नहीं है तो खाता बनाएं
- मॉडल घोषणा और विवरण देखें https://blackforestlabs.ai/announcing-black-forest-labs/
- डेव के लिए पृष्ठ पर जाएं https://huggingface.co/black-forest-labs/FLUX.1-dev
और स्च्नेल के लिए पृष्ठ पर जाएं https://huggingface.co/black-forest-labs/FLUX.1-schnell - यदि आप सहमत हैं तो लाइसेंस समझौता स्वीकार करें
- खाता बनाएं https://huggingface.co/settings/tokens पर। आपको मॉडल खींचने के लिए इसकी आवश्यकता होगी।
- मॉडल खींचें। मैं डेव खींच रहा हूं
git clone https://huggingface.co/black-forest-labs/FLUX.1-dev
- इंतजार करें
इसे चलाएं
diffusers, torch और अन्य अच्छे अद्भुत पायथन पुस्तकालयों की इंस्टॉल करें।
pip install -U diffusers torch transformers protobuf accelerate sentencepiece
पायथन फ़ाइल बनाएं और कॉपी-पेस्ट करें:
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
# वीआरएएम को कम करने के लिए मॉडल को सीपीयू पर अनलोड करें। यदि आपके पास पर्याप्त ग्राफिक्स कार्ड शक्ति है तो इसे हटा दें
pipe.enable_model_cpu_offload()
pipe.enable_sequential_cpu_offload()
prompt = "एक कुत्ता एक बोर्ड धारण करता है जिस पर हेलो वर्ल्ड लिखा है"
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=3.5,
num_inference_steps=50,
max_sequence_length=512,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")
अधिक जानने के लिए diffusers दस्तावेज़ी के अनुसरण करें
परिणाम
- जब मैं पर्प्लेक्सिका के लिए एलएलएम का परीक्षण कर रहा था
पर्प्लेक्सिका के लिए मैंने दिए गए प्रश्नों में से एक था2024 के 27 अगस्त को ऑस्ट्रेलिया में ट्रैडीज के प्रदर्शन के बारे में क्या था?
चलो देखते हैं कि फ्लक्स बहुत अमूल्य प्रोम्प्ट के लिए क्या छवि उत्पन्न करता है
एक ट्रैडी प्रदर्शनकारी समूह मेलबर्न में अपने ट्रेड यूनियन का समर्थन कर रहा है
- और यह एक:
कोविड-19 महामारी द्वारा मानव अधिकारों पर प्रभाव पड़ रहा है
- और मेरा पसंदीदा परीक्षण
एक ट्रैम मेलबर्न शहर में रात के समय चल रहा है
इन सभी छवियों का बहुत अच्छा दिखता है। अंतिम एक में दोष ढूंढें:
- यह मेलबर्न शहर है। ट्रैम और कार बाएं ओर चलनी चाहिए।
- ट्रैम के रंग सही नहीं है। ठीक हो सकता है कि यह बहुत अतिरिक्त है
- ट्रैम के सामने के रोशनी लाल रंग के हैं?
- ट्रैम में ड्राइवर नहीं है
- मार्ग बहुत अजीब है
सामान्यतः मुझे इस मॉडल पसंद है!