Flux文本到图像AI模型
令人惊叹的新AI模型可根据文本生成图像
目录
最近,Black Forest Labs 发布了一组
文本到图像AI模型。
这些模型据说具有更高的输出质量。
让我们试试看
这是Flux在一分钟内可以生成的图像。
安装
要在自己的PC上安装,您需要为FLUX.1-dev准备16GB显存,为FLUX.1-schnell准备8GB显存
-
如果还没有Hugging Face账户,请先在https://huggingface.co创建账户
-
查看模型的公告和描述 https://blackforestlabs.ai/announcing-black-forest-labs/
-
访问开发版页面 https://huggingface.co/black-forest-labs/FLUX.1-dev
和快速版页面 https://huggingface.co/black-forest-labs/FLUX.1-schnell -
如果您同意,请接受许可协议
-
在https://huggingface.co/settings/tokens页面创建写入访问令牌。您需要它来拉取模型。
-
拉取模型。我正在拉取开发版
git clone https://huggingface.co/black-forest-labs/FLUX.1-dev
- 等待
运行
安装diffusers、torch和其他优秀的Python库
pip install -U diffusers torch transformers protobuf accelerate sentencepiece
创建Python文件并复制粘贴以下代码:
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
# 通过将模型卸载到CPU来节省一些显存。如果您有足够的GPU功率,可以删除此行
pipe.enable_model_cpu_offload()
pipe.enable_sequential_cpu_offload()
prompt = "一只拿着写着hello world的标语牌的猫"
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=3.5,
num_inference_steps=50,
max_sequence_length=512,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")
如需了解更多,请查看diffusers文档
结果
- 在为Perplexica测试LLMs时,
我给Perplexica的问题之一是
2024年8月27日澳大利亚的工人抗议是关于什么的?
让我们看看Flux对这个非常模糊的提示生成什么图像
一群工人抗议者正在支持
他们在墨尔本的工会
- 这个:
人权正受到新冠疫情的影响
- 我最喜欢测试:
一列电车在墨尔本市区的夜晚行驶
这些图像看起来都非常不错。让我们找找最后一个图像的缺陷:
- 这是墨尔本市区。电车和汽车必须在左侧行驶。
- 电车的颜色不正确。好吧,这可能太挑剔了
- 电车的前灯是红色的?
- 电车没有司机
- 路线非常奇怪
总体而言,我喜欢这个模型!