Flux文本到图像AI模型

令人惊叹的新AI模型可根据文本生成图像

目录

最近,Black Forest Labs 发布了一组
文本到图像AI模型
这些模型据说具有更高的输出质量。
让我们试试看

这是Flux在一分钟内可以生成的图像。
Dolores

安装

要在自己的PC上安装,您需要为FLUX.1-dev准备16GB显存,为FLUX.1-schnell准备8GB显存

  1. 如果还没有Hugging Face账户,请先在https://huggingface.co创建账户

  2. 查看模型的公告和描述 https://blackforestlabs.ai/announcing-black-forest-labs/

  3. 访问开发版页面 https://huggingface.co/black-forest-labs/FLUX.1-dev
    和快速版页面 https://huggingface.co/black-forest-labs/FLUX.1-schnell

  4. 如果您同意,请接受许可协议

  5. https://huggingface.co/settings/tokens页面创建写入访问令牌。您需要它来拉取模型。

  6. 拉取模型。我正在拉取开发版

git clone https://huggingface.co/black-forest-labs/FLUX.1-dev
  1. 等待

运行

安装diffusers、torch和其他优秀的Python库

pip install -U diffusers torch transformers protobuf accelerate sentencepiece

创建Python文件并复制粘贴以下代码:

import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
# 通过将模型卸载到CPU来节省一些显存。如果您有足够的GPU功率,可以删除此行
pipe.enable_model_cpu_offload() 
pipe.enable_sequential_cpu_offload()

prompt = "一只拿着写着hello world的标语牌的猫"
image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=3.5,
    num_inference_steps=50,
    max_sequence_length=512,
    generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")

如需了解更多,请查看diffusers文档

结果

  1. 在为Perplexica测试LLMs时,
    我给Perplexica的问题之一是
    2024年8月27日澳大利亚的工人抗议是关于什么的?
    让我们看看Flux对这个非常模糊的提示生成什么图像
一群工人抗议者正在支持  
他们在墨尔本的工会

topimage

  1. 这个:
人权正受到新冠疫情的影响

topimage

  1. 我最喜欢测试:
一列电车在墨尔本市区的夜晚行驶

topimage

这些图像看起来都非常不错。让我们找找最后一个图像的缺陷:

  • 这是墨尔本市区。电车和汽车必须在左侧行驶。
  • 电车的颜色不正确。好吧,这可能太挑剔了
  • 电车的前灯是红色的?
  • 电车没有司机
  • 路线非常奇怪

总体而言,我喜欢这个模型!