训练图像模型以生成定制 AI 照片曾是一个漫长而繁琐的过程。您需要多张高质量图像,通常需要等待数小时,直到您的精细调整模型准备就绪。
但现在情况已经改变了。
如今,微调图像模型变得更加高效。使用 Black Forest Labs 最强大的开放权重模型,您现在可以仅使用一张图像进行训练。训练速度也有了显著提高——曾经需要数小时的工作现在仅需几分钟即可完成。
现在,您可以在最受欢迎的图像和视频生成平台之一 RenderNet 上使用单个图像来训练 Flux 模型。
在本文中,我将为您介绍使用单个参考图像微调 flux 模型并生成定制图像的过程。
让我们开始吧。
什么是 RenderNet?
RenderNet 是一个以其 AI 影响者 或虚拟角色生成而闻名的生成式 AI 平台。通过其 Character Wizard,您可以快速设计符合您需求的定制 AI 角色。创建完成后,您可以使用提示和 PoseControl 功能精确微调其姿势和构图。
最近,RenderNet 添加了对 Flux 模型的支持,这是许多粉丝(包括我在内)期待已久的功能。
什么是 Flux?
Flux 是来自 Black Forest Labs 的一组强大模型,将文本到图像生成推向了新的高度。它在场景中的 图像细节、准确性、风格多样性 和 复杂性 方面树立了新的标准。
以下是 Flux 的三个版本:
-
Flux.1 Pro:性能最佳的模型,提供优质图像,具有出色的细节、提示准确性和多样的风格。
-
Flux.1 Dev:这个版本是开放权重的,适用于非商业用途。它基于 Flux.1 Pro,提供类似质量但效率更高,非常适合研究和开发。
-
Flux.1 Schnell:最快的模型,专为个人使用和本地开发而设计。根据 Apache 2.0 许可证 免费提供,快速运行而不会降低质量。
所有 Flux 模型都使用先进的 AI 技术,拥有 120 亿参数。它们通过使用一种称为 流匹配 的方法改进了旧模型的训练方式。
它们还包括 旋转位置嵌入 和 并行注意力层 来更好地利用硬件,使模型更快速、更高效。
如何创建角色
在 RenderNet 上开始使用 Flux 是简单且用户友好的。首先,访问 网站 并创建一个免费帐户。
Flux 方便地放置在首页。要开始,只需点击“尝试 Flux”按钮,将显示一个模态窗口。
现在,您有两个选项:选择预设角色或上传您自己的照片。如果您希望创建具有个人特色的独特作品,我建议使用您自己的图像。
返回首页并点击“创建新角色”按钮。
上传您的肖像照片。确保面部和头发清晰可见。系统需要这种清晰度以获得更好的生成图像结果。
根据需要裁剪照片以便聚焦在面部上。裁剪的准确性会影响最终输出,因此请注意面部和头发的清晰程度。
点击“下一步”按钮。这将带您进入一个自定义窗口,您可以在其中调整角色的风格、性别、年龄和头发颜色/风格。这些参数允许您根据您的创意需求微调最终结果。
最后,给您的角色起一个名字。这一步很重要,因为该名称将作为 Flux 模型生成图像时的“触发词”。
完成后,您的新角色将被添加到首页的角色列表中,随时可供您在图像生成中使用。
太棒了。现在,让我们尝试使用它来生成我们的定制图像。
使用 Flux 创建定制图像
图像生成仪表板非常直观,即使对于初学者也是如此。在仪表板底部,您会注意到一个提示字段,您可以在其中输入要生成的图像描述。这就是魔法发生的地方!
假设您希望您的角色在特定环境中摆姿势。这里有一个例子:
提示:@Jade 在纽约街头摆姿势
设置好提示后,点击“生成”按钮,几秒钟后,系统将处理并生成图像。
很酷,对吧?
结果令人印象深刻 - Jade 的面部、头发和身体与输入图像保持非常相似。然而,我注意到,虽然整体逼真度很高,但在某些细节方面仍有改进的空间。皮肤质地、光线和背景融合有时可能感觉有些不协调,特别是与像 Midjourney 这样的高端模型相比。
您可能已经注意到,提示中包含了名称“@Jade”。这一点至关重要,因为它充当了 Flux 模型的 触发词。
但是触发词到底是什么?
简单来说,触发词是在模型训练阶段与特定对象、风格或概念相关联的关键词。在这种情况下,“Jade”指的是模型微调的特定角色或外观。当您在提示中包含这个触发词时,模型知道要使用该角色进行生成。
这就是为什么生成的图像在不同场景中保持一致性外观的原因之一。去掉触发词,您将得到完全不同的图像。
让我们尝试更多例子。
提示:@Jade 穿着羽绒服站在珠穆朗玛峰顶上
我对文本提示与生成图像之间的连贯性水平感到印象深刻。Flux 不仅成功捕捉了珠穆朗玛峰严酷多雪的环境,还确保角色与原始照片完全一致,甚至包括面部特征。
提示:@Jade 穿着礼服在红地毯上摆姿势
我喜欢这个工具的地方在于生成的图像变化多样,同时保持核心元素的一致性。通常对于 AI 生成器来说,肢体部分往往很棘手,但这里看起来准确,面部一致性也得以保持。
虽然许多 AI 图像生成器在处理手部和手指时存在困难,但 Flux 在这方面做得相当不错。我可以看到手部被正确定义,没有像在 AI 生成艺术中经常看到的尴尬感。
好的,现在让我们谈谈价格问题。
费用是多少?
Flux 在 RenderNet 上的一个最大优点是在定价方面提供了灵活性。免费用户每天可获得 10 个免费积分。
-
免费: 每月 $0 包括 50 个积分,最多可生成 10 个 Flux 图像和 50 个 SDXL 图像。功能有限,同时生成 2 个图像。
-
基础: 每月 $9 提供 400 个积分,最多可生成 80 个 Flux 图像和 400 个 SDXL 图像。提供 1.5 分钟的叙述视频,8K 升级,True Touch 和 2 个同时生成。
-
标准: 每月 $24 提供 2,000 个积分,最多可生成 400 个 Flux 图像和 2,000 个 SDXL 图像。包括 8 分钟的叙述视频,10 个同时生成和所有高级功能。
-
高级: 每月 $49 提供 5,000 个积分,最多可生成 1,000 个 Flux 图像和 5,000 个 SDXL 图像,20 分钟的叙述视频和 50 个同时生成。全面访问所有功能。
如果您打算长期使用 Flux,选择年度计划可能会为您节省一些费用。通过年度付款,您将获得任何计划的 20% 折扣,如果您是该平台的常规用户,这是一个不错的交易。
为什么您应该关注?
自两个月前发布以来,Flux 图像模型已被证明是最具能力的之一。图像质量令人印象深刻,与文本提示的连贯性已经非常好,其准确渲染文本的能力令人惊叹。在我看来,Flux Pro 已经和最强大的闭源图像生成器 Midjourney 一样出色,甚至更胜一筹。由于 Flux 是开源的,因此可以对其进行微调,现在已经有数百个平台为其用户提供了这一功能。
另一个有趣的事实是,Flux 背后的团队 Black Forest Labs 由 Stable Diffusion 技术的原始开发人员和潜在扩散的发明者组成。Stability AI 在过去曾遇到一些内部问题,导致其关键团队成员离开并成立了一家新的创业公司。
这种技术人员的大规模流失通常会带来创新。当才华横溢的个人自立门户时,他们可以在没有较大组织约束的情况下追求大胆的新想法。
Flux 模型只有几个月的历史,这只是第一个版本。我们可以期待未来几个月会有更多令人兴奋的更新。团队还透露即将推出的视频模型,这更加令人兴奋!RenderNet 也是一个视频平台,因此当 Flux 模型整合到其中时,将会是一场史诗般的盛会。
最后的思考
总的来说,我很高兴看到 RenderNet 快速在其平台上增加了对 Flux 的支持。我已经使用 RenderNet 一段时间来生成 AI 说话的影响者,对结果感到满意。Flux 的加入使 RenderNet 成为一个更具吸引力的平台,适用于您的 AI 图像和视频工作流程。
用例也不仅限于肖像生成。Flux 图像模型可以与其他主题一起进行微调,不仅仅是人像。您可以使用宠物或产品的照片对其进行训练,这意味着您可以提升品牌资产。想象一下,只需一张产品照片就可以训练模型,并生成您能想到的任何设计的无限变化。这是多么酷!
在不久的将来有很多可能性。我相信 RenderNet 的开发人员已经在研发令人兴奋的新功能,我迫不及待地想看到它们发布!