
旅程中:开始使用样式参考

今年二月,Midjourney 粉丝们对“风格参考”功能的推出感到高兴,该功能允许用户复制任何给定图像的美学风格,无论是在 Midjourney 中创建的、从互联网下载的还是用户的私人艺术收藏。
在之前的中途办公时间中,David 解释了样式参考 (SR) 的功能类似,但介于图像提示 (IP) 和样式调谐器之间。
他还表示,这个新功能可能会让一些人感到困惑。他没有透露更多细节,很可能让我们继续猜测。
然后,同一天,SR 被发布。
在这个故事中,我将介绍 SR 的基础知识、它与 IP 和 Style Tuner 的不同之处,以及您应该了解的 SR 的一些独特方面,以便有效地使用此新功能。
这里的目标是让您充分了解 SR 的基础知识,以便您能够独立探索高级功能。
我不会重写整个 SR 公告。您可以在Discord 服务器上阅读它。或者从大量的在线文章和社交媒体帖子中阅读它,这些文章和社交媒体帖子复制并粘贴了该公告以与读者分享。
让我们从国会图书馆下载免费使用的图像来开始我们的功能探索。
Louis Rhead(1857-1926 年)创作了这幅新艺术风格海报插图,标题为“拉丁区”。请在此处阅读图书馆有关这件艺术品的信息,以了解有关该图像的更多信息。

来自国会图书馆免费使用档案的参考图像:https://tile.loc.gov/storage-services/service/pnp/ppmsca/10000/10092v.jpg — 该图像是在 Adobe Photoshop 中裁剪的去除多余的边缘。
我们将使用此插图作为参考图像。
图像显示一位身穿红色连衣裙的女士拿着调色板坐在植物背景前。她的裙子有爱心形状的图案印花。主要颜色是红色、黄色、绿色、蓝色和橙色。
看来她的左手不见了,这真是讽刺。但仔细一看却并非如此。
如果这是在中途创作的,我会使用 Vary(区域)来修复她的左手,但见鬼,这是由人类而不是机器人绘制的实际艺术品。
第 1 部分:风格参考 — V6、Niji 6 与图像提示
V6 的样式参考
使用 SR 有两种主要方法:(1) 使用 Midjourney V6 型号 ( --v 6),以及 (2) 使用 Niji 6 型号 ( --niji 6)。模型之间的结果有所不同。
与 Style Tuner 不同,SR 的目标是复制参考图像的美学风格。
风格调谐器通常用于探索给定提示的美学选项。在此阅读有关风格调谐器的更多信息。
要使用样式参考,请指定参数 ( --sref),后跟参考图像的链接,如下所示:
/imagine prompt: your prompt --sref <link to reference image> --v 6
将 更改--v 6为--niji 6使用 Niji 模型。
例如,这是最后的提示:
/imagine prompt: an illustration of a lady in a garden --sref https://s.mj.run/4TlOYq_GjCc --ar 3:4 --v 6.0
以下是使用 Midjourney V6 模型进行 SR 的结果。


V6 的样式参考。上/左: /imagine 提示:花园中一位女士的插图 — sref https://s.mj.run/4TlOYq_GjCc — ar 3:4 — v 6.0。右/下: /imagine 提示:花园中一位女士的插图 — sref https://s.mj.run/4TlOYq_GjCc — ar 3:4 — sw 1000 — v 6.0
尽管提示中未包含与风格相关的关键字“新艺术风格”,但生成的图像准确地捕捉了参考图像的新艺术风格和复古氛围。
换句话说,SR准确地复制了参考图像的艺术风格。
提示“花园中一位女士的插图”与参考图像不同,参考图像显示主要对象(女士)拿着调色板和一幅画。然而,SR 适应了这种变化,使生成图像中的女士读书、园艺或在花园里放松。
其他差异是:
女士的裙子并不总是红色的或有爱心形的印花。
文本的位置更加随意,不是在图像的顶部。
这位女士现在有两只手。
将单个参考图像的样式参考权重 ( --sw) 增加到 1000 与没有权重的提示相比,几乎没有差异或没有差异。
Niji 6 的风格参考
Niji 6 模型可产生良好的效果,并且在插图图像方面优于 V6。


Niji 6 的风格参考。/imagine 提示:一位女士在花园里的插图 — sref https://s.mj.run/4TlOYq_GjCc — ar 3:4 — niji 6
Niji 6 也很好地捕捉了新艺术风格和氛围。
图像显得更明亮、更卡通。颜色比 V6 更柔和。这位女士有两只手。
Niji 6 和 V6 之间的文本位置存在显着差异。
Niji 6 与参考图像一样,将正文置于顶部。换句话说,Niji 模型在这方面比 V6 模型更好地捕捉了文本放置的风格。
使用 V6 和 Niji 6 进行图像提示
在引入 SR 之前,可以使用图像提示 (IP) 来复制和复制样式。
在 V6中将图像权重 ( ) 添加--iw到 3,生成的图像将与参考图像非常相似。


使用 V6 进行图像提示。/imagine 提示:https://s.mj.run/4TlOYq_GjCc花园里一位女士的插图 — iw 3 — ar 3:4 — v 6.0
IP 结果并不令人意外;生成的图像与参考图像相似,特别是整体颜色、红色连衣裙、连衣裙上的图案印花、女士拿着盘子的动作(类似于参考图像中的调色板)以及主要文本海报格式的顶部。
IP 与 V6 和 Niji 6 模型的结果具有可比性。不过《霓虹6》中的这位女士更加卡通化,类似于动漫。


使用 Niji 6 进行图像提示。/imagine 提示:花园里一位女士的插图https://s.mj.run/4TlOYq_GjCc — iw 3 — ar 3:4 — niji 6
以下是学习要点:
- 风格参考 (SR) 可以捕获并重新创建参考图像的美学风格和氛围。
- SR方面,V6和Niji 6车型都表现不错。然而,与 V6 相比,Niji 6 会将文本位置与参考图像更紧密地对齐。
- 具有最大图像权重的图像提示 (IP) 会生成与参考图像非常相似的图像,特别是颜色、主要对象的动作、文本位置、风格和其他细节。
- SR 比 IP 更适合风格捕捉。用户可以改变提示,即主要主题和动作,同时保持整体美感。然而,SR 不会与参考图像的颜色和细节紧密匹配。
- 如果目标是创建与原始图像非常相似的图像,那么请使用 IP。
- 如果目标是生成与原始审美风格相似但没有主体细节的图像,请使用 SR。
第 2 部分:使用样式引用的实际注意事项
对纵横比的影响
SR 和 IP 之间的一个显着区别是,当用户更改原始参考图像的纵横比时,SR 会尝试将图像的主题适合画布。
在这个故事中,参考图像是垂直的。然而,当我们提示它变成水平(16:9)时,SR会自动改变女士的姿势,以尽可能地适合画布。如果它不能容纳所有内容,那么最接近边缘的元素(例如正文)将被裁剪。
V6 和 Niji 6 车型中使用的 SR 都是如此。
相比之下,IP 专注于参考图像的长宽比。因此,将纵横比从垂直更改为水平将会裁剪生成的图像。(仍可使用【平移】修复)
搭载 V6 发动机的 SR

V6 的样式参考。 /imagine 提示:一位女士在花园里的插图 — sref https://s.mj.run/4TlOYq_GjCc — ar 16:9 — v 6.0
SR 与 Niji 6

Niji 6 的风格参考。/imagine 提示:花园中一位女士的插图 — sref https://s.mj.run/4TlOYq_GjCc — ar 16:9 — niji 6
带有V6的IP

使用 V6 进行图像提示。 /imagine 提示:https://s.mj.run/4TlOYq_GjCc 花园里一位女士的插图 — iw 3 — ar 16:9 — v 6.0
中等变化
使用 SR 时,将媒介从插图改为摄影会产生有趣且意想不到的结果。
女士的连衣裙现在有花卉图案,整体看起来很复古。
几乎所有生成的图像都不再类似于海报。文本元素用作报纸、海报或背面的招牌。


上/左: /想象提示:花园里一位女士的时尚照片 — sref https://s.mj.run/4TlOYq_GjCc — ar 3:4 — v 6.0。右/下: /imagine 提示:花园中一位女士的时尚照片 — sref https://s.mj.run/4TlOYq_GjCc — ar 3:4 —niji 6
IP更忠实地保持了原始参考图像的图像布局和构图。
主要的区别是这位女士看起来比以前更加逼真。

V6 中的图像提示。 /imagine 提示:一位女士在花园里的时尚照片 https://s.mj.run/4TlOYq_GjCc — iw 3 — ar 3:4 — v 6.0
风格化效果
默认值为--stylize100。将风格化值增加到 1000(最大值)会影响 SR,并产生不同的结果。
V6 使图像更加逼真。
虹6的形象转向动漫。
IP的图像更加逼真。

V6 中 SR 的风格化。 /imagine 提示:花园中一位女士的插图 — sref https://s.mj.run/4TlOYq_GjCc — ar 3:4 — stylize 1000 — v 6.0

Niji 6 上 SR 的风格化。/imagine 提示:花园中一位女士的插图 — sref https://s.mj.run/4TlOYq_GjCc — ar 3:4 — 风格化 1000 — niji 6
文本生成
Niji 6 在向 SR 图像添加文本方面超越了 V6。它的性能也优于IP。
我使用前一篇文章中描述的相同提示测试方法来比较使用 (1) SR 与 V6、(2) SR 与 Niji 6 以及 (3) IP 与 V6 的文本生成效率。
“有用的图像”被定义为能够生成图像中文本(“花园”)的正确拼写的图像。
结果如何?
Niji 6 在每个网格生成至少一张可用图像方面取得了 100% 的成功 (4/4),V6 达到了 75% (3/4),IP 表现最差,为 25%。
SR 与 Niji 6

Niji 6 的样式参考在文本创建方面表现出色。 /imagine 提示:花园中一位女士的插图,文本“花园” — sref <https://s.mj.run/4TlOYq_GjCc> — ar 3:4 — niji 6
搭载 V6 发动机的 SR

V6 的样式参考。 /imagine 提示:一位女士在花园里的插图,文字“花园” — sref https://s.mj.run/4TlOYq_GjCc — ar 3:4 — v 6.0
带有V6的IP

使用 V6 进行图像提示。 https://s.mj.run/4TlOYq_GjCc 一位女士在花园里的插图,文字“花园” — iw 3 — ar 3:4 — v 6.0
调查结果摘要

上表总结了这个故事的调查结果。
Midjourney 开发人员表示,他们将在未来几周内更新样式参考。
因此,请使用该表作为一般参考,并关注未来的更新!
本文系作者 @ 泡泡球原创发布在 轻抖云。未经许可,禁止转载。