Midjourney 高级指令:掌握 AI 的完整指南

最后更新: 23/01/2026
作者: 艾萨克
  • Midjourney 允许通过结合文本、参考图像和高级参数来对图像生成进行精细控制。
  • 科曼多斯 /imagine、/blend、/describe 等命令以及 Remix、seeds 和 multiprompts 等模式是迭代和改进结果的关键。
  • 技术参数(宽高比、混乱度、风格化、质量、平铺、重复、怪异)决定了每张图片的审美、多样性和最终用途。
  • 掌握这些命令,即可在电子商务、社交媒体、博客和室内设计等领域实现实际应用,而无需进行传统的摄影拍摄。

高级中途指令

La 人工智能 生成式技术彻底改变了图像的创建方式。现在,一段简单的文字就能转化为精美的插画、超逼真的电影剧照,或是专业级的概念艺术作品。Midjourney 是该领域最具影响力的工具之一,一旦你开始掌握它的功能…… 高级命令和 技巧 提示工程不再是“一个 IA 他所描绘的“几乎成为了一种创作超能力”。

如果你想超越典型的“/想象一幅美丽的风景” 要想真正发挥 Midjourney 的最大效用,你需要了解它的提示、参数、特殊模式以及那些每天都在挑战其极限的用户所使用的各种小技巧。在本指南中,我将一步一步地讲解排名靠前的“Midjourney 高级命令”网站上涵盖的所有内容,并用清晰、直接且高度实用的语言进行解释,以便你可以将其应用到自己的项目中:从电子商务营销活动到个人插画创作。

在 Slack 中使用自定义斜线命令和智能机器人
相关文章:
在 Slack 中使用自定义斜线命令和智能机器人

Midjourney是什么?为什么值得学习它的高级命令?

Midjourney 是一款人工智能图像生成器,能够解读文本描述。 它能将用户提供的灵感转化为精美绝伦的插画、渲染图、照片级写实场景或概念艺术作品。该软件最初仅在 Discord 平台推出,但现在也推出了网页版,让任何想要创作视觉内容但并非专业设计师的人都能轻松上手。

与其他模型(例如 DALL·E 或稳定扩散模型)不同Midjourney 非常注重制作具有艺术感、电影质感且细节丰富的图像。它非常适合…… 营销活动、模型、封面、概念艺术、社交媒体帖子或博客文章此外,随着每个新版本(尤其是 V5 及以后的版本)的推出,人体结构、场景一致性,甚至令人头疼的手部生成都得到了改进。

基本流程很简单你输入命令 /imagine 输入你的描述后,几秒钟后,Midjourney 会返回一个包含四个选项的网格。你可以从中改进一个选项、请求不同的变体,或者完全重做。但真正展现其无限可能性的,是你开始尝试使用…… 参数如 –ar、–stylize、–seed、–chaos、–tile、–repeat 并采用多重提示、权重或排列等技术。

掌握高级命令并非一时兴起的技术行为。这就是“合格”图片和看起来像是为您的品牌或项目量身定制的专业作品之间的区别所在。

如何在 Midjourney 中构建一个好的提示

在 Midjourney 中,提示可以根据你的需要变得简单或复杂。然而,遵循逻辑结构至关重要,这样人工智能才能理解需要生成的内容。这并不意味着要写冗长的段落,而是要清晰地涵盖关键要素。

完整提示的基本结构通常包括:

  • 命令: 通常情况下 /imagine也就是告诉机器人生成图像的指令。
  • 参考图片(可选)用于指导风格、构图或角色设计的图片网址。
  • 文字描述:主体、动作、环境、光线、构图和关键细节。
  • 样式修饰符艺术技巧、艺术家、流派、总体美学。
  • 技术参数:宽高比、混乱程度、质量、风格化、种子等。

一个编写良好的提示可能如下所示。 (通用示例): /imagine heroic warrior on a snowy battlefield, dramatic lighting, cinematic, ultra detailed, oil painting --ar 2:3 --stylize 300 --chaos 10你不需要把小说的内容全部背下来;重要的是要涵盖你想要的内容、它的外观以及最终的格式。

另一个关键点是,Midjourney 对英语的理解能力比对西班牙语的理解能力更强。尤其是在讨论风格、摄影技巧或艺术运动名称时。你可以先用西班牙语写下你的想法,然后找个可靠的翻译人员把它翻译成英语,这样才能最大程度地发挥你的才能。

Discord 上的 Midjourney 基本命令

尽管网页版大大简化了体验在 Discord 中,您可以使用一系列命令(类似于……) Slack 中的自定义斜杠这些是Midjourney进阶课程的核心内容。它们并不复杂,但每一项都开启了一扇不同的大门。

对于认真使用高级提示来说,最重要的提示是::

  • /想象:从文本和/或图像生成图像的主要命令。
  • /混合旨在快速混合两到五张图片,在移动设备上非常实用。
  • /描述你向它发送一张图片,它会返回四个描述该图片的文本提示。
  • /设定打开一个面板,用于配置模型版本、默认样式、混音模式等。
  • 首选选项允许您创建自定义参数,将多个参数组合在一起。
  • /首选后缀:自动向所有提示符添加文本“尾部”或参数。

当您想要合并视觉参考时,/blend 命令是完美的选择。 无需逐个编写 URL,避免复杂化。你写 /blend你上传图片,让模型创建混合体:非常适合混合特征的角色、变成插图的标志或创意混搭。

/describe 是利用你自己的图片来窃取创意的明星工具 对于外部资源:你上传照片后,Midjourney 会返回一系列样式、形容词和增强词,你可以修改并重复使用。它并非总能完美地还原构图,但对于寻找你可能没想到的样式和关键词来说,它绝对是宝藏。

旅程中期版本、模型和特殊模式

Midjourney 并非单一的静态模型而是提供一系列版本和模式,您可以根据需要进行选择。这将直接影响您可以使用的参数以及最终效果。

需要考虑的因素有:

  • 模型版本它是通过以下方式选择的: --v (1、2、3、4、5 等)。通常情况下,应始终使用最新版本。
  • 每个版本内的风格:有 --style 您可以更改变体(例如,5a、5b 或模式)。 --style raw (一种不那么“华丽”的表达方式)。
  • 二二模型:有 --niji 你激活了一个专门针对动漫和漫画美学的模型。
  • 测试模型:穿着 --test o --testp 您可以体验需要您提供反馈意见的实验性版本。
  Microsoft MatterGen:从头开始彻底改变材料设计的人工智能

更改版本或样式可能会完全改变同一提示的响应方式。同一文本在V5版本中能呈现出近乎照片般的肖像效果,而在Niji版本中却会变成一个有着巨大眼睛和扁平色彩的动漫人物。因此,务必标明版本,必要时还要标明样式。

另请注意,某些参数会因版本而异。例如,某些极端的宽高比或质量和尺寸的组合可能无法使用,或者在较旧的型号上可能会产生奇怪的结果,而 V5 支持更灵活的宽高比和更好的细节,伪影更少。

放大、变体和混音模式:如何迭代直到获得完美图像

当旅程中期结束一代人时它会返回一个 2x2 的图像网格。下方您会看到按钮 U1、U2、U3、U4(放大)和 V1、V2、V3、V4(变体),以及一些取决于版本的额外操作。

在 5 之前的版本中以前,放大图像指的是以更高的分辨率重新生成图像,从而增加细节,有时还会略微改变纹理和形状。在 V5 版本中,图像默认以 1024x1024 分辨率生成,因此 U 按钮的作用只是将该图像从网格中“分离”出来,以便单独进行处理。

这些变体(V1-V4)生成了四幅新图像 基于之前的版本,保持相同的提示和类似的初始噪点图像。这样,你就可以在不完全失去最初想法的情况下,微调姿势、光线或构图;这就像问插画师:“请帮我再画四个这个概念的版本。”

混音模式是迭代的锦上添花。如果你在……中激活它 /settings每次按下变体按钮,都会弹出一个小窗口,允许您在生成新图像之前编辑提示信息。这样,您可以在保持原始视觉结构的同时,更改角色、背景、样式或某些参数。

然而,Remix 并不是从零开始。它会考虑生成的图像、构图和元素,并将它们“转移”到新的提示中。细微的改动(例如添加武器、改变盔甲类型、改变环境)通常效果很好;而剧烈的改动(例如从战士变成咖啡杯)则会产生一些奇怪但有时很有趣的结果。你需要进行实验,看看这种一致性能持续多久。

Midjourney 中的高级参数:真正的仪表盘

参数是您添加到提示符末尾的选项。 为了在技术和美学层面控制图像的生成方式。他们总是使用两个连字符(--)您可以根据需要组合任意多个,只要它们与您使用的版本和型号兼容即可。

在 Midjourney 版本 5 中,您应该了解的关键参数包括::

纵横比:–纵横比 / –面积

参数 --aspect o --ar 定义图像的宽高比默认情况下,Midjourney 会生成正方形 (1:1),但您可以将其更改为更具照片感或垂直格式,用于角色、封面、横幅等。

方面使用的典型示例--ar 3:2 对于景观而言, --ar 2:3 竖版海报或 --ar 16:9 对于宽屏格式,V5几乎支持所有合理的宽高比,但当宽高比超过2:1或1:2时,可能会出现裁剪不佳或合成异常的情况。

这不仅仅是最终尺寸的问题。宽高比会影响初始噪点图像,进而影响整个构图。同样的提示信息,在 1:1 和 16:9 两种比例下,画面布局会发生根本性的改变,哪些元素会被裁剪或居中显示。

混沌:–chaos / –c

参数 --chaos 它控制着结果的不可预测性。。 同 --c 0 该模型力求更加稳定和“服从”;当数值达到 100 时,人工智能就会放松下来,允许自己进行更怪异的解决方案、奇怪的组合和视觉实验。

高度混乱的环境非常适合探索阶段。当你还不确定自己想要什么风格,当你正在寻找天马行空的创意,或者当你想要打破题目的单调乏味时,一旦找到适合自己的表达方式,你就可以减少混乱,从而获得更一致的变化。

图像权重:–iw

当你在提示中使用图片时 (图像提示) --iw 它允许您决定视觉元素相对于文本的权重。默认值为 1,通常可以将其调整到 0.5 到 2 之间。

如果你上去 --iwMidjourney 更注重还原参考图像的构图、形式和风格。如果降低级别,它则更依赖文字描述,图像仅作为参考。这对于重新设计角色、改变环境或将草图改编成像样的插图非常有用。

否定提示:-否

参数 --no 它用于告诉 Midjourney 你不希望显示什么。你之后写的所有内容 --no 在下一个参数之前,它将被视为场景中需要避免的元素。

它尤其适用于去除恼人的细节。:不寻常的文字和字体、多余的手指、重复的背景元素、与品牌不符的颜色等等。典型的例子包括: --no text, letters, logo o --no hands 当你想用之前的图片重现某个姿势,但又不想让手部变形时。

它对具体概念比对非常抽象的事物更有效。但这并非万无一失。如果您想要更精细的控制,可以将其与否定多重提示结合使用,这样可以调整您想要在图像中“突出”的部分的权重。

细节质量:–quality / –q

--quality 控制 Midjourney 为该图像分配的资源数量在之前的版本中,你可以放入 --q .25, --q .5, --q 1 Øincluso --q 2 您可以微调所需的细节程度。在 V5 版本中,最大值为 1;您无法通过增加此值来获得更多细节,但可以降低此值以节省时间和积分。

  Comet 与 Chrome 对比:人工智能、速度、隐私和安全

降低画质非常适合快速草图。这对于构图测试或想要生成大量低成本图像以便稍后从中挑选最佳图像并进行更精细的后期处理非常有用。请记住,质量并非分辨率:分辨率取决于模型;而在这里,您调整的是细节的精细程度。

重复:–repeat / –r

连接器 --repeat o --r 你指示 Midjourney 连续多次执行相同的提示。。 例如, --r 3 它将根据同一文本生成三幅独立的画作,每幅画作都有自己的 4 幅图像网格。

在微调提示时,这能节省大量时间。 而且你想一次性看到很多选项。此外,如果再加上一定程度的混乱,你就能大大增加你一直在寻找的“宝石”出现在这些网格中的几率。

种子:-种子

种子或 --seed 是标记初始噪声图像的数字 从这里开始,Midjourney 会“雕琢”最终图像。如果你使用相同的提示和相同的种子,并在同一版本中重复操作,你将得到几乎完全相同的图像。

使用种子可以让你进行相对控制。 关于变化:您可以在保持整体构图理念的前提下,尝试不同的风格、宽高比、颜色或细微的文字改动。这对于制作连贯的系列作品或在不影响整体效果的前提下修正某个细节非常有用。

在 V5 版本中,您无法再使用信封表情符号来获取缩放图像的种子。因为此版本没有二次放大处理:图像已以最高分辨率输出。但您可以自行设置种子值,取值范围为 0 到 4.294.967.295,并在需要时重复使用。

停止: -停止

参数 --stop 过早停止生成过程您可以选择 10 到 100 之间的百分比。数值越低,图像就越“模糊”,细节越少,就像草图或未完成的渲染图一样。

这是一个比较小众的参数,用途并不总是很明确。但如果你想要更具绘画感、清晰度较低的效果,或者只是想看看场景是如何演变的,而不想进行降噪处理,那么这种方法就很有用。

样式化:–stylize / –s

--stylize 这是旅程中最重要的参数之一因为它能告诉你,在回答题目问题时,你的艺术训练应该占多大的比重。在V5版本中,默认值为100,你可以将其调整到0到1000之间。

采用低调的风格化手法,该模型更贴近文本。 它给出的结果或许不那么华丽,但却更贴近描述。在高分值下,人工智能会运用从用户投票图片中学到的所有知识:更丰富的细节、更佳的构图、更强烈的视觉冲击力……但同时也更容易忽略提示中的某些部分。

这和混乱不一样。“混乱”侧重于“疯狂”的创意和变化,而“风格化”则追求更美观、更复杂、更精致的视觉效果。在简短的提示中,增加“风格化”值影响不大;但在包含众多元素的长提示中,它可以彻底改变场景。

马赛克图案: –瓷砖

参数 --tile 它可以生成可以以马赛克图案重复排列的图像。 无缝设计,非常适合用于纺织图案、壁纸或可重复使用的图形资源。

经典的技巧是生成一个简单的图块。 (例如,粉彩色的水滴)然后将其用作服装、背景或界面的基础纹理。 下载 你把图片放到编辑器或能检查连续性的网站上重复检查,如果吻合良好,你的图案就做好了。

高级提示:起始图像、多重提示、权重和排列

除了技术参数之外,真正的飞跃在于理解如何构建文本。 以及如何将其与图像结合起来,在不让模型感到不知所措的情况下引导模型。

Midjourney 接受图片和文本作为输入。您可以单独使用它们(仅限图片) /blend 或者直接发短信 /imagine或者将它们混合在一起:在提示的开头放一张或多张图片,然后用文字描述来细化你想要达到的效果。

如果您要使用多张图片作为参考建议所有帧的宽高比都与最终图像相似,以避免构图怪异。另外,记得多尝试…… --iw 调整它们对文本的影响程度。

一种常用的方法是:首先将图像混合以获得基础角色。 (例如,将古典雕塑、系列剧照和动漫绘画结合起来),然后将该图像作为独特的参考,并配合越来越详细的文字提示来定义动作、环境、光线、风格和细节。

带 :: 和权重的多个提示

虽然逗号似乎用来分隔提示中的各个想法,但实际上并非如此。实际上,Midjourney 对这些功能的关注度有限。如果您确实想要区分不同的概念,则需要使用多提示分隔符。 ::.

多提示框大概是这样的 viking warrior with shield:: full body:: intense action scene:: oil painting:: highly detailed每个块之间用……分隔 :: 它被更独立地处理,这有助于防止人工智能将复合概念(例如“棉花糖”或“热狗”)与自由组合的词语混淆。

此外,你还可以在最后一个重量数字后面添加一个重量数字。 :: 用来指出提示信息中哪个部分应该被赋予更高的相对重要性。例如: cheese:: cake::1.5 这使得蛋糕比奶酪更重要。 cheese cake这往往将“芝士蛋糕”视为一种正宗的甜点。

这些权重是相互关联的。:如果你把 cheese::1.5 cake::1.5这相当于完​​全不使用数字,因为两者权重相同。有趣的是,我们可以运用 1:2 或 1:3 的比例来强调某个概念,同时又不削弱其他概念。

你也可以使用负权重。,键入 hands::-0.5从而使元素表现得像一个“反提示”,类似于 --no 但可以通过强度控制来实现。这种方法通常最适合去除非常具体的物体,或者调整那些顽固的、难以消除的细节。

包含 { } 的排列

排列组合是测试多种变体的绝佳工具。 无需重复编写十遍,即可从同一提示中提取信息。它们与花括号一起使用。 { } 选项之间用逗号分隔。

  ChatGPT 终于将语音模式集成到聊天功能中。

例如,这个提示 {viking warrior with shield, muay thai fighter, reptilian}, full body, intense action scene, oil painting, highly detailed --ar 2:3 它将为三个科目选项中的每一个生成一个作业,其他一切都保持不变。

你可以嵌套排列组合来改变特定细节。就像这件武器一样: {viking warrior with {sword, axe, shield}, muay thai fighter, reptilian}, full body...这样一来,你就可以在很短的时间内生成庞大的测试集,但要注意,因为只会处理前 40 个组合,你可能会在不知不觉中用完快速处理时间。

也可以对多提示的参数和部分进行排列组合。: 例如, viking warrior with shield, full body --ar {3:2, 2:3} o with shield::{2, 1.5}这是找出最适合你的宽高比、重量或样式组合的最快方法。

如果花括号内的选项包含您想要保留的逗号, 作为同一代码块的一部分,它们必须用反斜杠转义。 \ 这样 Midjourney 就不会将它们视为排列分隔符。这样,你就可以对复杂的样式“包”进行排列组合,而不会导致样式失效。

其他创意参数:怪异、平铺、重复等等

除了前面讨论过的参数之外,还有其他一些参数。还有一些额外的功能可以帮助你探索更稀有的地形或更快地生成特定资源。

--weird o --w 使该模型走向奇怪的解释超现实或完全怪诞。它接受 0 到 3000 之间的值:值越高,人工智能就越古怪。它非常适合生成梦幻般的图像、宇宙恐怖、实验艺术,或者仅仅是为了打破常规。

--repeat 我们已经看到了但如果与混乱或怪诞结合起来,它就会变成一台创意迸发的机器;非常适合在进行宣传活动或艺术项目的视觉头脑风暴阶段使用。

--tile 如前所述,这对于可重复模式至关重要。 然后,您可以将其用于插图、产品设计、界面或背景。以及图像混合和参数 --iw它为创造“虚构的”纺织品、壁纸或覆盖物提供了许多可能性,这些纺织品、壁纸或覆盖物看起来像是从真实的目录中摘取出来的一样。

运用巧妙的工程技巧来更好地控制结果

当你开始大量使用 Midjourney 时你会发现一些反复出现的模式:无论你提及多少次都不会出现的元素、人工智能凭空捏造的细节、失控的风格……这就是一些小的提示工程技巧发挥作用的地方。

一个有效的策略是在多个提示中复制提示的部分内容。 当某事物没有完全消失或重新出现时,如果一个负权重不足以将其移除,你可以用平衡的负权重将该部分添加两次,以强化信息,而不会破坏整体权重。

另一种实用技巧是将完整的“普通”提示与额外的多提示结合起来。 最后,你可以用这部分来强调你遗漏的细节。例如,如果你的角色提到了纹身,但实际上并没有,你可以添加…… :: tattoos::2 在提示的末尾添加,以便 Midjourney 可以更加关注该特定元素。

如果他们仍然不理会你,那就该采取更强硬的手段,重复这个词好几遍了。写“纹身纹身纹身……”通常能让模特相信这绝对重要。虽然不够优雅,但在某些叛逆的情况下却出奇地有效。

别忘了这条命令 /describe 作为词汇生成器你可以使用 chaos 创建疯狂的图像,然后通过 /describe 命令运行它们,这样 AI 本身就会建议风格、作者和技术术语,你可以在未来的提示中以更大的控制力重复使用这些建议。

实际应用:电子商务、社交网络、博客和内部资源

如果不将这些命令和参数应用到实际案例中,它们就没什么用处。Midjourney 特别适合需要个性化、快速且具有明确美学特征的图像,但又没有预算进行复杂拍摄的情况。

在电子商务中,你可以利用它来创建无法用照片拍摄的营销活动。例如,水下使用的电吉他、极端环境下的产品,或者强化品牌特质的超现实场景。与其使用通用素材图片,不如设计能够体现品牌美学的定制视觉素材。

Midjourney 允许您为社交媒体和博客上的每一篇文章配上插图。 使用原创图片:教育文章、励志帖子、轮播图、视频封面等。您只需根据每个平台的要求调整宽高比(例如, --ar 9:16 (用于故事或短片),并尝试与您的视觉形象一致的风格。

人工智能生成的模型也非常有用。现代办公室、挂满艺术品的画廊墙、书桌上的包装、大屏幕上的海报……您可以创建完整的场景,让您的产品“置身于特定情境中”,而无需实际搭建场景。

在内部,Midjourney 扮演着风格实验室的角色。情绪板、色彩运用示例、演示文稿模型、图标、背景……您甚至可以创建图像来说明品牌手册、视觉色调指南或销售演示文稿,保持美学一致性,而以传统方式制作的成本会非常高昂。

归根结底,关键在于结合对高级命令的了解。 只要你对想要通过视觉方式传达的内容有清晰的构想:AI 会负责繁重的渲染工作,但创意方向仍然掌握在你手中。你越擅长撰写和组织提示,就越能营造出拥有整个插画师团队为你服务的氛围,即使你实际上只是在 Discord 或网页上与机器人聊天。