📌 搞懂 Midjourney prompt 的底层逻辑
写 prompt 不是堆关键词那么简单。Midjourney 的 AI 对指令的理解有一套固定逻辑,你写的内容顺序、权重分配直接影响最终出图效果。比如同样描述 “一只红色的猫坐在屋顶上”,把 “红色” 放在前面和放在 “猫” 后面,渲染出来的色彩饱和度可能差 30% 以上。
写 prompt 不是堆关键词那么简单。Midjourney 的 AI 对指令的理解有一套固定逻辑,你写的内容顺序、权重分配直接影响最终出图效果。比如同样描述 “一只红色的猫坐在屋顶上”,把 “红色” 放在前面和放在 “猫” 后面,渲染出来的色彩饱和度可能差 30% 以上。
核心结构得记牢:主体描述 + 细节补充 + 风格定义 + 技术参数。主体就是你要画的东西,比如 “赛博朋克风格的机械狗”;细节补充包括材质(金属反光、磨砂质感)、环境(雨夜、霓虹灯照耀);风格定义可以是 “宫崎骏动画风格” 或 “8K 写实渲染”;技术参数就是 --v 6 --ar 16:9 这类。
关键词的权重怎么调?用括号 () 可以加重,比如 (red:1.2) 表示红色权重 1.2 倍;双括号 (( )) 是超强强调,但别用太多,超过 3 个会让 AI confusion。反过来,用 [] 可以减弱权重,比如 [green:0.5] 适合需要淡色调的场景。
分隔符是个好工具。用逗号分隔不同维度的描述,分号分隔并列元素,换行符区分主体和背景。比如 “未来都市,悬浮汽车;霓虹灯牌闪烁,雨水打湿地面 --v 6”,这样 AI 能清晰区分前景和环境。
🎨 高级风格指令库:从艺术流到商业设计
艺术流派这块得细分。文艺复兴风格要加 “sfumato 技法”“金色光晕”“宗教题材构图”;巴洛克风格强调 “动态褶皱”“强烈明暗对比 (chiaroscuro)”“珍珠质感”。你要是想画印象派,试试 “莫奈笔触”“色彩扩散效果”“逆光氛围”,出来的画面会有那种朦胧的光感。
艺术流派这块得细分。文艺复兴风格要加 “sfumato 技法”“金色光晕”“宗教题材构图”;巴洛克风格强调 “动态褶皱”“强烈明暗对比 (chiaroscuro)”“珍珠质感”。你要是想画印象派,试试 “莫奈笔触”“色彩扩散效果”“逆光氛围”,出来的画面会有那种朦胧的光感。
摄影风格指令更讲究参数配合。“徕卡 M9 拍摄”+“f/1.4 大光圈”+“浅景深” 适合人像;“航拍视角”+“8K 分辨率”+“RAW 格式质感” 适合风景。纪录片风格要加 “手持摄影抖动”“自然光线”“轻微颗粒感”,瞬间有纪实感。
商业设计领域用这些指令准没错。UI 设计稿加 “Figma 风格”“矢量线条”“留白 20%”;电商主图需要 “白底”“产品居中”“阴影分层”“8K 细节”。品牌 LOGO 设计要强调 “极简线条”“单色系”“负空间运用”,Midjourney V6 对几何图形的处理比旧版精准多了。
三维风格别只写 “3D 渲染”。具体到 “Blender cycles 引擎”“OC 渲染器质感”“Substance Painter 材质”,这些专业术语能让 AI 调用对应的渲染算法。游戏建模风格可以加 “PBR 流程”“低多边形 (low-poly)”“法线贴图细节”。
⚙️ 参数优化:让你的图从 “还行” 到 “惊艳”
版本选择有讲究。V6 适合写实和细节控,画人像必须开 V6,皮肤纹理能到毛孔级别;V5.2 的风格化更强,--style 400 参数下的插画风格很出彩;测试版 Niji V5 专门优化二次元,画动漫角色别犹豫直接用。
版本选择有讲究。V6 适合写实和细节控,画人像必须开 V6,皮肤纹理能到毛孔级别;V5.2 的风格化更强,--style 400 参数下的插画风格很出彩;测试版 Niji V5 专门优化二次元,画动漫角色别犹豫直接用。
画质参数别瞎调。--q 2 是基础画质,出图快适合初稿;--q 4 会增加 4 倍计算量,细节翻倍但耗时久,商业出图必用。还有个隐藏参数 --hd,在 V6 里开启后会强化边缘锐度,建筑效果图用这个准没错。
比例参数影响叙事感。16:9 适合电影场景,加 “宽屏构图”“全景视角” 更配;9:16 竖版适合手机壁纸,重点放在中景;1:1 正方形适合 LOGO 和头像,视觉重心要居中。想画长卷可以用 --ar 3:1,配合 “卷轴式构图” 指令,能出史诗感画面。
特殊参数能救场。--no 指令用来排除元素,比如 “--no text” 能避免 AI 乱加文字;--style raw 关闭默认风格化,适合需要精准还原的工业设计。还有 --s 2000 这个超高风格化参数,虽然容易跑偏,但偶尔能出惊艳的抽象作品。
🚀 场景化指令模板:直接套用就能出效果
角色设计三步法。第一步定基础:“25 岁女性,银发双马尾,机械义眼”;第二步加细节:“皮革机车夹克,金属指甲,颈间齿轮项链”;第三步定风格:“赛博朋克动画风格,Studio Trigger 画风,8K 线稿清晰”。最后加 --v 6 --ar 2:3,人物比例更协调。
角色设计三步法。第一步定基础:“25 岁女性,银发双马尾,机械义眼”;第二步加细节:“皮革机车夹克,金属指甲,颈间齿轮项链”;第三步定风格:“赛博朋克动画风格,Studio Trigger 画风,8K 线稿清晰”。最后加 --v 6 --ar 2:3,人物比例更协调。
产品渲染公式。主体 + 材质 + 光影 + 场景:“无线耳机,铝合金外壳 + 硅胶耳塞,侧光 45 度照射,阴影长度 5cm,放在橡木桌面上”。想突出科技感就加 “全息投影效果”“粒子环绕”,配合 --q 4 --style raw,电商主图直接能用。
场景搭建要分层。前景 “樱花飘落,花瓣特写”,中景 “日式木屋,纸拉门半开”,远景 “富士山,云层环绕”。光影统一用 “黄昏柔光”,风格选 “新海诚动画场景”,参数 --ar 16:9 --v 6,出来的画面层次感直接拉满。
概念艺术怎么搞?先定主题 “后末日图书馆”,再拆元素 “倒塌的书架,植物从书本中生长,阳光透过破窗形成光束”,最后加风格 “概念设计草图,马克笔质感,氛围阴郁但有生机”。用 --s 750 参数平衡写实和创意,不会太夸张。
❌ 避开这些坑:90% 的人都在犯的错
指令太长反而没用。超过 50 个词 AI 会自动忽略后面的内容,重点信息一定要放前 20 词。比如想画 “未来城市的早晨,有飞行汽车,全息广告牌,东方建筑风格,阳光明媚”,把 “未来城市 早晨 阳光明媚” 放前面,后面再补细节。
指令太长反而没用。超过 50 个词 AI 会自动忽略后面的内容,重点信息一定要放前 20 词。比如想画 “未来城市的早晨,有飞行汽车,全息广告牌,东方建筑风格,阳光明媚”,把 “未来城市 早晨 阳光明媚” 放前面,后面再补细节。
风格别堆太多。同时加 “梵高风格 + 赛博朋克 + 巴洛克”,AI 只会乱炖。正确做法是主风格 + 辅风格:“赛博朋克为主,融入梵高星空的色彩技法”,这样既有辨识度又不乱。
忽视版本特性要吃亏。V6 对文字识别还是弱,别写 “T 恤上印着‘未来’字样”,换成 “T 恤上有抽象符号,类似文字的图案”。但 V6 的手部处理进步大,画 “握拳的手,露出指节” 这种细节,比 V5.2 靠谱多了。
参数冲突要避免。比如 “--ar 1:1” 同时又要 “全景视角”,比例和构图矛盾,AI 只能二选一。正确搭配是 “全景视角 --ar 3:1”,或者 “特写镜头 --ar 1:1”,逻辑要自洽。
📝 写作框架:从 0 到 1 构建优质 prompt
第一步:明确核心需求。用一句话写清楚 “画什么”“给谁用”“用在哪”。比如 “给游戏宣传图用的,中世纪骑士在城堡废墟战斗的场景”,目标越具体,AI 越能对齐预期。
第一步:明确核心需求。用一句话写清楚 “画什么”“给谁用”“用在哪”。比如 “给游戏宣传图用的,中世纪骑士在城堡废墟战斗的场景”,目标越具体,AI 越能对齐预期。
第二步:拆解元素清单。主体(骑士、城堡废墟)、动作(挥剑、格挡)、细节(生锈的铠甲、破损的旗帜)、环境(黄昏、断壁残垣)、风格(暗黑奇幻,概念艺术)。列出来再排序,重要的放前面。
第三步:加入技术指令。根据用途选参数:宣传图用 --q 4 --v 6;快速草图用 --q 1 --v 5.2。比例按发布平台定,小红书用 --ar 3:4,抖音用 --ar 9:16。
第四步:测试优化。先出低画质草稿(--q 1)看构图,没问题再提参数。发现某部分不对,用 --vary 指令单独优化,比如 “--vary region” 只改骑士的武器,不用重画整张图。
最后给个万能模板:[主体],[核心动作 / 状态],[3 个关键细节],[环境氛围],[艺术风格 + 参考案例],[技术参数]。比如 “流浪猫,蹲在老电视机上,眼睛发光,胡须飘动,破旧的复古客厅,暖光,宫崎骏动画风格,--v 6 --ar 4:3 --q 2”。
掌握这些指令和框架,你会发现 Midjourney 的上限远比想象中高。别满足于网上抄来的模板,多试自己的组合,AI 绘画的乐趣就在于不断突破预期。记住,最好的 prompt 永远是你根据具体需求调出来的那个。
【该文章由diwuai.com第五 ai 创作,第五 AI - 高质量公众号、头条号等自媒体文章创作平台 | 降 AI 味 + AI 检测 + 全网热搜爆文库
🔗立即免费注册 开始体验工具箱 - 朱雀 AI 味降低到 0%- 降 AI 去 AI 味】
🔗立即免费注册 开始体验工具箱 - 朱雀 AI 味降低到 0%- 降 AI 去 AI 味】