Stable Diffusion入门教程：如何写好提示词生成高质量图片

刚接触 Stable Diffusion 的朋友，可能都会遇到一个问题：明明用了同款模型，别人生成的图片像电影截图，自己生成的却模糊不清甚至变形。其实关键就在于提示词 —— 这个看似简单的文本输入，直接决定了 AI 对画面的理解和还原度。今天就手把手教你写好提示词，哪怕是新手也能快速出效果。

🖌️ 提示词的核心构成：让 AI “看懂” 你的需求

提示词不是随便堆砌词语，得有清晰的逻辑结构。就像给画师描述需求，你得说清楚 “画什么”“怎么画”“画成什么样”。一个完整的提示词，通常包含这几个部分：主体内容、风格定位、细节补充。

主体内容是基础，必须明确。比如你想画 “一只猫”，但 “猫” 太笼统了 —— 是布偶猫还是橘猫？是坐着还是跳跃？建议加上具体特征，比如 “一只蓝眼睛的布偶猫，趴在白色羊绒地毯上，耳朵微微竖起”。AI 对具体事物的还原度远高于模糊描述，越精准的主体定位，画面越不容易跑偏。

风格定位决定画面气质。同样是画猫，加上 “宫崎骏动画风格” 和 “写实摄影风格”，出来的效果天差地别。常见的风格关键词有很多，比如艺术流派（印象派、赛博朋克、浮世绘）、媒介类型（油画、水彩、8K 摄影）、作品参考（像《哈利波特》电影场景、《原神》角色设计）。新手可以先从自己熟悉的风格入手，比如喜欢二次元就加 “anime style, soft coloring”，喜欢写实就加 “photorealistic, 8K resolution”。

细节补充是提升质感的关键。很多人忽略这部分，结果画面总少点 “灵魂”。细节可以从光影、材质、构图三个维度加。光影方面，“侧逆光，暖黄色光晕，面部轮廓清晰” 能让人物更立体；材质方面，“丝绸连衣裙，褶皱自然，反光柔和” 能增强真实感；构图方面，“近景特写，背景虚化，黄金比例构图” 能让画面更有层次。这些细节不用全加，但至少要选 1-2 个重点描述。

➕ 正向提示词：学会 “加权” 让重点更突出

正向提示词就是你希望 AI 强化的内容，但不是所有词都有同样的优先级。Stable Diffusion 默认按词语顺序判断重要性，但有时候我们需要特别强调某个特征 —— 这时候就得用 “加权” 技巧。

最常用的加权方式是加括号，比如 “(blue eyes:1.2)”，表示 “蓝眼睛” 这个特征的权重提升 20%。数值越高，AI 越会重点刻画，一般建议在 1.1-1.5 之间，太高容易让画面失衡（比如眼睛过大）。如果想突出多个特征，可以分层加权，比如 “(a girl with long hair:1.3), (wearing red dress:1.2), standing in a garden”，让人物和服装成为视觉焦点。

关键词的 “精度” 比数量更重要。有新手觉得提示词越长越好，一口气写几十上百个词，结果 AI 反而抓不住重点。其实 20-30 个核心词就够了，而且要避免重复 —— 比如同时写 “写实” 和 “photorealistic”，两者意思相近，纯属浪费权重。可以先列 3 个最想突出的特征，用加权强化，其他次要特征简单带过。

还要注意关键词的 “兼容性”。比如你写 “二次元少女，写实皮肤纹理”，这两个风格本身有冲突，AI 可能会生成不伦不类的画面。选关键词时，先确定一个核心风格，再围绕它补充相关元素。比如二次元风格，就搭配 “柔和线条、明亮色彩、Q 版比例”，别混入写实相关的描述。

❌ 反向提示词：排除 “雷区” 让画面更干净

很多人只关注正向提示词，却忽略了反向提示词 —— 这个功能能告诉 AI “不要画什么”，对提升画面质量至关重要。尤其是生成人物、静物时，反向提示词能有效避免模糊、变形、瑕疵等问题。

必加的基础反向词有这些：“lowres, blurry, pixelated, messy, duplicate, extra limbs, bad anatomy”。这些词针对的是 AI 常见的 “翻车点”—— 比如人物手脚画错、画面模糊、出现重复元素。不管生成什么类型的图片，加上这些都能减少 80% 的基础错误。

根据场景补充针对性反向词。如果生成人像，要加 “ugly, deformed face, asymmetrical eyes, bad teeth”，避免面部畸形；生成写实场景，加 “cartoon, painting, sketch”，防止画面出现手绘感；生成室内场景，加 “empty, plain background”，避免背景过于单调。反向提示词不用太多，10-15 个精准词比 30 个泛泛之词有用。

反向词也能 “加权”。如果某个问题反复出现，比如总是生成模糊的手部，可以加 “(bad hands:1.5)”，强制 AI 弱化这个缺陷。但注意别过度，反向词权重太高，可能会让画面丢失细节 —— 比如给 “simple background” 加太高权重，可能连正常的背景元素都被去掉了。

📌 提升提示词质量的 3 个关键技巧

掌握了基础结构，再学几个进阶技巧，就能让画面质感再上一个台阶。这几个技巧都是实战中验证过的，新手直接套用也能出效果。

第一个是 “细节分层描述”。把提示词按 “整体到局部” 排序：先写画面主题（比如 “a cyberpunk city at night”），再写环境氛围（“neon lights, rainy street, steam rising from the ground”），最后写细节（“water reflections on the road, distant skyscrapers with glowing signs”）。AI 会按这个顺序解析画面，先搭好框架再填细节，不容易出现逻辑混乱。

第二个是 “加入专业术语”。AI 对行业内的精准词汇更敏感。比如描述光影，别只写 “光线明亮”，可以写 “cinematic lighting, 3-point lighting”（电影级布光、三点布光）；描述材质，别写 “衣服很软”，可以写 “cashmere fabric, soft fold”（羊绒面料、自然褶皱）。这些词汇能让 AI 调用更精准的模型参数，画面细节会更到位。

第三个是 “控制长度和节奏”。提示词不是越长越好，也不是越短越好。太短（少于 10 个词）AI 会自由发挥，容易偏离需求；太长（多于 50 个词）AI 会忽略部分内容。建议控制在 20-40 个词，并且用逗号分隔成 3-4 个短句，比如 “a girl in white dress, standing by the lake, sunset behind her, soft light, 8K, ultra-detailed”。这样的结构清晰，AI 能快速抓取核心信息。

📸 不同场景的提示词示例：直接套用就能用

光说理论不够，直接上例子。不同场景的提示词侧重点不同，照着改改就能出片。

先看人像生成。核心是 “面部 + 姿态 + 质感”。比如：“(a 20-year-old girl with long black hair:1.2), wearing a white lace dress, sitting on a wooden chair, soft smile, (natural light from window:1.1), skin with subtle glow, 8K, sharp focus, realistic skin texture”。反向提示词搭配：“lowres, blurry, bad anatomy, extra fingers, ugly face, duplicate”。这样生成的人像面部清晰，皮肤有质感，不会出现畸形。

再看风景生成。重点在 “氛围 + 构图 + 细节”。比如：“misty mountain landscape at dawn, pine trees on the hillside, a small lake at the foot of the mountain, (golden sunlight through clouds:1.2), water reflection, distant birds, 8K, wide-angle shot, realistic texture”。反向提示词：“blurry, flat colors, messy, low detail, pixelated”。生成的风景会有层次感，光影和细节都比较到位。

二次元插画的话，侧重 “线条 + 色彩 + 风格”。比如：“anime girl with twin tails, big purple eyes, wearing a school uniform, (running on the cherry blossom road:1.2), pink petals flying, bright colors, soft lines, (Studio Ghibli style:1.1), 8K, clean lineart”。反向提示词：“messy lines, low contrast, blurry, duplicate”。这样生成的画面线条干净，风格统一，符合二次元的特点。

🔍 优化提示词的小窍门：快速提升效果

最后说几个新手容易忽略的小技巧，能让提示词效果翻倍。

多做 “对比测试”。同一个需求，换几个关键词试试。比如生成 “猫”，分别用 “cat”“persian cat”“a fluffy persian cat with blue eyes”，看哪个效果最好。通过对比能快速找到 AI “喜欢” 的描述方式 —— 通常越具体、带特征的词效果越好。

善用 “参考词库”。如果不知道该加什么细节，可以记几个通用优质词：光影类（cinematic lighting, soft shadow）、质感类（realistic texture, sharp focus）、清晰度类（8K, ultra-detailed, high resolution）。这些词几乎适用于所有场景，加在提示词末尾，能提升画面整体质量。

别忽视 “模型匹配”。不同模型对提示词的响应不同。比如写实模型（如 RealVis）对 “photorealistic, skin texture” 反应好；二次元模型（如 AnimeV3）对 “anime style, clean lineart” 更敏感。用对模型再配合对应提示词，效果会事半功倍。

写提示词就像和 AI “聊天”—— 你说得越清楚、越具体，它越能 get 到你的意思。刚开始不用追求完美，先按 “主体 + 风格 + 1 个细节” 的结构写，生成后看看哪里不满意，再用反向提示词排除问题，或者给优点加权重。练个两三次，你生成的图片质量肯定能明显提升。

【该文章由diwuai.com