刚接触 Stable Diffusion 的朋友,可能都会遇到一个问题:明明用了同款模型,别人生成的图片像电影截图,自己生成的却模糊不清甚至变形。其实关键就在于提示词 —— 这个看似简单的文本输入,直接决定了 AI 对画面的理解和还原度。今天就手把手教你写好提示词,哪怕是新手也能快速出效果。
🖌️ 提示词的核心构成:让 AI “看懂” 你的需求
提示词不是随便堆砌词语,得有清晰的逻辑结构。就像给画师描述需求,你得说清楚 “画什么”“怎么画”“画成什么样”。一个完整的提示词,通常包含这几个部分:主体内容、风格定位、细节补充。
主体内容是基础,必须明确。比如你想画 “一只猫”,但 “猫” 太笼统了 —— 是布偶猫还是橘猫?是坐着还是跳跃?建议加上具体特征,比如 “一只蓝眼睛的布偶猫,趴在白色羊绒地毯上,耳朵微微竖起”。AI 对具体事物的还原度远高于模糊描述,越精准的主体定位,画面越不容易跑偏。
风格定位决定画面气质。同样是画猫,加上 “宫崎骏动画风格” 和 “写实摄影风格”,出来的效果天差地别。常见的风格关键词有很多,比如艺术流派(印象派、赛博朋克、浮世绘)、媒介类型(油画、水彩、8K 摄影)、作品参考(像《哈利波特》电影场景、《原神》角色设计)。新手可以先从自己熟悉的风格入手,比如喜欢二次元就加 “anime style, soft coloring”,喜欢写实就加 “photorealistic, 8K resolution”。
细节补充是提升质感的关键。很多人忽略这部分,结果画面总少点 “灵魂”。细节可以从光影、材质、构图三个维度加。光影方面,“侧逆光,暖黄色光晕,面部轮廓清晰” 能让人物更立体;材质方面,“丝绸连衣裙,褶皱自然,反光柔和” 能增强真实感;构图方面,“近景特写,背景虚化,黄金比例构图” 能让画面更有层次。这些细节不用全加,但至少要选 1-2 个重点描述。
➕ 正向提示词:学会 “加权” 让重点更突出
正向提示词就是你希望 AI 强化的内容,但不是所有词都有同样的优先级。Stable Diffusion 默认按词语顺序判断重要性,但有时候我们需要特别强调某个特征 —— 这时候就得用 “加权” 技巧。
最常用的加权方式是加括号,比如 “(blue eyes:1.2)”,表示 “蓝眼睛” 这个特征的权重提升 20%。数值越高,AI 越会重点刻画,一般建议在 1.1-1.5 之间,太高容易让画面失衡(比如眼睛过大)。如果想突出多个特征,可以分层加权,比如 “(a girl with long hair:1.3), (wearing red dress:1.2), standing in a garden”,让人物和服装成为视觉焦点。
关键词的 “精度” 比数量更重要。有新手觉得提示词越长越好,一口气写几十上百个词,结果 AI 反而抓不住重点。其实 20-30 个核心词就够了,而且要避免重复 —— 比如同时写 “写实” 和 “photorealistic”,两者意思相近,纯属浪费权重。可以先列 3 个最想突出的特征,用加权强化,其他次要特征简单带过。
还要注意关键词的 “兼容性”。比如你写 “二次元少女,写实皮肤纹理”,这两个风格本身有冲突,AI 可能会生成不伦不类的画面。选关键词时,先确定一个核心风格,再围绕它补充相关元素。比如二次元风格,就搭配 “柔和线条、明亮色彩、Q 版比例”,别混入写实相关的描述。
❌ 反向提示词:排除 “雷区” 让画面更干净
很多人只关注正向提示词,却忽略了反向提示词 —— 这个功能能告诉 AI “不要画什么”,对提升画面质量至关重要。尤其是生成人物、静物时,反向提示词能有效避免模糊、变形、瑕疵等问题。
必加的基础反向词有这些:“lowres, blurry, pixelated, messy, duplicate, extra limbs, bad anatomy”。这些词针对的是 AI 常见的 “翻车点”—— 比如人物手脚画错、画面模糊、出现重复元素。不管生成什么类型的图片,加上这些都能减少 80% 的基础错误。
根据场景补充针对性反向词。如果生成人像,要加 “ugly, deformed face, asymmetrical eyes, bad teeth”,避免面部畸形;生成写实场景,加 “cartoon, painting, sketch”,防止画面出现手绘感;生成室内场景,加 “empty, plain background”,避免背景过于单调。反向提示词不用太多,10-15 个精准词比 30 个泛泛之词有用。
反向词也能 “加权”。如果某个问题反复出现,比如总是生成模糊的手部,可以加 “(bad hands:1.5)”,强制 AI 弱化这个缺陷。但注意别过度,反向词权重太高,可能会让画面丢失细节 —— 比如给 “simple background” 加太高权重,可能连正常的背景元素都被去掉了。
📌 提升提示词质量的 3 个关键技巧
掌握了基础结构,再学几个进阶技巧,就能让画面质感再上一个台阶。这几个技巧都是实战中验证过的,新手直接套用也能出效果。
第一个是 “细节分层描述”。把提示词按 “整体到局部” 排序:先写画面主题(比如 “a cyberpunk city at night”),再写环境氛围(“neon lights, rainy street, steam rising from the ground”),最后写细节(“water reflections on the road, distant skyscrapers with glowing signs”)。AI 会按这个顺序解析画面,先搭好框架再填细节,不容易出现逻辑混乱。
第二个是 “加入专业术语”。AI 对行业内的精准词汇更敏感。比如描述光影,别只写 “光线明亮”,可以写 “cinematic lighting, 3-point lighting”(电影级布光、三点布光);描述材质,别写 “衣服很软”,可以写 “cashmere fabric, soft fold”(羊绒面料、自然褶皱)。这些词汇能让 AI 调用更精准的模型参数,画面细节会更到位。
第三个是 “控制长度和节奏”。提示词不是越长越好,也不是越短越好。太短(少于 10 个词)AI 会自由发挥,容易偏离需求;太长(多于 50 个词)AI 会忽略部分内容。建议控制在 20-40 个词,并且用逗号分隔成 3-4 个短句,比如 “a girl in white dress, standing by the lake, sunset behind her, soft light, 8K, ultra-detailed”。这样的结构清晰,AI 能快速抓取核心信息。
📸 不同场景的提示词示例:直接套用就能用
光说理论不够,直接上例子。不同场景的提示词侧重点不同,照着改改就能出片。
先看人像生成。核心是 “面部 + 姿态 + 质感”。比如:“(a 20-year-old girl with long black hair:1.2), wearing a white lace dress, sitting on a wooden chair, soft smile, (natural light from window:1.1), skin with subtle glow, 8K, sharp focus, realistic skin texture”。反向提示词搭配:“lowres, blurry, bad anatomy, extra fingers, ugly face, duplicate”。这样生成的人像面部清晰,皮肤有质感,不会出现畸形。
再看风景生成。重点在 “氛围 + 构图 + 细节”。比如:“misty mountain landscape at dawn, pine trees on the hillside, a small lake at the foot of the mountain, (golden sunlight through clouds:1.2), water reflection, distant birds, 8K, wide-angle shot, realistic texture”。反向提示词:“blurry, flat colors, messy, low detail, pixelated”。生成的风景会有层次感,光影和细节都比较到位。
二次元插画的话,侧重 “线条 + 色彩 + 风格”。比如:“anime girl with twin tails, big purple eyes, wearing a school uniform, (running on the cherry blossom road:1.2), pink petals flying, bright colors, soft lines, (Studio Ghibli style:1.1), 8K, clean lineart”。反向提示词:“messy lines, low contrast, blurry, duplicate”。这样生成的画面线条干净,风格统一,符合二次元的特点。
🔍 优化提示词的小窍门:快速提升效果
最后说几个新手容易忽略的小技巧,能让提示词效果翻倍。
多做 “对比测试”。同一个需求,换几个关键词试试。比如生成 “猫”,分别用 “cat”“persian cat”“a fluffy persian cat with blue eyes”,看哪个效果最好。通过对比能快速找到 AI “喜欢” 的描述方式 —— 通常越具体、带特征的词效果越好。
善用 “参考词库”。如果不知道该加什么细节,可以记几个通用优质词:光影类(cinematic lighting, soft shadow)、质感类(realistic texture, sharp focus)、清晰度类(8K, ultra-detailed, high resolution)。这些词几乎适用于所有场景,加在提示词末尾,能提升画面整体质量。
别忽视 “模型匹配”。不同模型对提示词的响应不同。比如写实模型(如 RealVis)对 “photorealistic, skin texture” 反应好;二次元模型(如 AnimeV3)对 “anime style, clean lineart” 更敏感。用对模型再配合对应提示词,效果会事半功倍。
写提示词就像和 AI “聊天”—— 你说得越清楚、越具体,它越能 get 到你的意思。刚开始不用追求完美,先按 “主体 + 风格 + 1 个细节” 的结构写,生成后看看哪里不满意,再用反向提示词排除问题,或者给优点加权重。练个两三次,你生成的图片质量肯定能明显提升。
【该文章由diwuai.com
第五 ai 创作,第五 AI - 高质量公众号、头条号等自媒体文章创作平台 | 降 AI 味 + AI 检测 + 全网热搜爆文库🔗立即免费注册 开始体验工具箱 - 朱雀 AI 味降低到 0%- 降 AI 去 AI 味】