AI图像提示词:完整的提示词工程指南,获得惊人效果
掌握AI图像提示词,使用经过验证的公式、真实示例和技巧,将模糊的想法转化为专业视觉效果。包括对比示例。
我在AI图像生成的最初三个月里写过很多糟糕的提示词。不是因为我缺乏创意,而是因为没有人教我这些模型如何解释语言的实际机制。我会输入类似"酷龙"这样的内容,然后奇怪为什么输出看起来像1987年的被拒绝的奇幻小说封面。转折点来临于我开始把提示词当作配方而不是愿望时。
在Stable Diffusion、Midjourney、Flux和其他半打模型上生成了超过60,000张图像后,我可以自信地告诉你:AI图像提示词占据了80%的等式。你选择的模型、调整的设置、运行的硬件,这些都很重要。但提示词是将一张容易被遗忘的图像与让人停止滚动的图像分开的东西。
快速回答:优秀的AI图像提示词遵循一致的结构。从媒介和风格开始,用精确的语言描述你的主题,定义构图和光线,并添加技术质量术语。一个强有力的提示词读起来像是给摄影师或画家的创意简报,而不是你会在照片下放的标题。公式是:[媒介/风格] + [具有详细信息的主题] + [环境/设置] + [光线/氛围] + [技术/质量术语]。掌握这个公式,你将在第一或第二次尝试中而不是第十五次生成专业质量的图像。
- 提示词结构比提示词长度更重要。一个集中的30字提示词胜过一个冗长的100字提示词
- 每个AI模型对提示词的解释不同。Midjourney青睐氛围,Stable Diffusion奖励精确性,Flux响应自然语言
- 负面提示词与正面提示词在Stable Diffusion工作流中同样重要
- 最好的提示词工程师会迭代。预期在找到最终图像之前要完善3-5次
- 提示词中的词序影响强调。前置术语在大多数模型中权重更高
- 学习提示词工程是AI图像生成中投资回报率最高的技能
为什么你的AI图像提示词不工作
大多数人接近AI图像生成的方式就像他们接近Google搜索一样。他们输入几个词,按回车键,希望一切顺利。这种方法可能会显示不错的网络结果,但会产生可怕的图像。原因是AI图像模型不是搜索引擎。它们是根据你的文本指令从头开始构建图像的生成系统,它们需要特异性来做好这一点。
我清楚地记得这一点对我产生影响的时刻。我试图为博客头生成一个肖像,输入了"一个女性的专业证件照"。结果是一张平淡的、中心框架的、平面照明的脸,没有个性。然后我重新写成"一位自信的40多岁商业女性的编辑肖像,来自大窗户的温暖侧光,浅景深,土色调羊毛夹克,真诚微笑,用佳能EOS R5相机配85mm f/1.4镜头拍摄,柔和散焦现代办公室背景。"天壤之别。同样的模型,同样的设置,完全不同的输出。
教训是什么?模糊的提示词产生通用图像。具体的提示词产生有个性和意图的图像。
以下是我看到人们用AI图像提示词犯的三个最常见错误。
错误1:太抽象。 "一个美丽的风景"几乎无法给模型提供任何东西。美丽如何?什么样的风景?什么时间?什么季节?什么氛围?模型必须用其训练数据的平均值填补每一个空白,而平均值根据定义是无聊的。
错误2:忽视构图。 你可能完美地描述了主题,但对框架、角度或空间关系什么都没说。结果是技术上准确的主题漂浮在随意的排列中。添加诸如"特写"、"俯视图"、"三分法构图"或"前导线"之类的术语会大大提高输出质量。
错误3:忘记技术层面。 专业摄影师考虑镜头选择、光圈、胶卷和后期处理。以字幕化摄影数据训练的AI模型对相同的术语做出反应。添加"用哈苏拍摄"、"柯达Portra 400"或"f/2.8散焦"不仅仅添加元数据。它实际上将视觉风格转向与该设备和技术相关的图像。
改变一切的提示词公式
经过数月在不同模型间的试错,我开发了一个在Stable Diffusion、Midjourney、Flux和大多数其他现代生成器上可靠工作的公式。我在Apatero上为大多数专业工作使用这个公式,它持续地提供需要最少迭代的结果。
以下是按层分解的公式。
第1层:媒介和风格(这是什么样的图像?)
这是你的开场陈述。它告诉模型在处理任何其他内容之前要在什么艺术宇宙中运作。因为大多数模型对早期标记的权重更重,这一层为后面的一切奠定了基础。
强大开场的例子:
荷兰黄金时代风格的油画电影胶片画面,变形镜头专业食品摄影,杂志品质等距3D渲染,干净最小风格水彩插图,松散笔法照片逼真数字艺术,超详细
第2层:具有具体细节的主题(这关于谁或什么?)
这是大多数人停下来的地方,但它应该只是开始。不只是命名主题。用足够的细节描述它,使得人类艺术家可以不问后续问题就能草绘它。
不好的: 一只猫
好的: 一只毛茸茸的橙色虎斑猫,有明亮的绿色眼睛,坐在一张古老的皮革扶手椅上,一只爪子搭在扶手上,直看摄像头,表情略显皇家
注意好的版本如何涵盖物种、颜色、品种特征、眼睛颜色、姿势、位置、道具互动、凝视方向和个性。这些细节中的每一个都约束了模型的输出空间,并将其推向特定的有趣图像,而不是通用的。
第3层:环境和设置(这在哪里发生?)
背景不是事后想法。它建立上下文、氛围和视觉深度。即使对于肖像,环境也承担重要的权重。我之前更详细地写过这个在我的像专业人士一样创建AI图像指南中。
不好的: 在一个房间里
好的: 在一个阳光充足的巴黎公寓内,高窗户配有透明白色窗帘,陈旧硬木地板,一个花瓶里的枯萎向日葵放在一个小桌子上,午后光线投射长阴影
第4层:光线和氛围(这感觉如何?)
光线是提示词工程中不被重视的英雄。专业摄影师痴迷于光线是有原因的。它将相同的主体转化为完全不同的情感体验。同一个女人穿同样的服装在金色时刻背光下看起来魅力,而在严酷的头顶荧光灯下看起来压抑。
强光术语值得记住:
金色时刻,温暖背光(浪漫,温暖)戏剧明暗对比,深阴影(强烈,电影感)柔和散光阴天(温柔,编辑)霓虹照明,赛博朋克氛围(未来,充满活力)工作室伦勃朗光线,单一主光(古典肖像)体积雾,上帝光线通过窗户(大气,飘然)
第5层:技术和质量提升(使其看起来精致)
这最后一层是你的最后涂层。这些术语推动输出指向更高的视觉质量和更精致的审美。把它们看作烘焙到提示词中的后期制作指令。
我定期使用的可靠质量提升:
8K分辨率,高度详细用哈苏X2D拍摄或用索尼A7R V拍摄85mm肖像镜头,f/1.4获奖摄影在ArtStation上趋势(用于数字艺术风格)杰作,最佳质量(特别有效在动漫训练模型中)
完整公式的实际应用
让我把所有五层结合在一起,并进行对比。
前(典型提示词):
一个向导在森林里
后(应用公式):
高度详细的数字奇幻绘画。一位风化的年长向导,长银胡子和深凹蓝眼睛,穿着午夜蓝和深绿色分层长袍,握着一根节疤橡木员杖,顶端有微弱发光的琥珀水晶。站在古老森林的边缘,由扭曲根部覆盖青苔的巨型树木,柔和雾气在树干间滚动,发光蘑菇点缀森林地板。金色时刻光线通过树冠过滤,体积光线,温暖脸部亮点与冷森林阴影形成对比。8K,复杂细节,奇幻艺术,在ArtStation上趋势
第二个提示词不仅更长。每个词都在做具体的工作。没有填充,没有冗余,只是分层细节,为模型提供全面的创意简报。
每种风格的最佳AI图像提示词
我从通过Apatero运行数千代生成中学到的一件事是,不同的视觉风格需要不同的提示策略。对肖像照片逼真的工作会对动漫插图失败,反之亦然。以下是我为最受欢迎的风格完善的最佳AI图像提示词,以及每个选择后面的原因。
照片逼真肖像
照片逼真是技术摄影术语大放异彩的地方。模型已经看过数百万字幕摄影,所以说摄影语言触发正确的神经通路。
提示词例子:
一个晚30多岁男人的编辑肖像照片,短黑发和修整整齐的胡子,穿着炭灰色羊毛高领毛衣。在自然光的咖啡馆拍摄,来自大店面窗户的温暖环境光,浅景深,背景中模糊顾客和温暖灯光柔和散焦。在佳能EOS R5配RF 85mm f/1.2L镜头上拍摄,自然皮肤纹理,微妙胶卷颗粒,用温色调进行色彩分级,专业修饰
为什么有效: 相机机身和镜头名称、光圈值和后期处理术语都将模型推向其摄影训练数据。环境细节创造可信的上下文。
动漫和漫画
动漫模型响应完全不同的词汇。术语如"杰作"和"最佳质量"实际上是基于检查点的动漫生成器所需的,字符描述约定与现实提示不同。
提示词例子:
杰作,最佳质量,1女孩,长流银发,深红眼睛,详细脸部,温和表情,穿着有金色装饰的深学院制服,站在有高耸书架的广阔图书馆,温暖灯光,光线中浮动灰尘粒子,从下方动态角度,详细手,复杂衣服褶皱,工作室吉卜力色彩板,柔和单元格着色
为什么有效: 动漫模型在标签数据集上训练(如Danbooru),使用逗号分隔的描述符而不是自然句子。术语如"1女孩"和"详细脸部"是这个标记惯例的一部分。
概念艺术和奇幻
对于概念艺术,你想要用专业概念艺术家和艺术总监的语言发言。这些提示词受益于参考特定艺术家、艺术运动或建立的视觉风格。
提示词例子:
史诗奇幻概念艺术,一条巨大古龙栖息在崩坏哥特式大教堂顶端,巨大翼展展开对抗湍动暴风雨天空,闪电照亮其黑曜石鳞片,下面的毁坏城市笼罩在烟雾和灰烬中,微小逃离村民的剪影显示规模,哑光绘画风格,电影构图,详细环境设计,深暗氛围配有温暖火焰口音,受经典奇幻插图视觉语言启发,4K,环境概念艺术
为什么有效: 规模参考("微小剪影显示规模")、艺术行业术语("哑光绘画风格"、"环境概念艺术")和大气细节创造概念艺术需要的戏剧、详细输出。
产品摄影
这是提示词工程真正替代许多用例中昂贵工作室拍摄的区域。大约一年前,我开始为模型使用AI生成的产品快照,对质量变为生产就绪的速度感到惊讶。
提示词例子:
专业产品摄影,奢侈香水瓶配琥珀液体,几何水晶切割玻璃设计,坐在抛光黑大理石表面上。单产品英雄拍摄,柔和工作室光线,45度单一大柔光箱,大理石上微妙反射,干净白色背景过渡到柔和灰色渐变,无文本,无标签。用中等格式相机、100mm微距镜头、f/8拍摄,焦点堆积以获得完全锐度,商业广告质量
为什么有效: 产品摄影有严格的惯例(干净背景、控制光线、尖锐焦点),使用该学科的术语精确指导模型。
如何为Stable Diffusion写AI图像提示词
Stable Diffusion值得有自己的部分,因为它处理提示词的方式与Midjourney等基于API的服务不同。如果你运行ComfyUI或Automatic1111,你可以访问提示词加权、负面提示词和其他语法特性,这些大大扩展你的控制。我在我的文本转图像AI生成上覆盖了更广泛的工作流程,但这里我想专注于提示词方面。
提示词加权
Stable Diffusion允许你使用括号和数值权重强调或去强调特定术语。一旦你理解它,这是不可思议的强大。
(word:1.3)将强调增加30%(word:0.7)将强调减少30%((word))是大约1.21x强调的简写(((word)))是大约1.33x强调的简写
实际例子:
一个女性的肖像,(雀斑:1.4),(红色卷发:1.2),绿色眼睛,穿着(古董花卉连衣裙:0.9),站在阳光照的草地上
在这个提示词中,雀斑被强烈强调,所以它们突出显示,红色卷发被适度强调,古董花卉连衣裙被稍微去强调,所以它不支配构图。这种细粒度控制是你简单无法用Midjourney或DALL-E获得的。
BREAK关键字
当你的提示词很长时,Stable Diffusion分77个令牌的块处理它。BREAK关键字强制新块边界,当重要细节在长提示词结尾处被忽视时,这会有帮助。
例子:
详细奇幻风景,建入山坡的古老精灵城市,水晶桥上级联瀑布,生物发光花园 BREAK 金色时刻阳光,戏剧云层形成,体积光线通过雾,高度详细,8K分辨率,哑光绘画
这确保光线和质量术语启动新的处理块并接收完全注意力,而不是被早期内容稀释。
你真正需要的负面提示词指南
这是我对负面提示词的热门观点:大多数人过度复杂化它们。我已经看到负面提示词比实际提示词更长,塞满了从Reddit线程复制的几十个术语而不理解它们做什么。根据我的经验,一个集中的10-20项负面提示词比一个有50+项的臃肿提示词工作得更好。
热门观点一: 大量负面提示词列表是弱正面提示词的拐杖。如果你需要告诉模型80样东西不做,你的正面提示词可能不够具体。首先修复正面提示词,然后使用负面提示词处理剩余的边缘情况。
这样说,负面提示词对于特定问题确实有用。这是我不同场景的标准负面提示词模板。
对于照片逼真图像:
变形,模糊,坏解剖,额外肢体,绘制不好的脸部,突变,毁容,水印,文本,标志,低质量,jpeg伪迹,丑陋,重复
对于动漫/插图:
最坏质量,低质量,正常质量,低分辨率,坏解剖,坏手,额外手指,更少手指,文本,水印,签名,模糊,裁剪
对于产品摄影:
文本,水印,标志,模糊,扭曲,变形,低分辨率,忙碌背景,杂乱,产品上的阴影,过曝,曝光不足
关键洞察是负面提示词应该针对你实际观察到的特定失败模式。如果你的模型不断生成水印,添加"水印"到负面提示词。如果它不断产生额外手指,添加"额外手指"。但不要盲目粘贴你在网上找到的50个术语。每个不必要的负面术语稍微稀释重要术语的影响。
AI艺术提示词创意:10个创意概念尝试
我发现初学者的最大障碍之一是简单地不知道生成什么。你有这个强大的工具和空白文本框,选择悖论开始。以下是十个创意AI提示词概念我有很好的结果,配有你可以修改的起始提示词。
1. 不可能的建筑
不可能建筑的建筑摄影,MC Escher启发,自己循环回来的楼梯,违反重力的走道,粗野混凝土和玻璃建筑,阴天,用移轴镜头拍摄,专业建筑摄影
这个类别工作美丽因为AI模型可以创建物理上无法存在的结构,结果始终是有趣的。
2. 现代设置中的历史人物
坦诚街道摄影,列奥纳多达芬奇穿着现代裁缝西装,坐在东京路边咖啡馆,用强烈好奇检查智能手机,自然街道照明,背景路人,纪录摄影风格
3. 微观世界
极端微距摄影,一个迷你奇幻城市建在草叶上的露珠内部,微小发光窗口,可见水表面的鹅卵石街道,清晨光线通过水滴折射,焦点堆积,科学摄影质量
4. 作为风景的情感
代表怀旧感觉的超现实风景,弯曲道路通过金色麦田通向遥远童年家,温暖夕阳颜色褪到冷twilight,分散偏光照片漂浮在微风,梦幻般的氛围,软焦点,绘画般的质量
5. 烹饪静物
荷兰黄金时代静物绘画,现代快餐排列在古典构图中,一个汉堡包在烤野鸡会的地方,法式炸薯条在银器皿中,戏剧窗口光,深色背景,油画纹理,丰富温暖色调
6. 职业中的动物
企业证件照,一只金色寻回犬穿着完美定制的海军商业西装,自信和专业表情,工作室光线配灰色背景,浅景深,LinkedIn档案风格,照片逼真,幽默但庄严
7. 气候未来
未来海滨城市的摄影新闻画面,一半浸没在上升海面,建筑物随着漂浮平台和水位走道适应,人们进行日常生活,午后光线,纪录摄影风格,逼真和接地
8. 融合美食盘装
专业食品摄影,一个完全由墨西哥配料制成的寿司卷,鳄梨用薄玉米粉卷,沙拉在酱油会的地方,香菜装饰排列有日本精确,干净白盘,柔和定向工作室光
9. 音乐可视化
代表爵士乐即兴演奏的抽象数字艺术,流动有机形状在午夜蓝和温暖黄金,分散节奏模式像雨,中心漩涡形式暗示萨克斯风旋律,充满运动和能量的动态构图,深色背景,高对比
10. 遗弃技术
后启示录摄影,一个巨大复古1960年代大型计算机过度生长藤蔓和青苔,坐在破损窗户遗弃办公室,森林通过地板生长,斑驳阳光,有机自然和有角度技术对比,忧郁氛围
这些概念中的每一个都用作起点。魔法发生于你开始用自己的细节修改它们,改变光线,交换设置或混合两个概念时。
Midjourney提示词指南:不同工作原理
我需要特别处理Midjourney,因为它处理提示词方式与Stable Diffusion模型相当不同,许多人两者都使用。Midjourney响应更多对氛围和氛围语言和更少对技术摄影规格的(虽然它仍然理解它们)。
热门观点二: Midjourney的优势不在于遵循精确指令。它在于与你创意合作。如果你想要每个元素的像素完美控制,Stable Diffusion配ControlNet是更好的选择。但如果你想要模型与你创意合作,Midjourney的"松散"实际上是优势。
以下是为每个平台提示相同的概念。
Stable Diffusion版本:
一个年轻女性的专业肖像照片,(眼异色症:1.3),一只蓝眼睛和一只绿眼睛,栗色头发在凌乱包中,轻雀斑鼻子,穿着超大奶油针织毛衣,坐在窗台上,雨在窗玻璃上,来自阴天天空的柔和自然光,浅DOF,用索尼A7III配85mm f/1.8镜头拍摄,胶卷仿真,温色调
Midjourney版本:
一个眼异色症女人的肖像,一只蓝眼睛一只绿,栗色头发松散固定,雀斑,舒适针织毛衣,雨窗光,沉思氛围,亲密温暖,编辑摄影 --ar 2:3 --style raw
注意Midjourney版本更短和更令人回味。它关注感觉和氛围而不是技术规格。Midjourney的--style raw参数给你更多照片结果,而--stylize(默认)添加更多Midjourney的特征美学。
关键Midjourney参数
--ar 16:9或--ar 2:3宽高比--style raw更字面提示词解释--stylize 50(低)到--stylize 750(高)艺术解释水平--chaos 0-100生成图像之间的变化--no跟随术语充当负面提示词
高级提示词工程技巧
一旦你掌握了基础,有几个高级技巧可以进一步推动你的结果。这些是我每天在Apatero上用于客户工作的技巧,它们将中级提示词工程师与高级的分开。
技巧1:风格混合
在单个提示词中结合两个或更多不同的视觉风格,创建真正新奇的东西。模型在风格之间插值并生成感觉新鲜和原始的结果。
例子:
文艺复兴油画风格与赛博朋克美学结合的肖像,一个在精细16世纪装扮中的贵族女人,织进面料的霓虹电路图案,传统褶边领子用全息光发光,古典姿态和构图,混合霓虹口音光的明暗对比光线,油画笔纹理带数字故障伪迹
这有效因为模型可以混合来自两个域的训练数据。古典和未来元素之间的张力创造视觉兴趣,两者都无法单独达到。
技巧2:摄像机方向语言
不是静态描述图像,而是描述它,好像你在指导摄像机操作员。这种方法对于动态构图工作惊人得好。
例子:
摄像机慢慢推向一个侦探站在雨浸小巷结尾,从低角度拍摄强调其轮廓对他身后霓虹灯,架焦从前景积水反射城市灯到他的脸,变形镜头耀斑,35mm胶卷颗粒,新黑暗电影摄影
运动语言("推入"、"架焦")不会创建实际运动,但它使模型倾向生成具有电影深度和意图的图像。
技巧3:情境锚定
参考你的模型有强训练数据的特定真实世界语境。这将你的图像锚定在可识别的视觉语言中,同时让你自定义细节。
例子:
国家地理封面摄影,一只北极狐在粉雪中中途跳跃,以1/2000快门速度捕捉冻结运动,雪晶体在空气中悬浮,严冬阳光在狐白毛皮上创建边缘光,纯白环境,野生动物摄影,佳能EOS R3配400mm远摄镜头
通过锚定到"国家地理封面摄影",你激活模型训练数据中高质量专业拍摄的野生动物图像的特定集群。结果立即拥有与该出版物相关联的重量和技术波兰。
技巧4:情感温度
这是我意外发现的东西,现在经常使用。用感觉语言描述场景的情感"温度"产生比纯视觉描述更令人回味的结果。
例子:
一个书店在关闭前的安静,温暖灯光池在深色木架子上,数千个故事的权重在空气中悬挂,一个读者吸收窗边的书,外面世界模糊和遗忘,亲密冥想氛围,自我选择独处的舒适感
创作内容每月赚取$1,250+
加入我们的独家创作者联盟计划。根据病毒视频表现获得报酬。以完全的创作自由按您的风格创作内容。
不是这个提示词中的每个词都映射到视觉元素,但情感语言影响模型关于颜色温度、构图和空间关系的选择,方式纯技术提示词无法做。
常见提示词错误带对比前后修复
我想给你一些具体的对比示例,因为看到实际上下文中的纠正比抽象建议更有用。对于选择合适的工具以获得图像的更深入视察,查看我的2026年最佳AI图像生成器比较。
错误:无构图方向
前: 一个骑士在田间的马
后: 史诗宽角度拍摄,一个孤独的中世纪骑士在完整板甲装上,骑一匹黑色战马,位置在框架右三分之一,广阔开放田间延伸到遥远山脉,戏剧风暴云聚集在上方,晚午侧光投射长阴影,风吹弯草,强前导线从田间指向骑士的电影构图
错误:矛盾术语
前: 明亮晴朗暗沉压抑肖像,快乐悲伤表情,多彩黑白
后: 压抑低关键肖像,戏剧侧照深阴影,去饱和色彩板向冷蓝和灰倾斜,沉思表情有下巴些许张力,深色工作室背景
矛盾提示词困惑模型并产生不连贯的结果。选择方向并承诺它。
错误:太多主体
前: 一个龙和一个骑士和一个向导和一个公主和一个城堡和一个森林和一个河和山和星
后: 奇幻插图,一条龙和一个骑士在石桥上锁定战斗在雾气深渊,骑士的盾举起反对蓝龙火爆,戏剧低角度,关注冲击时刻,深暗奇幻氛围,详细盔甲和鳞片纹理
每个额外主体稀释模型的注意力。更少主体有更多细节胜于许多主体无细节,每次。
构建你自己的AI图像提示词生成器
热门观点三: AI提示词生成器工具大多不必要,如果你理解公式。大多数它们只是从数据库随机化术语列表,结果感觉随机因为它们是。你更好地构建个人库提示词分段你知道与你首选模型工作好。
这样说,有一个结构化模板填充是真实有帮助,特别是当你生成图像迅速时。这是我用的模板。我把它看作"提示词生成器"在我的头中运行而不是在应用程序中。
我的个人提示词模板:
[风格]: _________________ (例如,油画,摄影,3D渲染)
[主体]: _________________ (谁/什么,与3-5个具体细节)
[动作/姿态]: _________________ (他们在做什么)
[设置]: _________________ (哪里,有2-3个环境细节)
[光线]: _________________ (类型,方向,氛围)
[摄像头]: _________________ (镜头,角度,景深)
[质量]: _________________ (分辨率,细节水平,参考)
[氛围]: _________________ (一个或两个情感描述)
填充示例:
[风格]: 电影胶卷画面,变形宽屏
[主体]: 一个疲惫宇航员,裂开头盔面罩,
灰尘覆盖白色宇航服,头盔内可见凝结
[动作/姿态]: 膝盖在沙子中,一只手按进地面
[设置]: 火星表面,铁锈红沙漠延伸到地平线,
遥远的岩石形成,薄氛围
[光线]: 严肃定向阳光从左上角,
长戏剧阴影,温暖琥珀色调
[摄像头]: 广角24mm镜头,低角度拍摄,
深景深,一切锐利
[质量]: 8K,照片逼真,超详细,
科幻电影制作价值
[氛围]: 隔离,决心
组合提示词:
电影胶卷画面,变形宽屏。一个疲惫宇航员,裂开头盔面罩和灰尘覆盖白色宇航服,头盔内可见凝结,膝盖在红沙中,一只手按进地面。火星表面,铁锈红沙漠延伸到地平线,遥远的岩石形成,薄朦胧氛围。从左上角严肃定向阳光投射长戏剧阴影,温暖琥珀色调。广角24mm镜头,低角度拍摄,深景深。8K,照片逼真,超详细,科幻电影制作价值。隔离和安静决心的感觉。
这个模板方法为你一致性没有随机。一旦你内化类别,你可以在大约30秒内在心理中填充它们。
60,000+代生成的提示词提示和技巧
我想用从60,000+代生成中获得的经验结束主教程部分的列表。这些是我希望有人在我开始时告诉我的种东西。每一个来自我在Apatero上的工作和个人项目期间遇到的具体挫折和解决。
1. 前置最重要的术语。 大多数模型对提示词中更早出现的词给予更高权重。如果风格是最重要方面,首先放置它。如果主体最重要,用那个领导。
2. 使用具体名词而不是抽象形容词。 "一个女性站在一个1967福特野马Fastback旁边"给模型比"一个女性站在一个酷古董车旁边"更多工作。特异性是你的朋友。
3. 参考实摄影术语即使对于插图。 术语如"金色时刻"、"边缘光"和"浅景深"影响插图和绘制的输出也是,不仅仅是照片逼真的。模型已经学会这些概念作为视觉属性,不仅仅是摄影技巧。
4. 描述你想要什么,不是你不想要什么。 保存负空间为实际负面提示词。写"一条狗,不是猫,不是鸟,没有其他动物"浪费正面提示词空间。改写"单个金毛寻回犬,单独"。
5. 一次测试一个变量。 当提示词不工作时,改变一个东西在代生成之间。如果你一次改变五个东西,你不会知道哪个改变修复了问题或者哪个打破了什么。
6. 保持提示词日志。 我维护一个简单文本文件,我在其中保存产生出色结果的提示词,连同模型和使用的设置。这个提示词库已经成为我最有价值的资源之一。时间超时,模式出现关于对你特别工作。
7. 学习真实艺术和摄影。 我知道的最好提示词工程师不仅技术熟练。他们理解视觉艺术。他们知道什么使强构图,为什么某些色彩板唤起某些情感,以及专业摄影师如何使用光。这个知识直接转化为更好的提示词。
8. "详细"词被过度使用和未指定。 代替说"详细",说你想要什么样细节。"可见木谷纹理"、"单个睫毛"、"复杂蕾丝图案"所有给模型具体细节目标,而不是模糊指令添加更多东西。
对于生成真正专业质量输出的更多技巧,看看我的专业AI图像生成指南。
2026年跨不同模型的提示词工程
AI图像生成景观已经显著演变。每个模型有其怪癖和优势,相同提示词将根据你在哪里运行它而产生不同的结果。这是如何适应你提示策略的快速概览。
Stable Diffusion XL和SD 3.5: 响应好逗号分隔描述符和提示词加权语法。负面提示词是必需的。受益于检查点特定触发词。最好对于想要最大控制的用户。
Flux(Pro和Dev): 处理自然语言提示词异常好。你可以用对话句子写它并且它遵循指令准确。较少依赖关键字填充。当我需要精确提示词遵守时我最常伸出的模型。
Midjourney v6/v7: 艺术解释很强。更短、更令人回味的提示词通常比极长的工作得更好。--style raw标志必需以减少"Midjourney外观"。参数标志处理宽高比、风格化和混乱。根据Midjourney文档,v7有显著改进的提示词跟踪。
DALL-E 3(通过ChatGPT): 独特在ChatGPT在发送给模型前重写你的提示词。与自然语言描述最有效工作。更少直接控制但对初学者非常可访问。OpenAI文档提供有帮助指南关于为最佳结果结构化提示词。
Nano Banana和快速模型: 这些速度优化模型与简洁、聚焦提示词工作得最好。他们处理极长提示词与它们的更大对应方不一样好,但他们完美对于快速迭代和概念探索。
理解这些差异是关键。为Stable Diffusion优化括号权重的提示词将困惑Midjourney,一个短令人回味的Midjourney提示词可能不给Stable Diffusion足够工作。匹配你的提示词风格到你的模型。对于更广阔的看跨所有这些平台文本如何变成图像,我的文本转图像AI文章覆盖基础。
常见问题
最好的AI图像提示词给初学者什么?
从本指南覆盖的五层公式开始:媒介/风格,有细节的主体,环境,光线和质量术语。一个强初学者提示词遵循模式"一个[风格]的[详细主体]在[设置],[光线描述],[质量术语]"。关注具体一个东西一次而不是尝试同时控制一切。随着经验,你自然会添加更多层细节到你的提示词。
AI图像提示词应该有多长?
对于大多数模型,30-75词是甜点。更短提示词给模型太多创意自由(这通常意味着通用结果),而极长提示词可以导致重要细节被稀释或忽视。Stable Diffusion在77-令牌块中处理提示词,所以保持你最重要术语在第一块内确保它们接收完全注意力。Midjourney一般60词下表现最好。
负面提示词真的做出区别吗?
是的,但比大多数人认为的更少。一个好结构的正面提示词远更有影响力于负面提示词。负面提示词最好用于处理特定、重复你观察到的问题,如额外手指、水印或模糊。从论坛复制大量负面提示词列表没有理解它们可以实际上通过过度约束模型降低你的结果。
Stable Diffusion vs. Midjourney的提示词间的区别是什么?
Stable Diffusion响应好逗号分隔关键字列表、括号提示词加权和技术摄影术语。Midjourney首选更自然语言描述专注于氛围和艺术意图。Stable Diffusion需要显式负面提示词,而Midjourney使用--no参数对于相同概念的更简单版本。两者受益于具体主体描述,但Midjourney对模糊提示词更原谅。
我可以使用跨不同AI图像模型相同的提示词吗?
你可以,但你不应该期望相同的结果。每个模型基于其训练数据和架构以不同的方式解释提示词。一个优化对一个模型的提示词可能对另一个产生低质量结果。最好方式是学习核心公式然后适应它对于每个平台的特定优势和语法要求。
我如何在多个图像中获得一致的字符?
字符一致性是AI图像生成中更难挑战之一。对于Stable Diffusion,在你的字符训练LoRA是最可靠的方法。对于Midjourney,使用详细字符描述与一致衣着和特性描述帮助。Flux的提示词跟踪能力使其通过纯提示词之一更好的选择以维护一致。
对于销售印刷的最好的AI艺术提示词什么?
产生印刷值艺术的提示词通常包括强构图术语("三分法"、"黄金比例")、高分辨率质量修饰符("8K"、"高度详细")和独特艺术风格描述。抽象艺术、风景和风格化肖像倾向最好销售。避免产生过度通用结果的提示词。市场奖励独特、视觉上惊人的人想展示在家的构图。
我如何避免生成图像中的"AI外观"?
"AI外观"通常来自过度光滑皮肤纹理、完美对称和某些光亮质量。通过添加术语如"自然皮肤纹理"、"轻微不对称"、"微妙不完善"、"胶卷颗粒"和"真实的感觉"抵抗这个。参考特定胶卷库存(如"柯达Portra 400"或"Fuji Pro 400H")也帮助引入数字完美缺乏的有机质量。
为什么我的提示词保持生成额外手指或变形的手?
手仍然是大多数AI图像模型的挑战,虽然最新的版本已经改进。使用负面提示词针对"额外手指,变形的手,坏解剖"并包括正面术语如"完美形成的手,五个手指,解剖上正确"。当可能时,构成你的场景以手不是焦点,或使用修补以在后处理中修复手问题。Flux和SDXL与更早版本相比处理手明显更好。
AI图像提示词中词的理想顺序是什么?
是的。大多数模型给更高权重给提示词中更早出现的术语。首先放置你最重要的描述符。建议的常规顺序是:媒介/风格、主要主体、关键属性、设置/环境、光线、氛围和质量修饰符。如果特定元素对你的远见至关重要,关于此默认顺序移动它向前。
最后想法
AI图像的提示词工程不是黑艺术。它是一个可学习的技能有清晰的原则和模式。我在本指南中分享的公式,五层方法媒介、主体、设置、光线和质量,有效因为它镜像专业创意如何总是传达视觉想法。艺术总监写创意简报。摄影师分享拍摄列表。概念艺术家接收设计文档。你的AI图像提示词简单地是相同实践的现代版本。
我可以推荐的最大转变是停止认为提示词作为搜索并开始认为它作为指导。你不要求模型找一个图像。你告诉它准确创建什么。你越精确地传达你的远见,模型越精确地提交它。
开始与公式,练习与这篇文章中的示例,并随着时间累积你的个人提示词库。在几周之内,你将直觉地写有效的AI图像提示词,以及你的工作与平均生成图像之间的质量差距将是明显的。
现在去制作值得看的东西。
准备好创建你的AI网红了吗?
加入115名学生,在我们完整的51节课程中掌握ComfyUI和AI网红营销。
相关文章
游戏开发者的AI艺术完全指南:资产创作全攻略
学习独立游戏开发者如何使用AI生成概念艺术、精灵图、背景和UI界面。将AI整合到游戏资产制作流程中的实用工作流程。
如何使用AI为自助出版创建专业书籍封面
使用AI图像生成器设计令人惊艳的书籍封面。完整指南适用于自助出版的作者,涵盖从奇幻到浪漫再到惊悚的每个流派。
AI一致性角色生成器:如何在多个图像中保持相同的角色
学习如何使用LoRA训练、IPAdapter、Midjourney cref和参考图像技术在多个场景中生成相同的AI角色。完整的2026指南。