
之前接了个做古风短剧的单子,对方手里有一部宋朝背景的古风小说,想把原著场景逐段转成文生图提示词,做成分镜素材,再配合短视频剪辑出来。
她之前自己试过,跑了十几张,人物造型每张都不一样,有的头发散了,有的服饰变成了明朝款,有的背景莫名出现了玻璃窗,整体看下来根本不是同一部剧。
我看了她原本的指令,问题出在三个地方:
第一没有建立固定的人物视觉档案,每次描述人物靠临时发挥;
第二没有约束画面朝代风格,AI默认走它对"古风"最宽泛的理解;
第三没有规定提示词的结构,输出格式有点随机,不适合批量用。
这三个问题,是古风文生图指令里最典型的坑,也是最容易被忽视的。
我给她重新做了一套指令,核心思路分享一下:
1. 人物视觉档案是地基,不是备注。
多人物的古风小说,最难控制的就是人物一致性。你跟AI说:"欧阳春,女主,黑发",AI每次生成对这三个字的理解都不同,发型、服饰、年龄感全靠它自由发挥,跑出来的图里同一个人可以有五种长相。
解法是在指令最前面强制建立一份人物视觉档案,格式锁死到具体参数:年龄、发型款式、发饰、服装颜色、材质、款式,外貌特征一条不漏。
然后规定一条死命令:只要画面里出现这个人物,必须在名字后紧邻位置用括号重新复述一遍完整描述,哪怕上下句只隔一个逗号,也要重复。这不是啰嗦,是给AI每次生成锁一次视觉坐标,不重复就会飘。
2. 朝代风格约束要落到"禁止清单",不能只靠正向描述。
你在指令里写"宋朝风格",AI会给你古风,但它对"古风"的理解边界很模糊,汉唐宋明清可能混着用,偶尔还会串入现代元素。客户那批图里出现玻璃窗,就是这个原因。
正向描述告诉AI要什么,但AI在生成时会自动填充它认为"合理"的细节,这些细节往往就是出戏的来源。
所以指令里必须同时加一份硬性禁止清单,把所有可能破坏朝代感的元素逐一列出来,比如现代城市、玻璃、霓虹灯、手机、枪械、科幻光效,明确写禁止出现,不是"尽量避免"。一旦变成禁令,AI在生成时的自由发挥空间就被压缩了,出戏概率会明显降低。
3. 提示词结构必须标准化,批量使用才能稳定。
古风短视频的分镜素材,少则几十张,多则上百张,如果每张提示词的结构都不一样,生成结果的风格一致性就很难控制,后期剪辑也会发现画面之间衔接感差。
我在指令里定了一个固定句式:人物加括号描述,接具体动作和神态,接时间和光影,接背景环境,最后是镜头语言和视角。
每一条提示词按这个顺序走,不断行、不回车,一段小说内容对应一行输出。遇到纯景物或特写物品的空镜头,开头强制标记"无人+空镜头",和有人物的画面做区分。结构固定之后,批量跑出来的提示词在形式上是整齐的,AI处理的规律性也更强,生成结果的风格漂移明显减少。
客户用新指令跑了第一批二十张分镜,发给我看了几张,欧阳春的发型和服饰在每张图里是一致的,背景维持在宋朝院落场景,没有出现朝代错乱。
她说这是她做这个项目以来,第一次觉得可以批量用配资门户网官方平台,不用逐张去手动修改提示词。后续她在这套指令基础上继续扩展了配角的视觉档案,跑了第二批,稳定性还在。
配资通提示:文章来自网络,不代表本站观点。