配资门户网官方平台古风小说想做成短视频，文生图提示词写出来像现代大片？Gemini指令定制3层锁定，人物不飘、画面不出戏

之前接了个做古风短剧的单子，对方手里有一部宋朝背景的古风小说，想把原著场景逐段转成文生图提示词，做成分镜素材，再配合短视频剪辑出来。

她之前自己试过，跑了十几张，人物造型每张都不一样，有的头发散了，有的服饰变成了明朝款，有的背景莫名出现了玻璃窗，整体看下来根本不是同一部剧。

我看了她原本的指令，问题出在三个地方：

第一没有建立固定的人物视觉档案，每次描述人物靠临时发挥；

第二没有约束画面朝代风格，AI默认走它对"古风"最宽泛的理解；

第三没有规定提示词的结构，输出格式有点随机，不适合批量用。

这三个问题，是古风文生图指令里最典型的坑，也是最容易被忽视的。

我给她重新做了一套指令，核心思路分享一下：

1. 人物视觉档案是地基，不是备注。

多人物的古风小说，最难控制的就是人物一致性。你跟AI说："欧阳春，女主，黑发"，AI每次生成对这三个字的理解都不同，发型、服饰、年龄感全靠它自由发挥，跑出来的图里同一个人可以有五种长相。

解法是在指令最前面强制建立一份人物视觉档案，格式锁死到具体参数：年龄、发型款式、发饰、服装颜色、材质、款式，外貌特征一条不漏。

然后规定一条死命令：只要画面里出现这个人物，必须在名字后紧邻位置用括号重新复述一遍完整描述，哪怕上下句只隔一个逗号，也要重复。这不是啰嗦，是给AI每次生成锁一次视觉坐标，不重复就会飘。

2. 朝代风格约束要落到"禁止清单"，不能只靠正向描述。

你在指令里写"宋朝风格"，AI会给你古风，但它对"古风"的理解边界很模糊，汉唐宋明清可能混着用，偶尔还会串入现代元素。客户那批图里出现玻璃窗，就是这个原因。

正向描述告诉AI要什么，但AI在生成时会自动填充它认为"合理"的细节，这些细节往往就是出戏的来源。

所以指令里必须同时加一份硬性禁止清单，把所有可能破坏朝代感的元素逐一列出来，比如现代城市、玻璃、霓虹灯、手机、枪械、科幻光效，明确写禁止出现，不是"尽量避免"。一旦变成禁令，AI在生成时的自由发挥空间就被压缩了，出戏概率会明显降低。

3. 提示词结构必须标准化，批量使用才能稳定。

古风短视频的分镜素材，少则几十张，多则上百张，如果每张提示词的结构都不一样，生成结果的风格一致性就很难控制，后期剪辑也会发现画面之间衔接感差。

我在指令里定了一个固定句式：人物加括号描述，接具体动作和神态，接时间和光影，接背景环境，最后是镜头语言和视角。

每一条提示词按这个顺序走，不断行、不回车，一段小说内容对应一行输出。遇到纯景物或特写物品的空镜头，开头强制标记"无人+空镜头"，和有人物的画面做区分。结构固定之后，批量跑出来的提示词在形式上是整齐的，AI处理的规律性也更强，生成结果的风格漂移明显减少。

客户用新指令跑了第一批二十张分镜，发给我看了几张，欧阳春的发型和服饰在每张图里是一致的，背景维持在宋朝院落场景，没有出现朝代错乱。

她说这是她做这个项目以来，第一次觉得可以批量用配资门户网官方平台，不用逐张去手动修改提示词。后续她在这套指令基础上继续扩展了配角的视觉档案，跑了第二批，稳定性还在。

配资通提示：文章来自网络，不代表本站观点。

全民配资股票平台 2026年多功能骑行拉力盔推荐榜