故事板不按宫格出图？别慌：提示词的“权限”比宫格图大

你遇到过这种崩溃吗？

宫格分镜图画得明明白白：人物站位、镜头远近、画面方向都安排好了。结果一生成——人物跑位、镜头变焦、动作改戏，甚至直接不按宫格那张图来。

这事很多时候不是运气问题，而是一个很现实的“规则”：

故事板里，每格的分镜提示词，优先级通常比宫格画面更高。

宫格画面更像“参考”，提示词才是“指令”。

你为什么会觉得它“没按宫格来”

因为你把宫格当成了：我画啥，它就照着拍。

但实际更像：

宫格图：给模型一个大概气质（构图倾向/风格氛围/角色大致长相）
分镜提示词：告诉模型“这一格必须发生什么”

所以当两者打架时，模型经常会听提示词。

典型症状：

宫格里是近景，出图变中景
宫格里两个人对话，出图只剩一个人
宫格里人物在左侧，出图跑到中间或右侧
宫格里是俯拍，出图变平视

你越觉得“怎么这么不听话”，越说明提示词在抢方向盘。

真正的控制杆：写在“宫格下面的提示词”

想让画面听话，别跟宫格死磕。

把你想要的画面信息，写进每一格下面那段提示词，效果往往立竿见影。

你可以把它理解成：

宫格图：给导演看气氛板
分镜提示词：给摄影、灯光、演员的拍摄指令

要出稳定分镜，就要把“拍摄指令”写清楚。

每格提示词怎么写？照这个清单填就行 ✅

每一格分镜提示词，建议至少包含这 6 类信息：

主体：谁在画面里（人物数量、身份、穿着特征）
动作：在干嘛（走路/转头/递东西/拥抱/拔刀）
镜头：景别 + 角度（近景/中景/远景，俯拍/仰拍/侧拍）
构图：位置关系（左/右/居中，对称/三分法，前景/背景）
环境：在哪儿（卧室/天台/地铁/雨夜街头）
风格：写你要的视觉风格（漫画/电影感/赛博/水彩/国风等）

你会发现：一旦这些写进去，宫格图“只是参考”也没那么可怕了，因为你已经用文字把画面锁住了。

提示词模板（直接复制就能用）🧩

把下面模板当填空题：

角色/主体：________（1人/2人/群像，外观关键词）
动作：________（正在做什么）
镜头：________（近景/中景/远景 + 俯拍/仰拍/平视 + 焦段感觉）
构图：________（人物在左/右/居中，前景/背景，是否对称）
场景：________（地点 + 时间 + 天气/光线）
风格：________（漫画/电影感/写实/水彩…）

想更“狠”一点的控制方式：

把你最在意的内容放在提示词前半段
关键元素重复一遍（别太多，两次够用）

示例：同一格分镜，写法不同，结果天差地别

❌ 写太虚：模型自由发挥

一个人在街上走路，氛围感，电影风

可能会发生什么？

人物性别变了
走路变成跑步
街道变成巷子
镜头远近乱跳

✅ 写到位：画面就会“收敛”

角色/主体：短发女生，黑色风衣，手里拿透明雨伞（1人）
动作：低头慢走，雨滴打在伞面
镜头：中近景，侧面跟拍，平视
构图：人物在画面右侧三分之一，左侧留出街道纵深
场景：夜晚雨天的霓虹街，地面反光
风格：电影感写实，冷色调，高对比

你会明显感觉：它能“按你说的拍”。

常见坑：你以为它在乱画，其实是你写法在挖坑 🧨

提示词和宫格画面矛盾：你画的是俯拍，提示词写了“平视”。它当然听提示词。
每格提示词写得一样：每一格都“电影感、氛围、精致”，那分镜差异就会被抹平。
缺少镜头信息：不写近景/远景、不写角度，镜头就会乱跳。
人物数量没写死：你想两个人对话，但没写“two people / 两人同框”，它就可能只给一个。
关键元素只出现一次：你非常在意“红色围巾”，只写一遍，模型可能当成可有可无。

一句话策略：把宫格当参考，把每格提示词当导演口令 🎬

宫格分镜图可以用来定“感觉”，但你想让它稳定输出，就得靠每一格下面那段提示词。

你想要什么画面，就把：

谁
在哪
做什么
用什么镜头
怎么构图

写清楚。

分镜就会乖很多。

故事板不按宫格出图？别慌：分镜提示词优先级更高，宫格图只是“参考图”