故事板不按宫格出图?别慌:提示词的“权限”比宫格图大
你遇到过这种崩溃吗?
宫格分镜图画得明明白白:人物站位、镜头远近、画面方向都安排好了。结果一生成——人物跑位、镜头变焦、动作改戏,甚至直接不按宫格那张图来。
这事很多时候不是运气问题,而是一个很现实的“规则”:
故事板里,每格的分镜提示词,优先级通常比宫格画面更高。
宫格画面更像“参考”,提示词才是“指令”。
你为什么会觉得它“没按宫格来”
因为你把宫格当成了:我画啥,它就照着拍。
但实际更像:
- 宫格图:给模型一个大概气质(构图倾向/风格氛围/角色大致长相)
- 分镜提示词:告诉模型“这一格必须发生什么”
所以当两者打架时,模型经常会听提示词。
典型症状:
- 宫格里是近景,出图变中景
- 宫格里两个人对话,出图只剩一个人
- 宫格里人物在左侧,出图跑到中间或右侧
- 宫格里是俯拍,出图变平视
你越觉得“怎么这么不听话”,越说明提示词在抢方向盘。
真正的控制杆:写在“宫格下面的提示词”
想让画面听话,别跟宫格死磕。
把你想要的画面信息,写进每一格下面那段提示词,效果往往立竿见影。
你可以把它理解成:
- 宫格图:给导演看气氛板
- 分镜提示词:给摄影、灯光、演员的拍摄指令
要出稳定分镜,就要把“拍摄指令”写清楚。
每格提示词怎么写?照这个清单填就行 ✅
每一格分镜提示词,建议至少包含这 6 类信息:
- 主体:谁在画面里(人物数量、身份、穿着特征)
- 动作:在干嘛(走路/转头/递东西/拥抱/拔刀)
- 镜头:景别 + 角度(近景/中景/远景,俯拍/仰拍/侧拍)
- 构图:位置关系(左/右/居中,对称/三分法,前景/背景)
- 环境:在哪儿(卧室/天台/地铁/雨夜街头)
- 风格:写你要的视觉风格(漫画/电影感/赛博/水彩/国风等)
你会发现:一旦这些写进去,宫格图“只是参考”也没那么可怕了,因为你已经用文字把画面锁住了。
提示词模板(直接复制就能用)🧩
把下面模板当填空题:
角色/主体:________(1人/2人/群像,外观关键词)
动作:________(正在做什么)
镜头:________(近景/中景/远景 + 俯拍/仰拍/平视 + 焦段感觉)
构图:________(人物在左/右/居中,前景/背景,是否对称)
场景:________(地点 + 时间 + 天气/光线)
风格:________(漫画/电影感/写实/水彩…)
想更“狠”一点的控制方式:
- 把你最在意的内容放在提示词前半段
- 关键元素重复一遍(别太多,两次够用)
示例:同一格分镜,写法不同,结果天差地别
❌ 写太虚:模型自由发挥
一个人在街上走路,氛围感,电影风
可能会发生什么?
- 人物性别变了
- 走路变成跑步
- 街道变成巷子
- 镜头远近乱跳
✅ 写到位:画面就会“收敛”
角色/主体:短发女生,黑色风衣,手里拿透明雨伞(1人)
动作:低头慢走,雨滴打在伞面
镜头:中近景,侧面跟拍,平视
构图:人物在画面右侧三分之一,左侧留出街道纵深
场景:夜晚雨天的霓虹街,地面反光
风格:电影感写实,冷色调,高对比
你会明显感觉:它能“按你说的拍”。
常见坑:你以为它在乱画,其实是你写法在挖坑 🧨
- 提示词和宫格画面矛盾:你画的是俯拍,提示词写了“平视”。它当然听提示词。
- 每格提示词写得一样:每一格都“电影感、氛围、精致”,那分镜差异就会被抹平。
- 缺少镜头信息:不写近景/远景、不写角度,镜头就会乱跳。
- 人物数量没写死:你想两个人对话,但没写“two people / 两人同框”,它就可能只给一个。
- 关键元素只出现一次:你非常在意“红色围巾”,只写一遍,模型可能当成可有可无。
一句话策略:把宫格当参考,把每格提示词当导演口令 🎬
宫格分镜图可以用来定“感觉”,但你想让它稳定输出,就得靠每一格下面那段提示词。
你想要什么画面,就把:
- 谁
- 在哪
- 做什么
- 用什么镜头
- 怎么构图
写清楚。
分镜就会乖很多。