Seedance 2.0 上手指南:把“脑子里的画面”做成多镜头长视频 🎬
Seedance 2.0 的卖点很直白:文字、图片、视频、音频都能当输入,然后输出更长、更多镜头、质量更稳的视频。
官方宣传很猛(“最强视频模型”这种话你就当口号听听),但有一件事是真的:工作流做对了,成片会舒服很多。这篇就按“你真要发片/交作业”的方式讲,少废话,多可复制。
你会用到的 4 种输入(怎么选更省事)
Seedance 2.0 支持:
- 文字(Text):写剧情、镜头、风格、景别、运动。
- 图片(Image):锁定角色长相、服装、画面质感。
- 视频(Video):参考动作、机位运动、节奏剪辑。
- 音频(Audio):节奏、情绪、氛围(适合音乐短片、广告、口播配画面)。
怎么选?给你一个“懒人决策表”:
- 只想快速出一个概念片:文字 +(可选)参考图
- 角色不能走样(做系列内容/品牌片):参考图必上
- 想复刻某段运镜或动作:塞参考视频
- 需要卡点、氛围跟音乐走:加音频
真正决定成片质量的:把“长视频”拆成多镜头
很多人一上来就写一段超长提示词,指望模型自己帮你拍电影。
结果通常是:画面像在做梦,角色忽男忽女,场景忽远忽近。
更稳的方式是:你来当导演,把长视频拆成镜头清单。
一个好用的镜头拆分方法(你照抄就行)
用 6 个字段写每个镜头:
- 时长:3–6 秒更稳(真要长镜头,后面讲怎么做)
- 景别:近景/中景/全景
- 主体:谁在画面里,穿什么,有什么标志物
- 动作:在做什么,动作从哪到哪
- 镜头运动:推/拉/摇/移/跟拍/手持
- 光线与风格:日落逆光、霓虹夜景、胶片颗粒、写实/动画等
示例(多镜头短片脚本):
片名:雨夜外卖员
统一风格:写实电影感、轻微胶片颗粒、冷暖对比、城市雨夜反光
Shot 1(4s):全景,雨夜街口,外卖员骑电动车冲进画面,路灯反光,镜头轻微手持
Shot 2(4s):中景,外卖员停下掏手机看地址,雨滴打在屏幕上,镜头缓慢推近
Shot 3(5s):近景,外卖箱拉链被拉开,热气冒出,暖色光打在手上,镜头固定
Shot 4(5s):跟拍,外卖员小跑进小巷,霓虹灯闪烁,镜头从背后跟随
Shot 5(4s):近景,门打开一条缝,一只手接过餐,外卖员松口气,镜头轻微拉远
你会发现:每个镜头都很具体。模型不需要猜,你也更容易迭代。
提示词写法:少堆形容词,多写“可拍的指令”
很多提示词像这样:
史诗感、电影级、超高清、震撼、细节爆炸……
这类词对稳定性帮助不大。
更有效的是:把信息写成摄影现场能执行的描述。
一套通用提示词模板(直接复制)
主体:
- 角色/物体外观(发型、衣服、年龄感、标志物)
- 情绪状态(紧张、放松、兴奋)
场景:
- 地点 + 时间(雨夜街口/清晨厨房/黄昏沙滩)
- 关键道具(雨伞、外卖箱、霓虹灯牌)
镜头:
- 景别(近景/中景/全景)
- 镜头运动(推近/跟拍/手持)
- 构图(居中/三分法/前景遮挡)
风格:
- 写实/动画/定格/赛博朋克/胶片质感
- 光线(逆光、侧光、霓虹、柔光)
约束(非常重要):
- 角色一致:同一张脸、同一套服装
- 不要出现:文字水印、畸形手、额外人物、画面闪烁
把“约束”写清楚,少翻车。
图片参考怎么喂:用它来“锁人设”和“锁质感”
你想做系列视频,最怕什么?
第一集是清爽少年,第二集突然变成大叔。
解决思路:用参考图固定。
建议准备两类图片:
- 角色参考图:正脸清晰、光线干净、遮挡少
- 风格参考图:你喜欢的色调/镜头语言/材质(比如胶片颗粒、霓虹反光)
小技巧:
- 角色图越“干净”,一致性越好(别上来就戴墨镜、半张脸被头发挡住)
- 风格图别太复杂(信息太多,模型容易乱抄)
视频参考怎么用:别拿整段丢进去,挑“你要它学的东西”
视频参考最适合两件事:
- 动作:走路、转身、舞蹈、手部操作
- 运镜与节奏:跟拍、推拉、剪辑速度
更稳的做法:
- 挑 3–8 秒的片段
- 明确告诉它“学什么”:比如“学习运镜,不要复刻人物长相”或“学习动作节奏,保持我的角色外观”
你不说清楚,它就容易“照抄人脸”,然后你就尴尬了。
音频输入的正确打开方式:让画面跟着节奏走
音频特别适合:
- 卡点短片(音乐一来,镜头就跟着换)
- 氛围片(环境音决定情绪:雨声、地铁、城市嗡鸣)
- 口播配画面(你说到哪,画面就展示到哪)
实操建议:
- 节奏明显的音乐更好驱动(鼓点清晰那种)
- 你在提示词里写清楚:
- “剪辑跟随鼓点”
- “低频重时画面更暗/更快”
- “副歌镜头更大、更亮”
想做“长镜头”?别硬撑,用分段拼接更稳
很多人想要那种一镜到底。
现实一点:模型更擅长短段稳定输出。
更靠谱的方案:
- 把长镜头拆成 3 段连续动作
- 每段都保持:同场景、同角色、同镜头方向
- 输出后用剪辑做无缝转场(运动模糊/遮挡切/快速推近都好用)
你会得到“像长镜头”的效果,但稳定性直接起飞。
一份“避坑清单”:90% 翻车都在这里 😅
- 提示词太虚:全是“高级感、电影级”,没有具体动作和镜头。
- 镜头太长:一口气 20 秒,还要换场景换动作,模型容易崩。
- 参考图太花:人脸被遮挡、光线极端、妆造太复杂,导致一致性差。
- 一次塞太多要求:既要赛博朋克又要古风还要黏土动画,画面不疯才怪。
- 没写约束:不写“不要水印/不要额外人物/不要畸形手”,你会得到惊喜(惊吓)。
直接可用的 3 套成片配方
配方 A:产品广告(10–20 秒)
- 输入:文字 + 产品图 +(可选)音乐
- 结构:3–5 镜头
- 核心:产品特写、材质表现、使用场景
提示词关键句:
- “产品始终保持同一外观与比例”
- “微距特写,强调材质反光与边缘细节”
配方 B:IP 连载短剧情(30–60 秒)
- 输入:角色参考图 + 文字分镜
- 结构:6–10 镜头
- 核心:角色一致 + 场景一致 + 情绪推进
提示词关键句:
- “角色脸部与发型保持一致”
- “同一套服装贯穿全片”
配方 C:卡点氛围片(15–30 秒)
- 输入:音乐 + 文字镜头清单 +(可选)风格图
- 结构:按鼓点切镜头
- 核心:节奏明确、镜头动作简单
提示词关键句:
- “剪辑点跟随鼓点/副歌切换镜头”
- “副歌提升亮度与饱和度,镜头更大景别”
你可以照着走的执行流程(不折腾版)
- 写一个 6–10 镜头的清单(每镜头 3–6 秒)
- 给角色准备 1–3 张干净参考图
- 选 1 张风格图(可选,但很有用)
- 每个镜头用模板写清楚:景别 + 动作 + 运镜 + 光线
- 生成后别急着重做:
- 哪个镜头崩,就只重做哪个镜头
- 不要把整个片子推倒重来
如果你把“分镜写清楚 + 参考素材喂对 + 约束写狠一点”这三件事做到位,Seedance 2.0 这类多模态视频模型会变得很听话。
想做什么类型的视频?剧情、广告、还是卡点氛围?你给我一个题材和时长,我帮你把镜头清单按成片标准写出来。