Seedance 2.0 上手指南：把“脑子里的画面”做成多镜头长视频 🎬

Seedance 2.0 的卖点很直白：文字、图片、视频、音频都能当输入，然后输出更长、更多镜头、质量更稳的视频。

官方宣传很猛（“最强视频模型”这种话你就当口号听听），但有一件事是真的：工作流做对了，成片会舒服很多。这篇就按“你真要发片/交作业”的方式讲，少废话，多可复制。

你会用到的 4 种输入（怎么选更省事）

Seedance 2.0 支持：

文字（Text）：写剧情、镜头、风格、景别、运动。
图片（Image）：锁定角色长相、服装、画面质感。
视频（Video）：参考动作、机位运动、节奏剪辑。
音频（Audio）：节奏、情绪、氛围（适合音乐短片、广告、口播配画面）。

怎么选？给你一个“懒人决策表”：

只想快速出一个概念片：文字 +（可选）参考图
角色不能走样（做系列内容/品牌片）：参考图必上
想复刻某段运镜或动作：塞参考视频
需要卡点、氛围跟音乐走：加音频

真正决定成片质量的：把“长视频”拆成多镜头

很多人一上来就写一段超长提示词，指望模型自己帮你拍电影。

结果通常是：画面像在做梦，角色忽男忽女，场景忽远忽近。

更稳的方式是：你来当导演，把长视频拆成镜头清单。

一个好用的镜头拆分方法（你照抄就行）

用 6 个字段写每个镜头：

时长：3–6 秒更稳（真要长镜头，后面讲怎么做）
景别：近景/中景/全景
主体：谁在画面里，穿什么，有什么标志物
动作：在做什么，动作从哪到哪
镜头运动：推/拉/摇/移/跟拍/手持
光线与风格：日落逆光、霓虹夜景、胶片颗粒、写实/动画等

示例（多镜头短片脚本）：

片名：雨夜外卖员
统一风格：写实电影感、轻微胶片颗粒、冷暖对比、城市雨夜反光

Shot 1（4s）：全景，雨夜街口，外卖员骑电动车冲进画面，路灯反光，镜头轻微手持
Shot 2（4s）：中景，外卖员停下掏手机看地址，雨滴打在屏幕上，镜头缓慢推近
Shot 3（5s）：近景，外卖箱拉链被拉开，热气冒出，暖色光打在手上，镜头固定
Shot 4（5s）：跟拍，外卖员小跑进小巷，霓虹灯闪烁，镜头从背后跟随
Shot 5（4s）：近景，门打开一条缝，一只手接过餐，外卖员松口气，镜头轻微拉远

你会发现：每个镜头都很具体。模型不需要猜，你也更容易迭代。

提示词写法：少堆形容词，多写“可拍的指令”

很多提示词像这样：

史诗感、电影级、超高清、震撼、细节爆炸……

这类词对稳定性帮助不大。

更有效的是：把信息写成摄影现场能执行的描述。

一套通用提示词模板（直接复制）

主体：
- 角色/物体外观（发型、衣服、年龄感、标志物）
- 情绪状态（紧张、放松、兴奋）

场景：
- 地点 + 时间（雨夜街口/清晨厨房/黄昏沙滩）
- 关键道具（雨伞、外卖箱、霓虹灯牌）

镜头：
- 景别（近景/中景/全景）
- 镜头运动（推近/跟拍/手持）
- 构图（居中/三分法/前景遮挡）

风格：
- 写实/动画/定格/赛博朋克/胶片质感
- 光线（逆光、侧光、霓虹、柔光）

约束（非常重要）：
- 角色一致：同一张脸、同一套服装
- 不要出现：文字水印、畸形手、额外人物、画面闪烁

把“约束”写清楚，少翻车。

图片参考怎么喂：用它来“锁人设”和“锁质感”

你想做系列视频，最怕什么？

第一集是清爽少年，第二集突然变成大叔。

解决思路：用参考图固定。

建议准备两类图片：

角色参考图：正脸清晰、光线干净、遮挡少
风格参考图：你喜欢的色调/镜头语言/材质（比如胶片颗粒、霓虹反光）

小技巧：

角色图越“干净”，一致性越好（别上来就戴墨镜、半张脸被头发挡住）
风格图别太复杂（信息太多，模型容易乱抄）

视频参考怎么用：别拿整段丢进去，挑“你要它学的东西”

视频参考最适合两件事：

动作：走路、转身、舞蹈、手部操作
运镜与节奏：跟拍、推拉、剪辑速度

更稳的做法：

挑 3–8 秒的片段
明确告诉它“学什么”：比如“学习运镜，不要复刻人物长相”或“学习动作节奏，保持我的角色外观”

你不说清楚，它就容易“照抄人脸”，然后你就尴尬了。

音频输入的正确打开方式：让画面跟着节奏走

音频特别适合：

卡点短片（音乐一来，镜头就跟着换）
氛围片（环境音决定情绪：雨声、地铁、城市嗡鸣）
口播配画面（你说到哪，画面就展示到哪）

实操建议：

节奏明显的音乐更好驱动（鼓点清晰那种）
你在提示词里写清楚：
- “剪辑跟随鼓点”
- “低频重时画面更暗/更快”
- “副歌镜头更大、更亮”

想做“长镜头”？别硬撑，用分段拼接更稳

很多人想要那种一镜到底。

现实一点：模型更擅长短段稳定输出。

更靠谱的方案：

把长镜头拆成 3 段连续动作
每段都保持：同场景、同角色、同镜头方向
输出后用剪辑做无缝转场（运动模糊/遮挡切/快速推近都好用）

你会得到“像长镜头”的效果，但稳定性直接起飞。

一份“避坑清单”：90% 翻车都在这里 😅

提示词太虚：全是“高级感、电影级”，没有具体动作和镜头。
镜头太长：一口气 20 秒，还要换场景换动作，模型容易崩。
参考图太花：人脸被遮挡、光线极端、妆造太复杂，导致一致性差。
一次塞太多要求：既要赛博朋克又要古风还要黏土动画，画面不疯才怪。
没写约束：不写“不要水印/不要额外人物/不要畸形手”，你会得到惊喜（惊吓）。

直接可用的 3 套成片配方

配方 A：产品广告（10–20 秒）

输入：文字 + 产品图 +（可选）音乐
结构：3–5 镜头
核心：产品特写、材质表现、使用场景

提示词关键句：

“产品始终保持同一外观与比例”
“微距特写，强调材质反光与边缘细节”

配方 B：IP 连载短剧情（30–60 秒）

输入：角色参考图 + 文字分镜
结构：6–10 镜头
核心：角色一致 + 场景一致 + 情绪推进

提示词关键句：

“角色脸部与发型保持一致”
“同一套服装贯穿全片”

配方 C：卡点氛围片（15–30 秒）

输入：音乐 + 文字镜头清单 +（可选）风格图
结构：按鼓点切镜头
核心：节奏明确、镜头动作简单

提示词关键句：

“剪辑点跟随鼓点/副歌切换镜头”
“副歌提升亮度与饱和度，镜头更大景别”

你可以照着走的执行流程（不折腾版）

写一个 6–10 镜头的清单（每镜头 3–6 秒）
给角色准备 1–3 张干净参考图
选 1 张风格图（可选，但很有用）
每个镜头用模板写清楚：景别 + 动作 + 运镜 + 光线
生成后别急着重做：
- 哪个镜头崩，就只重做哪个镜头
- 不要把整个片子推倒重来

如果你把“分镜写清楚 + 参考素材喂对 + 约束写狠一点”这三件事做到位，Seedance 2.0 这类多模态视频模型会变得很听话。

想做什么类型的视频？剧情、广告、还是卡点氛围？你给我一个题材和时长，我帮你把镜头清单按成片标准写出来。

Seedance 2.0 上手指南：用文字/图片/视频/音频生成长篇多镜头高质量视频

Seedance 2.0 上手指南：把“脑子里的画面”做成多镜头长视频 🎬

你会用到的 4 种输入（怎么选更省事）

真正决定成片质量的：把“长视频”拆成多镜头

一个好用的镜头拆分方法（你照抄就行）

提示词写法：少堆形容词，多写“可拍的指令”

一套通用提示词模板（直接复制）

图片参考怎么喂：用它来“锁人设”和“锁质感”

视频参考怎么用：别拿整段丢进去，挑“你要它学的东西”

音频输入的正确打开方式：让画面跟着节奏走

想做“长镜头”？别硬撑，用分段拼接更稳

一份“避坑清单”：90% 翻车都在这里 😅

直接可用的 3 套成片配方

配方 A：产品广告（10–20 秒）

配方 B：IP 连载短剧情（30–60 秒）

配方 C：卡点氛围片（15–30 秒）

你可以照着走的执行流程（不折腾版）