首页 / 正文

用 Claude Code 把口播视频一键剪成成片:自动剪废话、调色、字幕、动画都包了 🎬

Mooko
发布于 2026-04-27 · 5分钟阅读
486 浏览
0 点赞 暴击点赞!

用 Claude Code 编辑视频:你说完,成片就出来了 🎬

你有没有这种崩溃时刻:

  • 录了 20 分钟口播,剪掉“嗯”“啊”“我想一下”剪到手抽筋
  • 字幕对轴到凌晨 2 点
  • 想加个动画,打开软件看到时间线就想关电脑

这套思路很简单:把剪辑变成“可执行脚本”。你提供原始视频,Claude Code 按规则做完处理,输出 final.mp4

你会得到什么?

  • 自动剪冗余内容(停顿、重复、废话段)
  • 基础调色、分级、音量/降噪(按你设的风格)
  • 自动字幕(生成 SRT/ASS,也能直接烧录)
  • 插入 Manim(数学动画)和 Remotion(React 动画)
  • 在你打开播放器前,先做一遍“成片自检”,给出风险点

而且:开源 + 免费。不想再月付剪辑软件的人会懂这种爽感 😄


适合哪些场景?

把场景说清楚,你就知道自己值不值得搞。

  • 你是做口播的:知识科普、课程、产品讲解、复盘视频
  • 你需要稳定产出:每周 3 条,要求风格统一
  • 你讨厌重复劳动:剪停顿、打字幕、统一色调这种
  • 你愿意用命令行:不需要你是程序员,愿意复制粘贴就行

不太适合的情况:

  • 电影级复杂叙事剪辑(大量素材、多机位强节奏)
  • 需要你用“感觉”做创意蒙太奇(AI 很难替你做审美拍板)

你要准备什么(别慌,很轻量)

必备

  • Claude Code(能在项目里读文件、写脚本、跑命令)
  • FFmpeg(视频处理核心,剪切、转码、调色、音频都靠它)

建议装上(更省心)

  • Whisper / faster-whisper:转字幕用
  • Manim:需要数学/公式动画时用
  • Remotion:需要片头、标题条、数据可视化等 React 动画时用

你用 macOS 的话,很多东西一条 brew install 就搞定。


推荐的项目结构(照抄就能跑)

把每条视频当成一个“可复用工程”,以后你会感谢自己。

video-project/
  input/
    raw.mp4
  assets/
    music.mp3
    logo.png
    font.ttf
  motion/
    manim/
    remotion/
  output/
    cut.mp4
    graded.mp4
    subtitles.srt
    final.mp4
  prompts/
    style.md
    rules.md
  edit_pipeline.sh
  config.json
  • config.json 放参数:目标分辨率、字幕样式、色调风格、音量标准
  • rules.md 放剪辑规则:停顿多长算冗余、口癖怎么处理、片头片尾怎么加
  • style.md 放你想要的“频道气质”:偏冷/偏暖、对比度、饱和度、字体大小

一套能落地的流水线:从 raw.mp4 到 final.mp4

这部分是重点。思路是拆成 4 段,每段都能单独检查。

1)抽音频 → 转字幕 → 找可剪点

你不需要 AI 瞎猜“哪里该剪”。让它拿到证据:时间戳

  • 从视频里抽音频
  • 跑转写,拿到带时间戳的文字
  • 根据规则标注:长停顿、重复句、无意义口癖

输出你要的东西:

  • subtitles.srt
  • cuts.json(建议剪切段落列表,例如保留区间 / 删除区间)

2)按 cut 列表无损剪辑(尽量不重编码)

别一上来就全量转码。能 stream copy 就 stream copy。

  • 小段落拼接
  • 切掉尴尬停顿
  • 口播节奏一下子紧凑很多

输出:cut.mp4

3)调色 / 分级 / 音频处理(按“频道模板”走)

这里建议你先定一个模板,后面每条视频都套同一套。

常见诉求:

  • 画面偏灰?提一点对比度
  • 灯光偏黄?白平衡往冷拉一点
  • 人脸太暗?做轻度提亮
  • 声音忽大忽小?压缩+响度归一

输出:graded.mp4

4)字幕烧录 + 动画合成(Manim / Remotion)

字幕建议两份都保留:

  • subtitles.srt:给平台/二次编辑
  • subtitles.ass:想做更好看的样式就用 ASS

动画合成两种常见玩法:

  • Manim:公式推导、坐标系、几何动画
  • Remotion:片头、标题条、重点词弹幕、数据卡片

输出:final.mp4


让 Claude Code 真干活:你可以这样下指令

你要的不是“帮我剪一下”,而是“按规则产出可复用脚本”。

把这段直接扔给 Claude Code(按你项目改路径):

你在这个仓库里帮我搭建一套视频自动剪辑流水线。
目标:input/raw.mp4 -> output/final.mp4
要求:
- 自动转写生成 output/subtitles.srt(带时间戳)
- 根据规则剪掉冗余:停顿>600ms、连续口癖(嗯/啊/然后)聚集段、重复句
- 输出剪辑决策文件 output/cuts.json,便于我复核
- 生成并执行 edit_pipeline.sh:分阶段产物 cut.mp4 / graded.mp4 / final.mp4
- 调色风格:自然干净,轻微提升对比度和清晰度,肤色别发橙
- 音频:响度归一到 -14 LUFS,限制峰值,轻度降噪
- 可选:若 motion/remotion 存在项目就自动渲染并叠加到片头 3 秒
- 在生成 final.mp4 前做自检:黑场、爆音、字幕溢出、分辨率/帧率一致
把你生成的命令写进脚本,并在 README 里告诉我怎么跑。

这类指令有个关键点:要求它输出“中间产物”。你能随时打开 cuts.json 盯一眼,避免它瞎剪。


一份实用的剪辑规则模板(直接抄到 prompts/rules.md)

# 剪辑规则

- 停顿处理
  - 单次停顿 > 0.6s:尝试裁掉
  - 停顿 > 1.2s:优先裁掉

- 口癖处理
  - “嗯/啊/就是/然后/那个”单次出现:尽量保留语气,不强行全删
  - 连续出现且伴随长停顿:删除该段

- 重复句
  - 连续两句表达同一意思:保留更清晰的一句

- 画面规则
  - 保留自然眨眼,不做恐怖式无缝切
  - 切点优先落在句末,不要切在词中间

- 音频规则
  - 开头 2 秒、结尾 2 秒避免突然静音
  - 人声优先,背景音乐音量保持低且稳定

规则写得越具体,成片越像“你自己剪的”。


自检清单(少踩一半的坑)

很多翻车不是剪辑能力问题,是流程没验收。

  • 字幕对了但丑:字体、描边、行距没设好。ASS 样式搞起来。
  • 音量忽大忽小:只做了归一没做压缩。加 compressor + limiter。
  • 色彩发脏:锐化过头、饱和度拉爆。宁可淡一点。
  • 切得太紧:每句之间留 2-4 帧喘气空间,不然像机关枪。
  • 动画盖住人脸:给动画做 safe area,位置固定在下三分之一。
  • 平台二压很糊:码率别太抠,关键帧间隔别乱。

建议你每条视频都留一份 output/report.md,把自检结果写进去。哪怕你懒,也能逼自己把问题收敛掉。


常见问题(你大概率会问)

Q:这不就像某些一键剪辑工具?

体验上确实像。

差别在控制权:

  • 你能看到每一步命令
  • 你能改规则、改参数、改模板
  • 你能复用流程,让 100 条视频风格一致

想做成“你的专属剪辑流水线”,开源脚本这条路更稳。

Q:我不懂剪辑参数,怎么定一个好看的默认风格?

别追求一步到位。

做一条“标杆视频”,你自己盯着改到满意。把参数固化进 config.json。后面就不用每条都纠结。


你可以从这一条开始

别搞宏大工程。

就拿你最近录的一个口播视频:

  • 丢进 input/raw.mp4
  • 写好 prompts/rules.md
  • 让 Claude Code 生成 edit_pipeline.sh
  • 跑完看 output/cuts.jsonoutput/final.mp4

你会很快上瘾:原来剪视频也能像写代码一样,稳定、可复制、越用越顺手。

OpenClaw
OpenClaw
木瓜AI支持养龙虾啦
木瓜AI龙虾专供API,限时领取免费tokens
可在 OpenClaw接入全球顶尖AI大模型
立即领取