把素材丢进文件夹,Claude Code 自动剪片出成片
你有没有这种崩溃时刻:
- 录了 30 分钟口播,真正能用的就 6 分钟
- 时间线拖到眼花,删口癖删到怀疑人生
- 字幕、调色、封面、导出……一套做完天都黑了
现在有一种特别“反常识”的剪辑方式:你不进剪辑软件,也不碰时间线。
你只需要:
- 把原始素材和资源放进一个文件夹
- 写清楚你要什么风格、要删什么、要输出什么规格
剩下的交给 Claude Code 驱动的自动化流程:剪片段、去冗余词、加字幕、套调色滤镜、做动画、渲染成片。
项目是开源的(GitHub 上能搜到 browser-use video 相关仓库)。下面咱们聊“怎么用得起来”,而不是看个热闹。
这套东西到底在干嘛?(一句话说人话)
文件夹 = 工程文件。
你把素材丢进去,再给一份“剪辑规则/成片脚本”,工具会自己:
- 识别可用片段(或者按你的脚本去切)
- 自动删掉口头禅/冗余词(比如“然后”“就是”“那个”)
- 自动打轴生成字幕(SRT/ASS 或直接烧录)
- 调色和滤镜(统一风格,不再一条条调)
- 简单动画(标题条、转场、片头片尾)
- 一口气渲染出最终视频
核心爽点:没有时间线,也不需要“你看下这段能不能再快一点”这种往返拉扯。
适合哪些人用?别硬上
适合:
- 知识口播/教程类:对“节奏干净、信息密度高”要求高
- 批量生产:同一模板每天/每周产多条
- 团队协作:策划写规则,素材丢进去就能出片
不适合:
- 电影级精剪、卡点 MV、复杂运动图形
- 需要你逐帧抠细节的商业项目
你把它当成:剪辑界的“自动驾驶”。能省大部分体力活,但不是 100% 替代人类审美。
你要准备什么?(别被环境吓退)
这类项目一般由三块拼起来:
- Claude Code:负责读你的需求、规划步骤、生成脚本/指令
- FFmpeg:真正干活的“瑞士军刀”(切片、合成、调色、压制)
- 字幕/语音工具链:常见是 Whisper 或同类 ASR(做转写+打轴)
你不需要把每个组件研究透,知道它们各自干什么就够用。
标准工程目录怎么摆?照抄就能跑
建议你把每个视频项目都按下面结构来(重点是“统一”):
my_video_project/
input/
footage/ # 原始视频(可多段)
audio/ # BGM、音效、配音
images/ # 封面/插图/贴纸
fonts/ # 字体(可选)
config/
edit_rules.md # 你的剪辑规则(人话写清楚)
style.json # 风格参数(可选)
output/
preview.mp4
final.mp4
subtitles.srt
temp/ # 中间文件(让它随便造)
你以后做 10 个项目,也长这个样子。批量生产就从这里开始。
剪辑规则怎么写?这才是关键
很多人失败不是工具不行,是规则写得像许愿。
把规则写成“可执行的指令”,参考这个模板:
# 成片目标
- 平台:B站 / 抖音
- 时长:3~5 分钟
- 节奏:偏快,停顿超过 0.6s 的地方尽量压缩
# 必删清单(口癖/冗余)
- “然后” “就是” “其实” “那个”
- 重复表达保留一次
# 结构
- 片头 3 秒:标题 + 关键词
- 正文:按主题分段,每段加小标题条
- 片尾 5 秒:总结要点 + 引导关注
# 字幕
- 中文字幕必须有
- 标点要自然,不要一整句没有逗号
- 专有名词:Claude Code、FFmpeg 保持英文
# 画面风格
- 轻微暖色、对比度+一点点
- 降噪适度,别磨皮到像蜡像
# 输出
- 1080p,H.264,高质量
- 导出文件名:final.mp4
写到这种程度,AI 才“知道怎么当剪辑师”。
你实际怎么跑起来?(通用执行思路)
不同仓库命令不一样,我不在这里瞎报一串你跑不通的命令。你按这个流程走,基本不会偏:
-
把仓库拉下来,读
README找到“安装/运行”那一段。 -
把素材放进
input/,保证命名别太抽象。比如:
talk_01.mp4(口播主素材)bgm_lofi.mp3logo.png
-
把剪辑规则写进
config/edit_rules.md。 -
运行工具,让它输出到
output/。 -
你只做“审片”:
- 字幕错别字?
- 专有名词打对没?
- 节奏太快/太慢?
想改就回到规则里改一句,再跑一次。你会发现你改的是“需求”,不是“时间线”。
一个更贴近真实工作的例子:口播课件视频
场景:你录了一节 20 分钟的课,想剪成 5 分钟精华。
你可以这样写规则:
- 保留“结论句”“举例句”
- 遇到铺垫太长的段落,压缩成 1 句总结
- 每个知识点出来时加标题条(例如“误区 1:……”)
- 字幕显示关键词加粗(如果支持 ASS 样式)
效果就是:你讲得再啰嗦,成片也会更像“剪辑师给你收拾过”。
很多人会踩的坑(提前避雷)
1) 素材命名乱,AI 也救不了
1.mp4、新建文件夹(2) 这种就别折磨自己了。
建议:同一类素材同一前缀。
talk_口播broll_补画面bgm_音乐
2) 规则写太虚
“剪得高级一点”“更有网感”这种话,等于没说。
换成可执行描述:
- 停顿阈值多少秒
- 目标时长范围
- 标题条样式(颜色/位置/时长)
- 字幕一行最多多少字
3) 自动删冗余,会误伤语义
口癖可以删,逻辑连接词删多了会变成“机关枪”。
建议:
- 给“必保留词”列表(例如“因为”“所以”“结论是”)
- 允许保留自然停顿(比如段落结尾)
4) 自动字幕最容易翻车的地方:专有名词
Claude、FFmpeg、Remotion、API 这种,错一个观感就崩。
建议:
- 在规则里加“专有名词词表”
- 让它输出一份
subtitles.srt,你快速扫一遍再烧录
5) 风格统一是优点,也是风险
统一滤镜很爽,但不看就直接发,有概率:
- 过饱和
- 皮肤发橙
- 暗部死黑
建议:输出一个 preview.mp4,你看 30 秒就能决定要不要调整参数。
想玩得更爽:把它变成你的“视频流水线”
你可以把“规则”拆成两层:
- 通用规则:你的频道固定风格(字幕样式、片尾、导出规格)
- 项目规则:这一期的主题结构、必剪点
再进阶一点:准备 3 套模板:
- 抖音竖屏 9:16(节奏更快)
- B站横屏 16:9(信息更完整)
- 小红书 4:5(字幕更大)
以后你做视频,真的就是“选模板 → 丢素材 → 出片”。
去哪里找这个项目?怎么判断是不是你要的那个?
原始素材提到的地址是 GitHub 上 browser-use/video…。
你在 GitHub 搜:
browser-use video editorClaude Code video- 仓库里包含
ffmpeg、whisper、render、subtitle关键词
判断标准很简单:
- README 有没有写清楚输入目录/输出目录
- 有没有示例工程(demo)
- 有没有一键运行脚本
别只看 Star,多看“你能不能在 30 分钟内跑出 demo”。
结语
这类“无时间线剪辑”最离谱的地方在于:你开始用文字管理剪辑,而不是用鼠标拖拽管理剪辑。
你省下来的不是几分钟,是那种“剪到麻木”的体力活。剩下精力留给脚本、选题、表达,这才是值钱的部分。