把爆款短视频“蒸馏”成剧情.skill：从字幕里抠出笑点结构

你有没有这种体验：

同样是“吵架/反转/误会”，别人写得你停不下来，你写得像工作汇报。
你让 AI 写段子，它很努力，但就是不好笑，节奏还拖。

问题往往不在“灵感”，在“结构”。

爆款短剧的结构不是玄学，它们大量藏在字幕里：对话怎么来回、笑点落在哪一句、怎么收尾、怎么反转。

这篇就聊一套实操流程：把视频字幕蒸馏成可复用的剧情.skill，你之后有一个梗，直接丢给 AI，让它按结构吐出一段能演的对话。😄

你要蒸馏的不是“人设”，是“创作结构”

很多人做 skill，会去蒸馏一个人：

他怎么思考
怎么决策
怎么表达

视频蒸馏不一样。

你盯的是：

对话的推进方式（谁提问、谁闪躲、谁翻盘）
笑点的落点（第几句爆、怎么补刀）
节奏的密度（几秒一个信息点）
收尾的钩子（反转/误会/回环）

一句话：把“隐性好看”变成“显性模板”。

原料怎么找：字幕是最稳的入口

1）影视/短剧：直接拿字幕文件（SRT/ASS）

字幕的优点太香了：

量大：基本都有
便宜：很多网站可下
质量有底：能播出的内容，本身就被市场筛过

你拿到的格式通常是：

.srt：最常见，结构简单
.ass：信息更多（样式、位置），也更脏

中文、英文、双语都能用。双语还方便你蒸馏“节奏 + 语气”。

2）抖音/快手：没有现成字幕？照样搞

两条路：

把链接丢给大模型让它转文字稿（快，但经常漏句）
下载视频→语音转写（完整，但要花钱）

常见转写选择：

本地：Whisper（省钱，折腾一点）
在线：讯飞/火山/各类转写平台（省事，贵一点）

小提醒：做结构蒸馏不需要 100% 字字准确，但需要“对话轮次”和“句子边界”尽量靠谱。

蒸馏四件事：清洗 → 找密集段 → 抠结构 → 验证收录

下面这套流程你照着跑，蒸馏出来的结构才“能用、可复用”。

A. 清洗字幕：把时间戳、序号都扔掉

目标很简单：只保留对白文本。

用 Python 处理 SRT（够用，而且快）：

import re
from pathlib import Path

def srt_to_lines(srt_path: str):
    text = Path(srt_path).read_text(encoding="utf-8", errors="ignore")
    lines = []
    for line in text.splitlines():
        line = line.strip()
        if not line:
            continue
        # 序号
        if re.fullmatch(r"\d+", line):
            continue
        # 时间戳
        if re.search(r"\d\d:\d\d:\d\d,\d+\s+-->\s+\d\d:\d\d:\d\d,\d+", line):
            continue
        # 可能的字幕注释（按需扩展）
        if line.startswith("{") and line.endswith("}"):
            continue
        lines.append(line)
    return lines

lines = srt_to_lines("demo.srt")
Path("dialogue.txt").write_text("\n".join(lines), encoding="utf-8")
print("lines:", len(lines))

如果是 ASS，你也可以先粗暴一点：只保留 Dialogue: 行里最后一列文本，其他都删掉。

B. 找“快节奏段落”：爆点通常在来回最密集的地方

短剧好看，很大一部分是对话回合密度高。

一个简单粗暴的判定：

连续多行
每行字数少
问答来回频繁

用滑动窗口扫一遍：

def find_fast_segments(lines, window=12, max_chars=12, min_short_lines=8):
    segs = []
    for i in range(0, len(lines) - window):
        block = lines[i:i+window]
        short_cnt = sum(1 for x in block if len(x) <= max_chars)
        if short_cnt >= min_short_lines:
            segs.append((i, i+window, short_cnt, block))
    return segs

segs = find_fast_segments(lines)
# 取最密的前 10 段
segs = sorted(segs, key=lambda x: x[2], reverse=True)[:10]
for start, end, score, block in segs:
    print("\n---", start, end, "score", score)
    print("\n".join(block))

你会很快看到：爆款段落往往长得很像。

C. 抠结构：把“好笑”写成可复用模板

对着一个密集段落，别急着让 AI 总结“它为什么好”。

你要逼自己（或逼 AI）回答三类问题：

触发条件：这段对话为啥开始？谁先挑事？
推进策略：被问的人用了什么招？装傻？偷换概念？反问？抬杠？
笑点落点：哪一句让人笑？笑完怎么收？

这里给你一个通用的“结构卡片”格式（后面会收录成 skill）：

## 结构名称：

### 触发条件：

### 角色关系：

### 逻辑拆解（按回合）：
1)
2)
3)
...

### 笑点落点：

### 收尾方式：

### 可替换槽位：
- 角色A = 
- 角色B = 
- 核心误解 = 
- 关键词 = 

### 套用示例（换角色演一遍）：

你会发现：当“可替换槽位”写清楚后，复用会变得非常爽。

D. 三重验证：不验证就别收录（真的）

很多“看起来很对”的结构，一换人设就崩。

收录前做三件事：

✅ 可替换性：把原角色换成你要写的目标角色（比如老板/客服/情侣/室友），对话还成立吗？不成立，直接淘汰。
✅ 可重复性：同类结构在同一部作品里出现过至少 2 次吗？只出现一次，很可能是巧合。
✅ 生成测试：让 AI 用这个结构生成一段新对话，你读一遍：节奏对不对？笑点有没有落？像不像能拍？过了再收录。

把蒸馏结果做成剧情.skill（Claude Code 文件组织）

你可以用任何你顺手的方式管理结构。

如果你在用 Claude Code（或类似 coding agent），推荐直接按“技能包”来组织：

my-plot-skill/
├── SKILL.md
└── references/
    ├── raw_subtitles/
    │   ├── A_show.srt
    │   └── B_show.srt
    ├── dialogue_clean/
    │   ├── A_show.txt
    │   └── B_show.txt
    └── patterns.md

SKILL.md 怎么写：让 AI 明确“你要它按模板干活”

把这段当你的基础技能说明，后面越用越顺：

# 剧情.skill（对话结构蒸馏）

你是我的短剧编剧助手。

你的任务不是凭空写段子，而是：
1) 从 references/patterns.md 里挑合适的结构
2) 按结构生成对话
3) 对话要短句、来回快、每 1-2 句推进一次信息
4) 标注笑点落点（用【笑点】标一下）

输出格式：
- 场景一句话
- 人物表（角色名 + 口头禅/情绪）
- 对话（不少于 16 轮）
- 结尾钩子（反转/误会/抛问题）

禁忌：
- 不要说教
- 不要解释梗
- 不要写旁白大段心理活动

patterns.md 怎么写：把结构卡片堆进去

示例给你一张“经典好用”的结构卡片（来自你素材里那种亲子对话逻辑）：

## 结构名称：大人质疑 → 小孩歪理自洽 → 大人被带跑 → 观众看穿

### 触发条件：
大人发现异常/漏洞，当场质问。

### 角色关系：
强势管教者 vs 脑洞防御者。

### 逻辑拆解（按回合）：
1) 大人抛出证据：“你是不是干了X？”
2) 小孩不正面回答，先承认一半：“我有做，但原因很合理。”
3) 小孩抛出一套“听起来很有道理”的歪逻辑（偷换概念/因果倒置/过度类比）。
4) 大人开始被带节奏，跟着逻辑问细节。
5) 小孩继续补丁式圆谎，越圆越离谱。
6) 大人被说服/半信半疑点头。
7) 结尾补一刀：观众知道是编的，小孩还一脸真诚。

### 笑点落点：
第5-6回合，小孩把离谱逻辑说得像真理；大人还认真接招。

### 收尾方式：
大人一句“行吧”或“你说得也对”，镜头切走。

### 可替换槽位：
- 大人 = 老板/客服/班主任/丈母娘
- 小孩 = 打工人/用户/学生/女婿
- 异常事件X = 报销/迟到/差评/作业
- 歪逻辑类型 = 偷换概念 / 反向因果 / 过度类比

### 套用示例（老板 vs 员工，报销）：
老板：这张发票怎么是奶茶店？
员工：对，是奶茶。
老板：你把奶茶报成办公用品？
员工：我买的是“团队凝聚力”。
老板：……凝聚力？
员工：大家一起胖，心就齐了。
老板：你这也太离谱了。
员工：离谱是表象，管理是本质。
老板：那你说说本质是什么。
员工：本质是我没让团队散。
老板：好像……也有点道理？
员工：对啊，您看您都被我说服了。
老板：我只是懒得跟你吵。
员工：您承认了，您承认凝聚力了。
老板：行行行，打住。
员工：谢谢老板支持企业文化建设。【笑点】

你蒸馏三部作品，patterns.md 里能攒出一堆“能直接套”的结构。写起来会越来越像人。

给 Claude / 大模型的蒸馏提示词（直接复制就能用）

把你清洗后的 dialogue.txt 或某个片段贴进去，然后用这个提示词：

你在做“短剧对话结构蒸馏”。

目标：从下面的对白中提炼“可复用的对话结构模板”，用于以后生成新剧情。

要求：
1) 只输出结构，不要点评作品。
2) 每个结构必须包含：结构名称、触发条件、角色关系、逻辑拆解（按回合）、笑点落点、收尾方式、可替换槽位、套用示例。
3) 逻辑拆解要能复用：用抽象动作描述（质问/狡辩/偷换概念/反问/补刀/反转），不要复述台词。
4) 同类结构如果出现多次，合并成一个模板，并说明“重复证据”（出现在哪些段落）。
5) 输出 Markdown，直接可放入 patterns.md。

下面是对白：
<<<PASTE>>>

生成完别急着收。拿去做“三重验证”。

一套你今天就能跑的工作流（30 分钟版）

你想快速尝到甜头，就按这个节奏：

找一部你觉得“对话特别密”的短剧/电影片段
拿到字幕（或转写）
Python 清洗成 dialogue.txt
扫出 3 段最密集对话
每段蒸馏 1 个结构卡片
做生成测试：让 AI 用结构写一段“你自己的题材”

你会明显感觉：AI 的对话不再是“长句 + 解释 + 端着”。节奏会像真实短剧。

避坑清单（踩过的人才会提醒你）

别蒸馏大段独白：独白适合练文采，不适合练“短剧爽感”。短剧靠来回。
别迷信“金句”：金句可抄，结构才可复制。你要的是“怎么走到那句金句”。
别把结构写得太抽象：什么“冲突升级、人物成长”这种没法套。要写成回合动作。
别跳过可替换性测试：换成“老板-员工”就崩的结构，留着只会污染你的 skill。
别一次蒸馏太多：一部作品提 5-6 个结构最舒服。贪多会变成资料收集癖。
注意版权和隐私：结构总结一般没问题，但别把整段字幕原文公开贴满。

进阶玩法：把结构做成“结构选择器”

当 patterns 多了，你会遇到新问题：

我有一个梗，应该用哪个结构？

解决方法也简单：给每个结构加上“适用标签”。比如：

场景：家庭/职场/校园/情侣
节奏：慢铺垫/快来回
笑点类型：误会/偷换概念/反差/人设崩塌
收尾钩子：反转/悬念/打脸/回环

你让 AI 先做结构匹配，再生成对话，命中率会高很多。

你可以从这里开始：蒸馏 1 个结构就够了

别等“我准备好了”。

你今晚就做一件事：

选一个你最近笑出声的视频
把字幕搞出来
蒸馏成 1 张结构卡片
让 AI 用它给你写一段“你自己的题材”

当你看到 AI 生成的对话开始“像人”、开始“有拍的感觉”，你就知道这套方法值了。

把爆款短视频“蒸馏”成剧情.skill：用字幕提炼笑点结构，AI 直接套模板写段子