首页 / 正文

把爆款短视频“蒸馏”成剧情.skill:用字幕提炼笑点结构,AI 直接套模板写段子

Mooko
发布于 2026-04-15 · 5分钟阅读
1751 浏览
0 点赞 暴击点赞!

把爆款短视频“蒸馏”成剧情.skill:从字幕里抠出笑点结构

你有没有这种体验:

  • 同样是“吵架/反转/误会”,别人写得你停不下来,你写得像工作汇报。
  • 你让 AI 写段子,它很努力,但就是不好笑,节奏还拖。

问题往往不在“灵感”,在“结构”。

爆款短剧的结构不是玄学,它们大量藏在字幕里:对话怎么来回、笑点落在哪一句、怎么收尾、怎么反转。

这篇就聊一套实操流程:把视频字幕蒸馏成可复用的剧情.skill,你之后有一个梗,直接丢给 AI,让它按结构吐出一段能演的对话。😄


你要蒸馏的不是“人设”,是“创作结构”

很多人做 skill,会去蒸馏一个人:

  • 他怎么思考
  • 怎么决策
  • 怎么表达

视频蒸馏不一样。

你盯的是:

  • 对话的推进方式(谁提问、谁闪躲、谁翻盘)
  • 笑点的落点(第几句爆、怎么补刀)
  • 节奏的密度(几秒一个信息点)
  • 收尾的钩子(反转/误会/回环)

一句话:把“隐性好看”变成“显性模板”。


原料怎么找:字幕是最稳的入口

1)影视/短剧:直接拿字幕文件(SRT/ASS)

字幕的优点太香了:

  • 量大:基本都有
  • 便宜:很多网站可下
  • 质量有底:能播出的内容,本身就被市场筛过

你拿到的格式通常是:

  • .srt:最常见,结构简单
  • .ass:信息更多(样式、位置),也更脏

中文、英文、双语都能用。双语还方便你蒸馏“节奏 + 语气”。

2)抖音/快手:没有现成字幕?照样搞

两条路:

  • 把链接丢给大模型让它转文字稿(快,但经常漏句)
  • 下载视频→语音转写(完整,但要花钱)

常见转写选择:

  • 本地:Whisper(省钱,折腾一点)
  • 在线:讯飞/火山/各类转写平台(省事,贵一点)

小提醒:做结构蒸馏不需要 100% 字字准确,但需要“对话轮次”和“句子边界”尽量靠谱。


蒸馏四件事:清洗 → 找密集段 → 抠结构 → 验证收录

下面这套流程你照着跑,蒸馏出来的结构才“能用、可复用”。

A. 清洗字幕:把时间戳、序号都扔掉

目标很简单:只保留对白文本

用 Python 处理 SRT(够用,而且快):

import re
from pathlib import Path

def srt_to_lines(srt_path: str):
    text = Path(srt_path).read_text(encoding="utf-8", errors="ignore")
    lines = []
    for line in text.splitlines():
        line = line.strip()
        if not line:
            continue
        # 序号
        if re.fullmatch(r"\d+", line):
            continue
        # 时间戳
        if re.search(r"\d\d:\d\d:\d\d,\d+\s+-->\s+\d\d:\d\d:\d\d,\d+", line):
            continue
        # 可能的字幕注释(按需扩展)
        if line.startswith("{") and line.endswith("}"):
            continue
        lines.append(line)
    return lines

lines = srt_to_lines("demo.srt")
Path("dialogue.txt").write_text("\n".join(lines), encoding="utf-8")
print("lines:", len(lines))

如果是 ASS,你也可以先粗暴一点:只保留 Dialogue: 行里最后一列文本,其他都删掉。

B. 找“快节奏段落”:爆点通常在来回最密集的地方

短剧好看,很大一部分是对话回合密度高。

一个简单粗暴的判定:

  • 连续多行
  • 每行字数少
  • 问答来回频繁

用滑动窗口扫一遍:

def find_fast_segments(lines, window=12, max_chars=12, min_short_lines=8):
    segs = []
    for i in range(0, len(lines) - window):
        block = lines[i:i+window]
        short_cnt = sum(1 for x in block if len(x) <= max_chars)
        if short_cnt >= min_short_lines:
            segs.append((i, i+window, short_cnt, block))
    return segs

segs = find_fast_segments(lines)
# 取最密的前 10 段
segs = sorted(segs, key=lambda x: x[2], reverse=True)[:10]
for start, end, score, block in segs:
    print("\n---", start, end, "score", score)
    print("\n".join(block))

你会很快看到:爆款段落往往长得很像。

C. 抠结构:把“好笑”写成可复用模板

对着一个密集段落,别急着让 AI 总结“它为什么好”。

你要逼自己(或逼 AI)回答三类问题:

  • 触发条件:这段对话为啥开始?谁先挑事?
  • 推进策略:被问的人用了什么招?装傻?偷换概念?反问?抬杠?
  • 笑点落点:哪一句让人笑?笑完怎么收?

这里给你一个通用的“结构卡片”格式(后面会收录成 skill):

## 结构名称:

### 触发条件:

### 角色关系:

### 逻辑拆解(按回合):
1)
2)
3)
...

### 笑点落点:

### 收尾方式:

### 可替换槽位:
- 角色A = 
- 角色B = 
- 核心误解 = 
- 关键词 = 

### 套用示例(换角色演一遍):

你会发现:当“可替换槽位”写清楚后,复用会变得非常爽。

D. 三重验证:不验证就别收录(真的)

很多“看起来很对”的结构,一换人设就崩。

收录前做三件事:

  • 可替换性:把原角色换成你要写的目标角色(比如老板/客服/情侣/室友),对话还成立吗?不成立,直接淘汰。
  • 可重复性:同类结构在同一部作品里出现过至少 2 次吗?只出现一次,很可能是巧合。
  • 生成测试:让 AI 用这个结构生成一段新对话,你读一遍:节奏对不对?笑点有没有落?像不像能拍?过了再收录。

把蒸馏结果做成剧情.skill(Claude Code 文件组织)

你可以用任何你顺手的方式管理结构。

如果你在用 Claude Code(或类似 coding agent),推荐直接按“技能包”来组织:

my-plot-skill/
├── SKILL.md
└── references/
    ├── raw_subtitles/
    │   ├── A_show.srt
    │   └── B_show.srt
    ├── dialogue_clean/
    │   ├── A_show.txt
    │   └── B_show.txt
    └── patterns.md

SKILL.md 怎么写:让 AI 明确“你要它按模板干活”

把这段当你的基础技能说明,后面越用越顺:

# 剧情.skill(对话结构蒸馏)

你是我的短剧编剧助手。

你的任务不是凭空写段子,而是:
1) 从 references/patterns.md 里挑合适的结构
2) 按结构生成对话
3) 对话要短句、来回快、每 1-2 句推进一次信息
4) 标注笑点落点(用【笑点】标一下)

输出格式:
- 场景一句话
- 人物表(角色名 + 口头禅/情绪)
- 对话(不少于 16 轮)
- 结尾钩子(反转/误会/抛问题)

禁忌:
- 不要说教
- 不要解释梗
- 不要写旁白大段心理活动

patterns.md 怎么写:把结构卡片堆进去

示例给你一张“经典好用”的结构卡片(来自你素材里那种亲子对话逻辑):

## 结构名称:大人质疑 → 小孩歪理自洽 → 大人被带跑 → 观众看穿

### 触发条件:
大人发现异常/漏洞,当场质问。

### 角色关系:
强势管教者 vs 脑洞防御者。

### 逻辑拆解(按回合):
1) 大人抛出证据:“你是不是干了X?”
2) 小孩不正面回答,先承认一半:“我有做,但原因很合理。”
3) 小孩抛出一套“听起来很有道理”的歪逻辑(偷换概念/因果倒置/过度类比)。
4) 大人开始被带节奏,跟着逻辑问细节。
5) 小孩继续补丁式圆谎,越圆越离谱。
6) 大人被说服/半信半疑点头。
7) 结尾补一刀:观众知道是编的,小孩还一脸真诚。

### 笑点落点:
第5-6回合,小孩把离谱逻辑说得像真理;大人还认真接招。

### 收尾方式:
大人一句“行吧”或“你说得也对”,镜头切走。

### 可替换槽位:
- 大人 = 老板/客服/班主任/丈母娘
- 小孩 = 打工人/用户/学生/女婿
- 异常事件X = 报销/迟到/差评/作业
- 歪逻辑类型 = 偷换概念 / 反向因果 / 过度类比

### 套用示例(老板 vs 员工,报销):
老板:这张发票怎么是奶茶店?
员工:对,是奶茶。
老板:你把奶茶报成办公用品?
员工:我买的是“团队凝聚力”。
老板:……凝聚力?
员工:大家一起胖,心就齐了。
老板:你这也太离谱了。
员工:离谱是表象,管理是本质。
老板:那你说说本质是什么。
员工:本质是我没让团队散。
老板:好像……也有点道理?
员工:对啊,您看您都被我说服了。
老板:我只是懒得跟你吵。
员工:您承认了,您承认凝聚力了。
老板:行行行,打住。
员工:谢谢老板支持企业文化建设。【笑点】

你蒸馏三部作品,patterns.md 里能攒出一堆“能直接套”的结构。写起来会越来越像人。


给 Claude / 大模型的蒸馏提示词(直接复制就能用)

把你清洗后的 dialogue.txt 或某个片段贴进去,然后用这个提示词:

你在做“短剧对话结构蒸馏”。

目标:从下面的对白中提炼“可复用的对话结构模板”,用于以后生成新剧情。

要求:
1) 只输出结构,不要点评作品。
2) 每个结构必须包含:结构名称、触发条件、角色关系、逻辑拆解(按回合)、笑点落点、收尾方式、可替换槽位、套用示例。
3) 逻辑拆解要能复用:用抽象动作描述(质问/狡辩/偷换概念/反问/补刀/反转),不要复述台词。
4) 同类结构如果出现多次,合并成一个模板,并说明“重复证据”(出现在哪些段落)。
5) 输出 Markdown,直接可放入 patterns.md。

下面是对白:
<<<PASTE>>>

生成完别急着收。拿去做“三重验证”。


一套你今天就能跑的工作流(30 分钟版)

你想快速尝到甜头,就按这个节奏:

  • 找一部你觉得“对话特别密”的短剧/电影片段
  • 拿到字幕(或转写)
  • Python 清洗成 dialogue.txt
  • 扫出 3 段最密集对话
  • 每段蒸馏 1 个结构卡片
  • 做生成测试:让 AI 用结构写一段“你自己的题材”

你会明显感觉:AI 的对话不再是“长句 + 解释 + 端着”。节奏会像真实短剧。


避坑清单(踩过的人才会提醒你)

  • 别蒸馏大段独白:独白适合练文采,不适合练“短剧爽感”。短剧靠来回。
  • 别迷信“金句”:金句可抄,结构才可复制。你要的是“怎么走到那句金句”。
  • 别把结构写得太抽象:什么“冲突升级、人物成长”这种没法套。要写成回合动作。
  • 别跳过可替换性测试:换成“老板-员工”就崩的结构,留着只会污染你的 skill。
  • 别一次蒸馏太多:一部作品提 5-6 个结构最舒服。贪多会变成资料收集癖。
  • 注意版权和隐私:结构总结一般没问题,但别把整段字幕原文公开贴满。

进阶玩法:把结构做成“结构选择器”

当 patterns 多了,你会遇到新问题:

我有一个梗,应该用哪个结构?

解决方法也简单:给每个结构加上“适用标签”。比如:

  • 场景:家庭/职场/校园/情侣
  • 节奏:慢铺垫/快来回
  • 笑点类型:误会/偷换概念/反差/人设崩塌
  • 收尾钩子:反转/悬念/打脸/回环

你让 AI 先做结构匹配,再生成对话,命中率会高很多。


你可以从这里开始:蒸馏 1 个结构就够了

别等“我准备好了”。

你今晚就做一件事:

  • 选一个你最近笑出声的视频
  • 把字幕搞出来
  • 蒸馏成 1 张结构卡片
  • 让 AI 用它给你写一段“你自己的题材”

当你看到 AI 生成的对话开始“像人”、开始“有拍的感觉”,你就知道这套方法值了。

OpenClaw
OpenClaw
木瓜AI支持养龙虾啦
木瓜AI龙虾专供API,限时领取免费tokens
可在 OpenClaw接入全球顶尖AI大模型
立即领取