把离去的亲人/宠物做成“纪念数字人 Skill”

你可能也刷到过：

“把离去的亲人或宠物做成 Skill，然后配上全息数字人。”

看着粗糙？对，很多都像 demo。

有市场？也对。因为它解决的不是“高科技”，而是一个很朴素的需求：留个可互动的纪念。

这篇不聊玄学，不讲“复活”。咱们按“产品”思路来做：

它是什么：一个“纪念对话 Skill”，能用熟悉的语气讲故事、答常见问题、安抚情绪
它不是什么：冒充真人、替代心理咨询、引导做重大决策

下面这套流程，你照着走就能做出一个能用的版本。🧩

你要先定清楚：Skill 到底做什么

很多人一上来就想做“全能数字人”。结果资料不够、边界不清，做出来像精神分裂。

把目标收紧，效果会好很多。

3 个最常见、也最容易落地的形态

纪念聊天：像家人一样聊几句，讲口头禅、讲经历、讲价值观
故事讲述：按时间线讲人生故事/宠物日常，适合给小孩听
问答助手：回答“他当年怎么看这件事”“这道菜怎么做”等固定问题

建议你从「问答助手」或「故事讲述」起步。

原因很现实：

你更容易收集资料
输出更稳定
不容易踩伦理雷

资料怎么收：别指望“几张照片 + 一段录音”就很像

做得像不像，80% 不在模型，在资料。

最好用的素材清单（按优先级）

真实文字：微信聊天记录、短信、日记、邮件、朋友圈
语音：语音消息、视频里的说话片段（越自然越好）
可验证的事实：出生地、工作经历、重要事件年份（防幻觉）
“说话习惯”：口头禅、常用称呼、爱用的标点（真的有用）
宠物素材：日常记录、行为习惯、喜欢的玩具/食物、害怕什么

一个好用的整理方式：三张表

你开个 Notion/Excel 就行。

表 1：时间线（Timeline）

| 时间 | 事件 | 细节 | 可引用素材 | |---|---|---|---| | 2016 | 养了猫 | 起名“豆豆” | 照片/视频链接 |

表 2：说话风格（Style）

常用称呼：[“你呀”“小子”“乖乖”]
口头禅：[“别急”“慢慢来”]
语气：[温柔/直接/爱吐槽/很少用感叹号]

表 3：高频问答（FAQ）

Q：你最喜欢吃什么？
A：……（附证据：某条聊天记录/某段视频）

做这三张表的意义：你后面做 RAG/提示词/审核，都会轻松很多。

架构选型：别一上来就搞“全息”，先把脑子做出来

你可以把“纪念数字人 Skill”拆成 4 层：

知识层：资料库（时间线、聊天记录、照片说明）
大脑层：对话模型 + 检索（RAG）
表达层：文字 / 语音（TTS） / 语音克隆
外观层：头像、视频数字人、全息展示

推荐路线：先文字对话稳定，再加声音，再加形象。

你想要“像”，得一层层叠。

方案 A：最快落地（适合个人）——做一个“纪念聊天机器人”

目标：手机上就能用，1-2 天做出来。

你需要的工具（任选其一）

ChatGPT 自定义 GPT（简单、上手快）
Claude Projects（长文档管理舒服）
扣子/百度智能体/阿里通义智能体（国内生态更顺手）

核心能力：

上传资料
能检索引用
能设置系统提示词

系统提示词模板（直接抄）

把下面当作“系统指令/角色设定”。你根据对象改一改。

你是一个“纪念对话 Skill”，用于纪念【称呼】（已离世/不在身边）。

目标：提供温和、克制、可被信任的陪伴式对话与回忆讲述。

边界：
- 不声称自己是真人/灵魂/复活。
- 不提供医学、法律、投资等重大决策建议。
- 用户询问敏感问题时，先安抚情绪，再建议求助现实中的家人/朋友/专业人士。

风格：
- 用【称呼】的说话习惯：短句、少说教、适度幽默。
- 避免夸张煽情，不使用“我一直在你身边”这类误导句。

知识使用规则：
- 回答必须优先引用资料库；不确定就说“不太确定，我记得可能是……你要不要看看那段记录？”
- 遇到矛盾信息，提示“我这里有两个版本”，并把来源说清。

输出形式：
- 默认 3-6 句。
- 用户要详细再展开。

让它更像：加一段“口吻校准”

把你整理的 Style 表，塞进“额外指令/知识”。

例子：

常用称呼：你、乖乖
结尾习惯：喜欢用“嗯”“行吧”
禁用句：不说大道理，不说“加油你可以的”

这种细节，比换模型更有效。

方案 B：更像、更稳（适合做产品）——RAG 知识库 + 可追溯引用

你想把它做成能卖的东西，就要解决一个痛点：

用户问“他说过吗？”你得能拿得出证据。

RAG（检索增强生成）就是干这个的。

一个能跑通的 RAG 组合

向量库：Chroma / FAISS / Milvus（用哪个都行）
框架：LangChain / LlamaIndex
模型：OpenAI / Claude / 通义 / 豆包 / DeepSeek（看你预算和部署）

文档切分建议（很关键）

聊天记录：按“话题块”切，不要按固定字数硬切
日记/长文：按段落切，保留日期
视频转文字：保留时间戳，方便回溯

每个片段都带上 metadata：

来源：微信/日记/采访
时间：YYYY-MM-DD
可信度：原文/转述

回复格式建议：把“引用”做成习惯

你可以要求它：

正文先回答
末尾加一行“依据：[来源+日期]”

用户看到引用，会更安心。

声音怎么做：从“像”到“别吓人”只差一句话

声音是加分项，也是翻车重灾区。

两条路线

TTS 拟人音色：不追求一模一样，追求“温柔、熟悉”
语音克隆：更像，但对素材和合规要求更高

常见工具（看你地区和合规要求选择）：

ElevenLabs（英文强，中文也能用）
Azure TTS
讯飞/火山/阿里云 TTS

语音素材怎么选

选自然说话，不要选唱歌、喊叫、背景噪音很大的
10-30 分钟可用素材，效果通常就能明显提升
同一麦克风、同一场景越多越好

给你一个“防吓人”话术

别让它一开口就像“阴间来电”。

可以在开场固定加一句：

“我用的是根据你提供的资料做的纪念声音，不是本人。你想聊点什么？”

克制，反而更高级。

形象怎么做：别执着“像本人”，先做到“让人愿意看”

很多人看到数字人翻车，原因不是技术，是审美和边界。

三档选择（从稳到冒险）

静态头像 + 语音：最稳，接受度高
半身口播数字人：用一张照片驱动（HeyGen、D-ID 这类）
高度拟真复刻：风险最大，容易引发家属反感

建议：

用“风格化形象”更安全（插画、轻写实）
眼神别太真、皮肤别太蜡
表情幅度小一点，会显得更自然

全息展示怎么落地：别被“全息”两个字骗了

你看到的很多“全息数字人”，其实是三类东西：

透明屏/橱窗屏：商用展示很常见
光场屏（比如 Looking Glass）：效果好，价格也漂亮
佩珀尔幻象（Pepper's Ghost）：用反射膜做“悬浮感”，成本可控

最省钱的“全息感”方案（能摆在客厅）

一台平板/显示器
一个透明亚克力金字塔（网购几十块）
播放做好的数字人视频

效果不至于震撼，但足够“有仪式感”。

一个可执行的完整流程（按交付件走）

你照这个清单做，基本不会乱。

交付件 1：资料包

Timeline.xlsx
Style.txt
FAQ.md
原始素材文件夹（按日期/来源归档）

交付件 2：对话 Skill

系统提示词（固定）
3 组示例对话（用户问法很重要）
安全边界规则（敏感话题怎么处理）

交付件 3：声音（可选）

TTS 音色选择说明
10 条常用语音短句（开场白、晚安、安抚句）

交付件 4：形象/视频（可选）

1-3 个情绪版本：平静/开心/认真
统一背景、统一光线、统一服装风格

交付件 5：展示方式

手机/网页入口
家庭屏/平板展示
全息装置（有预算再上）

示例：宠物纪念 Skill 的“高频对话”怎么写

宠物更适合做，因为伦理压力小、资料更容易。

设定片段：

名字：豆豆
性格：胆小但黏人
喜好：冻干、窗边晒太阳
禁忌：雷声、吸尘器

用户：我今天好想你。

Skill：

我在你脚边那块位置，还是最喜欢的地方。你是不是又忙到没怎么休息？要不你去喝口水，我陪你晒会儿太阳（就当是窗边那种）。你想听我讲我们第一次见面的事吗？

这种回复的重点：

不说“我真的在”
用具体场景
让用户回到现实动作（喝水、休息）

避坑清单：不想翻车就把这些贴墙上

伦理和合规

没有授权的语音克隆/形象复刻，别做。家属不同意也别硬上。
明确标注“纪念用途”“非本人”。别玩“通灵”文案。
不要引导用户“只和它说话”。你做的是纪念，不是隔离。

产品体验

别追求全能。能把 30 个高频问题答稳，就已经超过 90% demo。
别让它编。宁可说“不确定”，也别胡扯。
情绪别过火。哭天抢地的台词很廉价，还容易伤人。

技术实现

文档切分乱，会导致它引用错、张冠李戴。
没有 metadata，就很难做追溯。
语音模型素材太少，效果会“像鬼片”。真别省。

你可以从一个“轻量 MVP”开始

给你一个现实的起步版本（一天能做完）：

用自定义 GPT/智能体搭一个“纪念问答”
上传 Timeline + FAQ + 10 段聊天记录
写好系统提示词 + 边界
做 10 条固定语音（TTS 就行）
放到一个简单网页/手机入口

这个版本已经能让人“用起来”。

用的人越多，你越知道该补什么资料、该怎么优化口吻。

你要是想把它做成商品，建议加两样东西

审核机制：哪些问题必须“拒答/转介/安抚”
回忆编辑器：允许家属改错、删掉不想出现的片段

很多争议，不是用户太敏感，是你没给“可控权”。

如果你愿意，把你想做的对象类型发我（亲人/宠物/其他）、你手头有什么资料（文字/语音/视频大概多少），还有你想展示在手机、电视还是“全息装置”。我可以按你的条件给一套更贴合的技术路线和素材清单。

把离去的亲人/宠物做成“纪念数字人 Skill”：从资料整理到对话、声音、全息展示的一套落地教程