首页 / 正文

把离去的亲人/宠物做成“纪念数字人 Skill”:从资料整理到对话、声音、全息展示的一套落地教程

Mooko
发布于 2026-04-18 · 5分钟阅读
251 浏览
0 点赞 暴击点赞!

把离去的亲人/宠物做成“纪念数字人 Skill”

你可能也刷到过:

“把离去的亲人或宠物做成 Skill,然后配上全息数字人。”

看着粗糙?对,很多都像 demo。

有市场?也对。因为它解决的不是“高科技”,而是一个很朴素的需求:留个可互动的纪念

这篇不聊玄学,不讲“复活”。咱们按“产品”思路来做:

  • 它是什么:一个“纪念对话 Skill”,能用熟悉的语气讲故事、答常见问题、安抚情绪
  • 它不是什么:冒充真人、替代心理咨询、引导做重大决策

下面这套流程,你照着走就能做出一个能用的版本。🧩


你要先定清楚:Skill 到底做什么

很多人一上来就想做“全能数字人”。结果资料不够、边界不清,做出来像精神分裂。

把目标收紧,效果会好很多。

3 个最常见、也最容易落地的形态

  • 纪念聊天:像家人一样聊几句,讲口头禅、讲经历、讲价值观
  • 故事讲述:按时间线讲人生故事/宠物日常,适合给小孩听
  • 问答助手:回答“他当年怎么看这件事”“这道菜怎么做”等固定问题

建议你从「问答助手」或「故事讲述」起步。

原因很现实:

  • 你更容易收集资料
  • 输出更稳定
  • 不容易踩伦理雷

资料怎么收:别指望“几张照片 + 一段录音”就很像

做得像不像,80% 不在模型,在资料。

最好用的素材清单(按优先级)

  • 真实文字:微信聊天记录、短信、日记、邮件、朋友圈
  • 语音:语音消息、视频里的说话片段(越自然越好)
  • 可验证的事实:出生地、工作经历、重要事件年份(防幻觉)
  • “说话习惯”:口头禅、常用称呼、爱用的标点(真的有用)
  • 宠物素材:日常记录、行为习惯、喜欢的玩具/食物、害怕什么

一个好用的整理方式:三张表

你开个 Notion/Excel 就行。

表 1:时间线(Timeline)

| 时间 | 事件 | 细节 | 可引用素材 | |---|---|---|---| | 2016 | 养了猫 | 起名“豆豆” | 照片/视频链接 |

表 2:说话风格(Style)

  • 常用称呼:[“你呀”“小子”“乖乖”]
  • 口头禅:[“别急”“慢慢来”]
  • 语气:[温柔/直接/爱吐槽/很少用感叹号]

表 3:高频问答(FAQ)

  • Q:你最喜欢吃什么?
  • A:……(附证据:某条聊天记录/某段视频)

做这三张表的意义:你后面做 RAG/提示词/审核,都会轻松很多。


架构选型:别一上来就搞“全息”,先把脑子做出来

你可以把“纪念数字人 Skill”拆成 4 层:

  1. 知识层:资料库(时间线、聊天记录、照片说明)
  2. 大脑层:对话模型 + 检索(RAG)
  3. 表达层:文字 / 语音(TTS) / 语音克隆
  4. 外观层:头像、视频数字人、全息展示

推荐路线:先文字对话稳定,再加声音,再加形象

你想要“像”,得一层层叠。


方案 A:最快落地(适合个人)——做一个“纪念聊天机器人”

目标:手机上就能用,1-2 天做出来。

你需要的工具(任选其一)

  • ChatGPT 自定义 GPT(简单、上手快)
  • Claude Projects(长文档管理舒服)
  • 扣子/百度智能体/阿里通义智能体(国内生态更顺手)

核心能力:

  • 上传资料
  • 能检索引用
  • 能设置系统提示词

系统提示词模板(直接抄)

把下面当作“系统指令/角色设定”。你根据对象改一改。

你是一个“纪念对话 Skill”,用于纪念【称呼】(已离世/不在身边)。

目标:提供温和、克制、可被信任的陪伴式对话与回忆讲述。

边界:
- 不声称自己是真人/灵魂/复活。
- 不提供医学、法律、投资等重大决策建议。
- 用户询问敏感问题时,先安抚情绪,再建议求助现实中的家人/朋友/专业人士。

风格:
- 用【称呼】的说话习惯:短句、少说教、适度幽默。
- 避免夸张煽情,不使用“我一直在你身边”这类误导句。

知识使用规则:
- 回答必须优先引用资料库;不确定就说“不太确定,我记得可能是……你要不要看看那段记录?”
- 遇到矛盾信息,提示“我这里有两个版本”,并把来源说清。

输出形式:
- 默认 3-6 句。
- 用户要详细再展开。

让它更像:加一段“口吻校准”

把你整理的 Style 表,塞进“额外指令/知识”。

例子:

  • 常用称呼:你、乖乖
  • 结尾习惯:喜欢用“嗯”“行吧”
  • 禁用句:不说大道理,不说“加油你可以的”

这种细节,比换模型更有效。


方案 B:更像、更稳(适合做产品)——RAG 知识库 + 可追溯引用

你想把它做成能卖的东西,就要解决一个痛点:

用户问“他说过吗?”你得能拿得出证据。

RAG(检索增强生成)就是干这个的。

一个能跑通的 RAG 组合

  • 向量库:Chroma / FAISS / Milvus(用哪个都行)
  • 框架:LangChain / LlamaIndex
  • 模型:OpenAI / Claude / 通义 / 豆包 / DeepSeek(看你预算和部署)

文档切分建议(很关键)

  • 聊天记录:按“话题块”切,不要按固定字数硬切
  • 日记/长文:按段落切,保留日期
  • 视频转文字:保留时间戳,方便回溯

每个片段都带上 metadata:

  • 来源:微信/日记/采访
  • 时间:YYYY-MM-DD
  • 可信度:原文/转述

回复格式建议:把“引用”做成习惯

你可以要求它:

  • 正文先回答
  • 末尾加一行“依据:[来源+日期]”

用户看到引用,会更安心。


声音怎么做:从“像”到“别吓人”只差一句话

声音是加分项,也是翻车重灾区。

两条路线

  • TTS 拟人音色:不追求一模一样,追求“温柔、熟悉”
  • 语音克隆:更像,但对素材和合规要求更高

常见工具(看你地区和合规要求选择):

  • ElevenLabs(英文强,中文也能用)
  • Azure TTS
  • 讯飞/火山/阿里云 TTS

语音素材怎么选

  • 选自然说话,不要选唱歌、喊叫、背景噪音很大的
  • 10-30 分钟可用素材,效果通常就能明显提升
  • 同一麦克风、同一场景越多越好

给你一个“防吓人”话术

别让它一开口就像“阴间来电”。

可以在开场固定加一句:

“我用的是根据你提供的资料做的纪念声音,不是本人。你想聊点什么?”

克制,反而更高级。


形象怎么做:别执着“像本人”,先做到“让人愿意看”

很多人看到数字人翻车,原因不是技术,是审美和边界。

三档选择(从稳到冒险)

  • 静态头像 + 语音:最稳,接受度高
  • 半身口播数字人:用一张照片驱动(HeyGen、D-ID 这类)
  • 高度拟真复刻:风险最大,容易引发家属反感

建议:

  • 用“风格化形象”更安全(插画、轻写实)
  • 眼神别太真、皮肤别太蜡
  • 表情幅度小一点,会显得更自然

全息展示怎么落地:别被“全息”两个字骗了

你看到的很多“全息数字人”,其实是三类东西:

  • 透明屏/橱窗屏:商用展示很常见
  • 光场屏(比如 Looking Glass):效果好,价格也漂亮
  • 佩珀尔幻象(Pepper's Ghost):用反射膜做“悬浮感”,成本可控

最省钱的“全息感”方案(能摆在客厅)

  • 一台平板/显示器
  • 一个透明亚克力金字塔(网购几十块)
  • 播放做好的数字人视频

效果不至于震撼,但足够“有仪式感”。


一个可执行的完整流程(按交付件走)

你照这个清单做,基本不会乱。

交付件 1:资料包

  • Timeline.xlsx
  • Style.txt
  • FAQ.md
  • 原始素材文件夹(按日期/来源归档)

交付件 2:对话 Skill

  • 系统提示词(固定)
  • 3 组示例对话(用户问法很重要)
  • 安全边界规则(敏感话题怎么处理)

交付件 3:声音(可选)

  • TTS 音色选择说明
  • 10 条常用语音短句(开场白、晚安、安抚句)

交付件 4:形象/视频(可选)

  • 1-3 个情绪版本:平静/开心/认真
  • 统一背景、统一光线、统一服装风格

交付件 5:展示方式

  • 手机/网页入口
  • 家庭屏/平板展示
  • 全息装置(有预算再上)

示例:宠物纪念 Skill 的“高频对话”怎么写

宠物更适合做,因为伦理压力小、资料更容易。

设定片段

  • 名字:豆豆
  • 性格:胆小但黏人
  • 喜好:冻干、窗边晒太阳
  • 禁忌:雷声、吸尘器

用户:我今天好想你。

Skill

我在你脚边那块位置,还是最喜欢的地方。 你是不是又忙到没怎么休息? 要不你去喝口水,我陪你晒会儿太阳(就当是窗边那种)。 你想听我讲我们第一次见面的事吗?

这种回复的重点:

  • 不说“我真的在”
  • 用具体场景
  • 让用户回到现实动作(喝水、休息)

避坑清单:不想翻车就把这些贴墙上

伦理和合规

  • 没有授权的语音克隆/形象复刻,别做。家属不同意也别硬上。
  • 明确标注“纪念用途”“非本人”。别玩“通灵”文案。
  • 不要引导用户“只和它说话”。你做的是纪念,不是隔离。

产品体验

  • 别追求全能。能把 30 个高频问题答稳,就已经超过 90% demo。
  • 别让它编。宁可说“不确定”,也别胡扯。
  • 情绪别过火。哭天抢地的台词很廉价,还容易伤人。

技术实现

  • 文档切分乱,会导致它引用错、张冠李戴。
  • 没有 metadata,就很难做追溯。
  • 语音模型素材太少,效果会“像鬼片”。真别省。

你可以从一个“轻量 MVP”开始

给你一个现实的起步版本(一天能做完):

  • 用自定义 GPT/智能体搭一个“纪念问答”
  • 上传 Timeline + FAQ + 10 段聊天记录
  • 写好系统提示词 + 边界
  • 做 10 条固定语音(TTS 就行)
  • 放到一个简单网页/手机入口

这个版本已经能让人“用起来”。

用的人越多,你越知道该补什么资料、该怎么优化口吻。


你要是想把它做成商品,建议加两样东西

  • 审核机制:哪些问题必须“拒答/转介/安抚”
  • 回忆编辑器:允许家属改错、删掉不想出现的片段

很多争议,不是用户太敏感,是你没给“可控权”。


如果你愿意,把你想做的对象类型发我(亲人/宠物/其他)、你手头有什么资料(文字/语音/视频大概多少),还有你想展示在手机、电视还是“全息装置”。我可以按你的条件给一套更贴合的技术路线和素材清单。

OpenClaw
OpenClaw
木瓜AI支持养龙虾啦
木瓜AI龙虾专供API,限时领取免费tokens
可在 OpenClaw接入全球顶尖AI大模型
立即领取