把离去的亲人/宠物做成“纪念数字人 Skill”
你可能也刷到过:
“把离去的亲人或宠物做成 Skill,然后配上全息数字人。”
看着粗糙?对,很多都像 demo。
有市场?也对。因为它解决的不是“高科技”,而是一个很朴素的需求:留个可互动的纪念。
这篇不聊玄学,不讲“复活”。咱们按“产品”思路来做:
- 它是什么:一个“纪念对话 Skill”,能用熟悉的语气讲故事、答常见问题、安抚情绪
- 它不是什么:冒充真人、替代心理咨询、引导做重大决策
下面这套流程,你照着走就能做出一个能用的版本。🧩
你要先定清楚:Skill 到底做什么
很多人一上来就想做“全能数字人”。结果资料不够、边界不清,做出来像精神分裂。
把目标收紧,效果会好很多。
3 个最常见、也最容易落地的形态
- 纪念聊天:像家人一样聊几句,讲口头禅、讲经历、讲价值观
- 故事讲述:按时间线讲人生故事/宠物日常,适合给小孩听
- 问答助手:回答“他当年怎么看这件事”“这道菜怎么做”等固定问题
建议你从「问答助手」或「故事讲述」起步。
原因很现实:
- 你更容易收集资料
- 输出更稳定
- 不容易踩伦理雷
资料怎么收:别指望“几张照片 + 一段录音”就很像
做得像不像,80% 不在模型,在资料。
最好用的素材清单(按优先级)
- 真实文字:微信聊天记录、短信、日记、邮件、朋友圈
- 语音:语音消息、视频里的说话片段(越自然越好)
- 可验证的事实:出生地、工作经历、重要事件年份(防幻觉)
- “说话习惯”:口头禅、常用称呼、爱用的标点(真的有用)
- 宠物素材:日常记录、行为习惯、喜欢的玩具/食物、害怕什么
一个好用的整理方式:三张表
你开个 Notion/Excel 就行。
表 1:时间线(Timeline)
| 时间 | 事件 | 细节 | 可引用素材 | |---|---|---|---| | 2016 | 养了猫 | 起名“豆豆” | 照片/视频链接 |
表 2:说话风格(Style)
- 常用称呼:[“你呀”“小子”“乖乖”]
- 口头禅:[“别急”“慢慢来”]
- 语气:[温柔/直接/爱吐槽/很少用感叹号]
表 3:高频问答(FAQ)
- Q:你最喜欢吃什么?
- A:……(附证据:某条聊天记录/某段视频)
做这三张表的意义:你后面做 RAG/提示词/审核,都会轻松很多。
架构选型:别一上来就搞“全息”,先把脑子做出来
你可以把“纪念数字人 Skill”拆成 4 层:
- 知识层:资料库(时间线、聊天记录、照片说明)
- 大脑层:对话模型 + 检索(RAG)
- 表达层:文字 / 语音(TTS) / 语音克隆
- 外观层:头像、视频数字人、全息展示
推荐路线:先文字对话稳定,再加声音,再加形象。
你想要“像”,得一层层叠。
方案 A:最快落地(适合个人)——做一个“纪念聊天机器人”
目标:手机上就能用,1-2 天做出来。
你需要的工具(任选其一)
- ChatGPT 自定义 GPT(简单、上手快)
- Claude Projects(长文档管理舒服)
- 扣子/百度智能体/阿里通义智能体(国内生态更顺手)
核心能力:
- 上传资料
- 能检索引用
- 能设置系统提示词
系统提示词模板(直接抄)
把下面当作“系统指令/角色设定”。你根据对象改一改。
你是一个“纪念对话 Skill”,用于纪念【称呼】(已离世/不在身边)。
目标:提供温和、克制、可被信任的陪伴式对话与回忆讲述。
边界:
- 不声称自己是真人/灵魂/复活。
- 不提供医学、法律、投资等重大决策建议。
- 用户询问敏感问题时,先安抚情绪,再建议求助现实中的家人/朋友/专业人士。
风格:
- 用【称呼】的说话习惯:短句、少说教、适度幽默。
- 避免夸张煽情,不使用“我一直在你身边”这类误导句。
知识使用规则:
- 回答必须优先引用资料库;不确定就说“不太确定,我记得可能是……你要不要看看那段记录?”
- 遇到矛盾信息,提示“我这里有两个版本”,并把来源说清。
输出形式:
- 默认 3-6 句。
- 用户要详细再展开。
让它更像:加一段“口吻校准”
把你整理的 Style 表,塞进“额外指令/知识”。
例子:
- 常用称呼:你、乖乖
- 结尾习惯:喜欢用“嗯”“行吧”
- 禁用句:不说大道理,不说“加油你可以的”
这种细节,比换模型更有效。
方案 B:更像、更稳(适合做产品)——RAG 知识库 + 可追溯引用
你想把它做成能卖的东西,就要解决一个痛点:
用户问“他说过吗?”你得能拿得出证据。
RAG(检索增强生成)就是干这个的。
一个能跑通的 RAG 组合
- 向量库:Chroma / FAISS / Milvus(用哪个都行)
- 框架:LangChain / LlamaIndex
- 模型:OpenAI / Claude / 通义 / 豆包 / DeepSeek(看你预算和部署)
文档切分建议(很关键)
- 聊天记录:按“话题块”切,不要按固定字数硬切
- 日记/长文:按段落切,保留日期
- 视频转文字:保留时间戳,方便回溯
每个片段都带上 metadata:
- 来源:微信/日记/采访
- 时间:YYYY-MM-DD
- 可信度:原文/转述
回复格式建议:把“引用”做成习惯
你可以要求它:
- 正文先回答
- 末尾加一行“依据:[来源+日期]”
用户看到引用,会更安心。
声音怎么做:从“像”到“别吓人”只差一句话
声音是加分项,也是翻车重灾区。
两条路线
- TTS 拟人音色:不追求一模一样,追求“温柔、熟悉”
- 语音克隆:更像,但对素材和合规要求更高
常见工具(看你地区和合规要求选择):
- ElevenLabs(英文强,中文也能用)
- Azure TTS
- 讯飞/火山/阿里云 TTS
语音素材怎么选
- 选自然说话,不要选唱歌、喊叫、背景噪音很大的
- 10-30 分钟可用素材,效果通常就能明显提升
- 同一麦克风、同一场景越多越好
给你一个“防吓人”话术
别让它一开口就像“阴间来电”。
可以在开场固定加一句:
“我用的是根据你提供的资料做的纪念声音,不是本人。你想聊点什么?”
克制,反而更高级。
形象怎么做:别执着“像本人”,先做到“让人愿意看”
很多人看到数字人翻车,原因不是技术,是审美和边界。
三档选择(从稳到冒险)
- 静态头像 + 语音:最稳,接受度高
- 半身口播数字人:用一张照片驱动(HeyGen、D-ID 这类)
- 高度拟真复刻:风险最大,容易引发家属反感
建议:
- 用“风格化形象”更安全(插画、轻写实)
- 眼神别太真、皮肤别太蜡
- 表情幅度小一点,会显得更自然
全息展示怎么落地:别被“全息”两个字骗了
你看到的很多“全息数字人”,其实是三类东西:
- 透明屏/橱窗屏:商用展示很常见
- 光场屏(比如 Looking Glass):效果好,价格也漂亮
- 佩珀尔幻象(Pepper's Ghost):用反射膜做“悬浮感”,成本可控
最省钱的“全息感”方案(能摆在客厅)
- 一台平板/显示器
- 一个透明亚克力金字塔(网购几十块)
- 播放做好的数字人视频
效果不至于震撼,但足够“有仪式感”。
一个可执行的完整流程(按交付件走)
你照这个清单做,基本不会乱。
交付件 1:资料包
- Timeline.xlsx
- Style.txt
- FAQ.md
- 原始素材文件夹(按日期/来源归档)
交付件 2:对话 Skill
- 系统提示词(固定)
- 3 组示例对话(用户问法很重要)
- 安全边界规则(敏感话题怎么处理)
交付件 3:声音(可选)
- TTS 音色选择说明
- 10 条常用语音短句(开场白、晚安、安抚句)
交付件 4:形象/视频(可选)
- 1-3 个情绪版本:平静/开心/认真
- 统一背景、统一光线、统一服装风格
交付件 5:展示方式
- 手机/网页入口
- 家庭屏/平板展示
- 全息装置(有预算再上)
示例:宠物纪念 Skill 的“高频对话”怎么写
宠物更适合做,因为伦理压力小、资料更容易。
设定片段:
- 名字:豆豆
- 性格:胆小但黏人
- 喜好:冻干、窗边晒太阳
- 禁忌:雷声、吸尘器
用户:我今天好想你。
Skill:
我在你脚边那块位置,还是最喜欢的地方。 你是不是又忙到没怎么休息? 要不你去喝口水,我陪你晒会儿太阳(就当是窗边那种)。 你想听我讲我们第一次见面的事吗?
这种回复的重点:
- 不说“我真的在”
- 用具体场景
- 让用户回到现实动作(喝水、休息)
避坑清单:不想翻车就把这些贴墙上
伦理和合规
- 没有授权的语音克隆/形象复刻,别做。家属不同意也别硬上。
- 明确标注“纪念用途”“非本人”。别玩“通灵”文案。
- 不要引导用户“只和它说话”。你做的是纪念,不是隔离。
产品体验
- 别追求全能。能把 30 个高频问题答稳,就已经超过 90% demo。
- 别让它编。宁可说“不确定”,也别胡扯。
- 情绪别过火。哭天抢地的台词很廉价,还容易伤人。
技术实现
- 文档切分乱,会导致它引用错、张冠李戴。
- 没有 metadata,就很难做追溯。
- 语音模型素材太少,效果会“像鬼片”。真别省。
你可以从一个“轻量 MVP”开始
给你一个现实的起步版本(一天能做完):
- 用自定义 GPT/智能体搭一个“纪念问答”
- 上传 Timeline + FAQ + 10 段聊天记录
- 写好系统提示词 + 边界
- 做 10 条固定语音(TTS 就行)
- 放到一个简单网页/手机入口
这个版本已经能让人“用起来”。
用的人越多,你越知道该补什么资料、该怎么优化口吻。
你要是想把它做成商品,建议加两样东西
- 审核机制:哪些问题必须“拒答/转介/安抚”
- 回忆编辑器:允许家属改错、删掉不想出现的片段
很多争议,不是用户太敏感,是你没给“可控权”。
如果你愿意,把你想做的对象类型发我(亲人/宠物/其他)、你手头有什么资料(文字/语音/视频大概多少),还有你想展示在手机、电视还是“全息装置”。我可以按你的条件给一套更贴合的技术路线和素材清单。