用 GPT Image 2 把照片变成角色信息卡：三视图、表情、动作一次搞定

如果你做 AI 视频，肯定遇到过一个老大难问题：

角色一动起来，脸就变了。

上一秒还是本人，下一秒像远房亲戚。再切个镜头，直接换了一个人。很烦，对吧？

解决办法很直接：先做一张“角色信息卡”。

这张卡里要有：

正面、侧面、背面三视图
不同表情的脸部特写
常见动作姿势
仰视、俯视、侧视等角度参考
清楚的人物基础信息

然后把它丢给 Seedance 2.0 之类的视频模型当参考图，角色稳定性会好很多。

下面这套流程，你可以直接照着做。

适合什么场景？

这招特别适合这些需求：

用真人照片生成短视频角色
给虚拟主播、数字人做人物设定
做漫画、游戏、小说角色设定图
让 AI 视频里的主角保持同一张脸
给团队统一角色视觉参考

比如你要做一个“职场女性下班后变身机车骑手”的短片。

只靠一句提示词让视频模型硬猜，角色很容易崩。

有了角色卡，视频模型就有了“标准答案”。它知道这个人长什么样，侧脸什么样，笑起来什么样，跑起来大概什么姿态。

准备一张合适的照片

照片质量会直接影响结果。

建议选这种：

正脸清楚
光线均匀
脸部无遮挡
发型完整可见
分辨率别太低
尽量不要开夸张美颜

不建议用：

大墨镜照片
半张脸自拍
夜店强光照片
多人合照
表情太夸张的照片

如果是别人的照片，记得获得授权。尤其是要拿去生成视频、发布内容、商业使用时，别图省事给自己埋雷。

一键生成角色信息卡提示词

把照片上传给 GPT Image 2，然后复制下面这段。

你只需要改掉方括号里的内容。

请根据我上传的照片，生成一张完整的角色信息卡。

要求：
保持人物的五官、脸型、气质、发型、发色和整体辨识度不变。
不要改变人物年龄感，不要把人物画成另一个人。

角色基础信息：
姓名：[角色姓名]
年龄：[年龄]岁
身高：[身高] cm
体重：[体重] kg
体型：[例如：修长匀称 / 运动型 / 偏瘦 / 健壮 / 自然体型]
气质：[例如：冷静、干练、温柔、阳光、神秘、坚毅]
服装：[例如：黑色机能风外套、白色衬衫、休闲牛仔裤]
风格：[例如：写实影视角色设定图 / 动漫角色设定图 / 游戏角色概念设定图]

画面内容需要包含：
1. 人物三视图：正面、侧面、背面，全身站姿，比例一致。
2. 面部表情特写：微笑、露齿笑、大笑、平静、失望、哭泣、沮丧、生气、愤怒、坚毅、打哈欠。
3. 动作姿势参考：战斗姿势、奔跑、坐下、跳跃。
4. 多角度脸部特写：仰视、俯视、侧视。

排版要求：
做成专业角色设定卡布局，干净清晰，分区明确。
白色或浅灰背景。
每个小图旁边添加中文标签。
整体像影视 / 游戏制作团队使用的角色参考图。

质量要求：
人物脸部必须保持一致。
不同视角和表情都要像同一个人。
不要多出手指，不要肢体扭曲，不要五官漂移。
不要生成低清、模糊、过度磨皮的效果。

真人写实版提示词

如果你想做真人短片，用这个版本更稳。

请根据上传照片，生成一张写实影视风格角色信息卡。

核心要求：
人物必须保持与照片高度一致，包括五官结构、脸型、发型、气质、年龄感和真实肤色。
不要把人物变成动漫脸，不要过度美化，不要改变性别和年龄。

角色信息：
姓名：[姓名]
年龄：[年龄]岁
身高：[身高] cm
体型：[自然、真实、匀称的体型描述]
职业设定：[例如：刑警、设计师、赛车手、医生、特工]
服装设定：[具体写衣服，比如深灰色风衣、黑色长裤、短靴]

画面结构：
- 上方：角色姓名与基础信息
- 左侧：正面、侧面、背面全身三视图
- 中间：11种面部表情特写，包含微笑、露齿笑、大笑、平静、失望、哭泣、沮丧、生气、愤怒、坚毅、打哈欠
- 右侧：战斗、奔跑、坐下、跳跃动作参考
- 底部：仰视、俯视、侧视脸部角度参考

画面风格：
专业影视角色设定图，真实摄影质感，柔和棚拍光，清晰细节，浅灰背景，干净排版，中文标签。

避免：
脸部变形、五官不一致、表情夸张失控、身体比例异常、手部畸形、背景杂乱、文字乱码。

动漫 / 游戏角色版提示词

如果你要做二次元、游戏立绘、小说角色，可以用这个版本。

请根据上传照片，生成一张动漫游戏角色设定卡。

保留人物的五官特征、脸型轮廓、发型、气质和辨识度。
将人物转化为精致的动漫 / 游戏角色风格，但不要丢失原始人物特征。

角色信息：
姓名：[姓名]
年龄：[年龄]岁
身高：[身高] cm
体型：[例如：修长、运动型、匀称、强壮]
身份：[例如：魔法师、赏金猎人、未来战士、校园主角]
服装：[具体描述服装]
主色调：[例如：黑红、蓝白、银灰]

需要生成：
- 正面、侧面、背面三视图
- 表情特写：微笑、露齿笑、大笑、平静、失望、哭泣、沮丧、生气、愤怒、坚毅、打哈欠
- 动作参考：战斗、奔跑、坐下、跳跃
- 角度参考：仰视、俯视、侧视

排版：
专业游戏角色设定卡，分区清楚，中文标注，背景简洁，角色线条干净，细节丰富。

重点：
所有小图都必须像同一个角色。
不要出现多个不同角色。
不要改变发型和脸部核心特征。

怎么填人物信息更自然？

别把信息写得太夸张。

比如体型这块，建议用更专业、更中性的描述：

修长匀称
运动型身材
自然体型
健壮结实
偏瘦清爽
肩背挺拔
体态轻盈

少写那种过度凝视身体的词。模型容易跑偏，画面也容易变得廉价。

角色卡是给视频模型看的，不是写擦边海报。

生成后怎么喂给 Seedance 2.0？

拿到角色卡后，你可以这样用：

把角色信息卡作为参考图上传到 Seedance 2.0
视频提示词里强调“保持角色与参考图一致”
动作、镜头、场景单独描述
不要在视频提示词里重新改脸、改发型、改服装

示例：

参考上传的角色信息卡，生成一段写实电影风短视频。

角色必须与参考图保持一致，包括五官、脸型、发型、气质、服装和体型。

场景：夜晚城市天台，远处有霓虹灯和高楼。
动作：角色站在天台边缘，转身看向镜头，然后向前奔跑。
镜头：中景开场，慢慢推近到面部特写，再切到侧面跟拍。
情绪：冷静、坚定、有压迫感。
画面风格：电影感，真实光影，轻微手持镜头，浅景深。

避免：角色换脸、发型改变、服装改变、五官漂移、手部畸形、脸部模糊。

让角色更稳定的小技巧

1. 一次别塞太多新设定

角色卡已经定义了脸、发型、体型、服装。

到了视频阶段，就别又加“换成红色长发”“穿古装”“脸更像某某明星”。

模型会懵。

你给它两个方向，它可能选第三个方向。AI 很擅长自作主张。

2. 服装要固定

做系列视频时，最好给角色固定一套主服装。

比如：

黑色皮衣 + 深色长裤 + 短靴
白衬衫 + 灰西装裤
蓝色运动夹克 + 黑色训练裤

服装越稳定，角色越不容易跑。

3. 表情别写得太抽象

“很有故事感”“复杂的情绪”“灵魂受到冲击”这种词，听着高级，模型看了想睡。

换成具体表情：

皱眉
轻微咬牙
眼眶湿润
嘴角下压
眼神坚定
看向远方

具体，才好生成。

4. 镜头语言要拆开写

不要只写“生成一个酷炫视频”。

你可以这样写：

镜头从角色背后开始，角色站在雨夜街头。
2秒后角色缓慢回头，看向镜头。
镜头推进到面部特写。
角色露出冷静坚定的表情。
雨水从发梢滴落，背景霓虹虚化。

画面马上就稳了。

常见翻车点避坑清单

脸不像本人

原因可能是照片不清楚，或者提示词里风格改得太猛。

解决办法：

换一张更清晰的正脸照片
加一句“保持与上传照片高度一致”
不要写“极致美化”“网红脸”“明星脸”

三视图像三个人

这是角色卡最常见的问题。

解决办法：

正面、侧面、背面必须是同一个角色，同一套服装，同一发型，同一体型比例。

这句话很有用。

表情特写崩脸

表情太多时，模型容易乱画。

解决办法：

保留 6 到 8 个关键表情
或者分两次生成：一次三视图，一次表情表
表情别太夸张，尤其是大笑、哭泣、愤怒

文字标签乱码

AI 生成图里的文字经常翻车。

解决办法：

可以让模型只留空白标签位
后期用 PS、Canva、稿定设计自己加字
如果必须让模型加字，标签越短越好

比如用：

正面
侧面
背面
微笑
生气
奔跑

别写一大串。

身体比例怪

角色卡里动作很多，手脚容易出问题。

加这段：

人体结构准确，四肢比例自然，手指数量正确，动作姿势符合真实人体运动规律。

不能保证百分百不翻车，但会好不少。

进阶玩法：拆成三张参考卡

如果你追求更稳，别把所有内容都挤进一张图。

可以拆成三张：

角色三视图卡

只放：

正面
侧面
背面
基础信息
服装设定

适合确定角色外观。

表情参考卡

只放：

平静
微笑
大笑
生气
哭泣
坚毅
沮丧
惊讶

适合做剧情镜头。

动作姿势卡

只放：

站立
奔跑
跳跃
坐下
战斗
回头
低头
抬手

适合做动态视频。

内容少一点，模型反而更听话。

可直接复制的 Seedance 2.0 视频提示词

请参考上传的角色信息卡生成视频。

角色要求：
主角必须与参考图保持一致，包括五官、脸型、发型、气质、服装、身材比例和年龄感。
不要换脸，不要改变发型，不要改变服装颜色。

视频内容：
角色站在城市夜景中，缓慢转身看向镜头，然后向前奔跑。
角色表情从平静变为坚定。

镜头设计：
开场为背影中景。
镜头缓慢推进。
角色转身时切到正面近景。
奔跑时使用侧面跟拍。
结尾给一个面部特写。

画面风格：
写实电影感，真实光影，浅景深，霓虹灯背景，轻微雨水，画面清晰。

避免：
角色脸部变化、五官漂移、发型变化、衣服变化、手部畸形、身体比例异常、画面模糊、动作抽搐。

结语

角色信息卡不是花活，它是 AI 视频里非常实用的“角色锚点”。

你想让人物从第一秒到第十秒都像同一个人，就别只靠一句描述硬撑。

先用 GPT Image 2 做一张清晰的角色卡，再交给 Seedance 2.0 做动态画面。

这套组合用好了，做人物短片、剧情号、虚拟 IP、游戏概念视频都会轻松很多。

用 GPT Image 2 一键生成角色信息卡：照片转三视图、表情包、动作参考，再喂给 Seedance 2.0 做视频

用 GPT Image 2 把照片变成角色信息卡：三视图、表情、动作一次搞定

适合什么场景？

准备一张合适的照片

一键生成角色信息卡提示词

真人写实版提示词

动漫 / 游戏角色版提示词

怎么填人物信息更自然？

推荐参数和画面比例

生成后怎么喂给 Seedance 2.0？

让角色更稳定的小技巧

1. 一次别塞太多新设定

2. 服装要固定

3. 表情别写得太抽象

4. 镜头语言要拆开写

常见翻车点避坑清单

脸不像本人

三视图像三个人

表情特写崩脸

文字标签乱码

身体比例怪

进阶玩法：拆成三张参考卡

角色三视图卡

表情参考卡

动作姿势卡

推荐完整工作流

可直接复制的 Seedance 2.0 视频提示词

结语