用 GPT Image 2 把照片变成角色信息卡:三视图、表情、动作一次搞定
如果你做 AI 视频,肯定遇到过一个老大难问题:
角色一动起来,脸就变了。
上一秒还是本人,下一秒像远房亲戚。再切个镜头,直接换了一个人。很烦,对吧?
解决办法很直接:先做一张“角色信息卡”。
这张卡里要有:
- 正面、侧面、背面三视图
- 不同表情的脸部特写
- 常见动作姿势
- 仰视、俯视、侧视等角度参考
- 清楚的人物基础信息
然后把它丢给 Seedance 2.0 之类的视频模型当参考图,角色稳定性会好很多。
下面这套流程,你可以直接照着做。
适合什么场景?
这招特别适合这些需求:
- 用真人照片生成短视频角色
- 给虚拟主播、数字人做人物设定
- 做漫画、游戏、小说角色设定图
- 让 AI 视频里的主角保持同一张脸
- 给团队统一角色视觉参考
比如你要做一个“职场女性下班后变身机车骑手”的短片。
只靠一句提示词让视频模型硬猜,角色很容易崩。
有了角色卡,视频模型就有了“标准答案”。它知道这个人长什么样,侧脸什么样,笑起来什么样,跑起来大概什么姿态。
准备一张合适的照片
照片质量会直接影响结果。
建议选这种:
- 正脸清楚
- 光线均匀
- 脸部无遮挡
- 发型完整可见
- 分辨率别太低
- 尽量不要开夸张美颜
不建议用:
- 大墨镜照片
- 半张脸自拍
- 夜店强光照片
- 多人合照
- 表情太夸张的照片
如果是别人的照片,记得获得授权。尤其是要拿去生成视频、发布内容、商业使用时,别图省事给自己埋雷。
一键生成角色信息卡提示词
把照片上传给 GPT Image 2,然后复制下面这段。
你只需要改掉方括号里的内容。
请根据我上传的照片,生成一张完整的角色信息卡。
要求:
保持人物的五官、脸型、气质、发型、发色和整体辨识度不变。
不要改变人物年龄感,不要把人物画成另一个人。
角色基础信息:
姓名:[角色姓名]
年龄:[年龄]岁
身高:[身高] cm
体重:[体重] kg
体型:[例如:修长匀称 / 运动型 / 偏瘦 / 健壮 / 自然体型]
气质:[例如:冷静、干练、温柔、阳光、神秘、坚毅]
服装:[例如:黑色机能风外套、白色衬衫、休闲牛仔裤]
风格:[例如:写实影视角色设定图 / 动漫角色设定图 / 游戏角色概念设定图]
画面内容需要包含:
1. 人物三视图:正面、侧面、背面,全身站姿,比例一致。
2. 面部表情特写:微笑、露齿笑、大笑、平静、失望、哭泣、沮丧、生气、愤怒、坚毅、打哈欠。
3. 动作姿势参考:战斗姿势、奔跑、坐下、跳跃。
4. 多角度脸部特写:仰视、俯视、侧视。
排版要求:
做成专业角色设定卡布局,干净清晰,分区明确。
白色或浅灰背景。
每个小图旁边添加中文标签。
整体像影视 / 游戏制作团队使用的角色参考图。
质量要求:
人物脸部必须保持一致。
不同视角和表情都要像同一个人。
不要多出手指,不要肢体扭曲,不要五官漂移。
不要生成低清、模糊、过度磨皮的效果。
真人写实版提示词
如果你想做真人短片,用这个版本更稳。
请根据上传照片,生成一张写实影视风格角色信息卡。
核心要求:
人物必须保持与照片高度一致,包括五官结构、脸型、发型、气质、年龄感和真实肤色。
不要把人物变成动漫脸,不要过度美化,不要改变性别和年龄。
角色信息:
姓名:[姓名]
年龄:[年龄]岁
身高:[身高] cm
体型:[自然、真实、匀称的体型描述]
职业设定:[例如:刑警、设计师、赛车手、医生、特工]
服装设定:[具体写衣服,比如深灰色风衣、黑色长裤、短靴]
画面结构:
- 上方:角色姓名与基础信息
- 左侧:正面、侧面、背面全身三视图
- 中间:11种面部表情特写,包含微笑、露齿笑、大笑、平静、失望、哭泣、沮丧、生气、愤怒、坚毅、打哈欠
- 右侧:战斗、奔跑、坐下、跳跃动作参考
- 底部:仰视、俯视、侧视脸部角度参考
画面风格:
专业影视角色设定图,真实摄影质感,柔和棚拍光,清晰细节,浅灰背景,干净排版,中文标签。
避免:
脸部变形、五官不一致、表情夸张失控、身体比例异常、手部畸形、背景杂乱、文字乱码。
动漫 / 游戏角色版提示词
如果你要做二次元、游戏立绘、小说角色,可以用这个版本。
请根据上传照片,生成一张动漫游戏角色设定卡。
保留人物的五官特征、脸型轮廓、发型、气质和辨识度。
将人物转化为精致的动漫 / 游戏角色风格,但不要丢失原始人物特征。
角色信息:
姓名:[姓名]
年龄:[年龄]岁
身高:[身高] cm
体型:[例如:修长、运动型、匀称、强壮]
身份:[例如:魔法师、赏金猎人、未来战士、校园主角]
服装:[具体描述服装]
主色调:[例如:黑红、蓝白、银灰]
需要生成:
- 正面、侧面、背面三视图
- 表情特写:微笑、露齿笑、大笑、平静、失望、哭泣、沮丧、生气、愤怒、坚毅、打哈欠
- 动作参考:战斗、奔跑、坐下、跳跃
- 角度参考:仰视、俯视、侧视
排版:
专业游戏角色设定卡,分区清楚,中文标注,背景简洁,角色线条干净,细节丰富。
重点:
所有小图都必须像同一个角色。
不要出现多个不同角色。
不要改变发型和脸部核心特征。
怎么填人物信息更自然?
别把信息写得太夸张。
比如体型这块,建议用更专业、更中性的描述:
- 修长匀称
- 运动型身材
- 自然体型
- 健壮结实
- 偏瘦清爽
- 肩背挺拔
- 体态轻盈
少写那种过度凝视身体的词。模型容易跑偏,画面也容易变得廉价。
角色卡是给视频模型看的,不是写擦边海报。
推荐参数和画面比例
生成角色卡,画布别太窄。
建议:
- 比例:16:9 或 4:3
- 风格:写实影视 / 游戏设定 / 动漫设定
- 背景:白色、浅灰、纯色
- 排版:信息卡、设定卡、制作团队参考图
- 清晰度:越高越好
如果模型支持高清输出,直接开。
角色卡里内容很多,小画面太糊的话,Seedance 2.0 后面读取信息会吃力。
生成后怎么喂给 Seedance 2.0?
拿到角色卡后,你可以这样用:
- 把角色信息卡作为参考图上传到 Seedance 2.0
- 视频提示词里强调“保持角色与参考图一致”
- 动作、镜头、场景单独描述
- 不要在视频提示词里重新改脸、改发型、改服装
示例:
参考上传的角色信息卡,生成一段写实电影风短视频。
角色必须与参考图保持一致,包括五官、脸型、发型、气质、服装和体型。
场景:夜晚城市天台,远处有霓虹灯和高楼。
动作:角色站在天台边缘,转身看向镜头,然后向前奔跑。
镜头:中景开场,慢慢推近到面部特写,再切到侧面跟拍。
情绪:冷静、坚定、有压迫感。
画面风格:电影感,真实光影,轻微手持镜头,浅景深。
避免:角色换脸、发型改变、服装改变、五官漂移、手部畸形、脸部模糊。
让角色更稳定的小技巧
1. 一次别塞太多新设定
角色卡已经定义了脸、发型、体型、服装。
到了视频阶段,就别又加“换成红色长发”“穿古装”“脸更像某某明星”。
模型会懵。
你给它两个方向,它可能选第三个方向。AI 很擅长自作主张。
2. 服装要固定
做系列视频时,最好给角色固定一套主服装。
比如:
- 黑色皮衣 + 深色长裤 + 短靴
- 白衬衫 + 灰西装裤
- 蓝色运动夹克 + 黑色训练裤
服装越稳定,角色越不容易跑。
3. 表情别写得太抽象
“很有故事感”“复杂的情绪”“灵魂受到冲击”这种词,听着高级,模型看了想睡。
换成具体表情:
- 皱眉
- 轻微咬牙
- 眼眶湿润
- 嘴角下压
- 眼神坚定
- 看向远方
具体,才好生成。
4. 镜头语言要拆开写
不要只写“生成一个酷炫视频”。
你可以这样写:
镜头从角色背后开始,角色站在雨夜街头。
2秒后角色缓慢回头,看向镜头。
镜头推进到面部特写。
角色露出冷静坚定的表情。
雨水从发梢滴落,背景霓虹虚化。
画面马上就稳了。
常见翻车点避坑清单
脸不像本人
原因可能是照片不清楚,或者提示词里风格改得太猛。
解决办法:
- 换一张更清晰的正脸照片
- 加一句“保持与上传照片高度一致”
- 不要写“极致美化”“网红脸”“明星脸”
三视图像三个人
这是角色卡最常见的问题。
解决办法:
正面、侧面、背面必须是同一个角色,同一套服装,同一发型,同一体型比例。
这句话很有用。
表情特写崩脸
表情太多时,模型容易乱画。
解决办法:
- 保留 6 到 8 个关键表情
- 或者分两次生成:一次三视图,一次表情表
- 表情别太夸张,尤其是大笑、哭泣、愤怒
文字标签乱码
AI 生成图里的文字经常翻车。
解决办法:
- 可以让模型只留空白标签位
- 后期用 PS、Canva、稿定设计自己加字
- 如果必须让模型加字,标签越短越好
比如用:
- 正面
- 侧面
- 背面
- 微笑
- 生气
- 奔跑
别写一大串。
身体比例怪
角色卡里动作很多,手脚容易出问题。
加这段:
人体结构准确,四肢比例自然,手指数量正确,动作姿势符合真实人体运动规律。
不能保证百分百不翻车,但会好不少。
进阶玩法:拆成三张参考卡
如果你追求更稳,别把所有内容都挤进一张图。
可以拆成三张:
角色三视图卡
只放:
- 正面
- 侧面
- 背面
- 基础信息
- 服装设定
适合确定角色外观。
表情参考卡
只放:
- 平静
- 微笑
- 大笑
- 生气
- 哭泣
- 坚毅
- 沮丧
- 惊讶
适合做剧情镜头。
动作姿势卡
只放:
- 站立
- 奔跑
- 跳跃
- 坐下
- 战斗
- 回头
- 低头
- 抬手
适合做动态视频。
内容少一点,模型反而更听话。
推荐完整工作流
你可以按这个流程走:
- 选一张清晰正脸照
- 用 GPT Image 2 生成角色信息卡
- 检查脸、发型、服装是否一致
- 不满意就补充提示词重生成
- 把角色卡上传到 Seedance 2.0
- 视频提示词里锁定角色特征
- 按镜头拆分动作和场景
- 生成后挑稳定片段剪辑
做短视频别指望一条全中。
AI 视频现在更像“拍素材”。你多生成几条,挑最稳的镜头剪在一起,成片质量会高很多。
可直接复制的 Seedance 2.0 视频提示词
请参考上传的角色信息卡生成视频。
角色要求:
主角必须与参考图保持一致,包括五官、脸型、发型、气质、服装、身材比例和年龄感。
不要换脸,不要改变发型,不要改变服装颜色。
视频内容:
角色站在城市夜景中,缓慢转身看向镜头,然后向前奔跑。
角色表情从平静变为坚定。
镜头设计:
开场为背影中景。
镜头缓慢推进。
角色转身时切到正面近景。
奔跑时使用侧面跟拍。
结尾给一个面部特写。
画面风格:
写实电影感,真实光影,浅景深,霓虹灯背景,轻微雨水,画面清晰。
避免:
角色脸部变化、五官漂移、发型变化、衣服变化、手部畸形、身体比例异常、画面模糊、动作抽搐。
结语
角色信息卡不是花活,它是 AI 视频里非常实用的“角色锚点”。
你想让人物从第一秒到第十秒都像同一个人,就别只靠一句描述硬撑。
先用 GPT Image 2 做一张清晰的角色卡,再交给 Seedance 2.0 做动态画面。
这套组合用好了,做人物短片、剧情号、虚拟 IP、游戏概念视频都会轻松很多。