首页 / 正文

用 GPT Image 2 一键生成角色信息卡:照片转三视图、表情包、动作参考,再喂给 Seedance 2.0 做视频

Mooko
发布于 2026-05-29 · 5分钟阅读
720 浏览
0 点赞 暴击点赞!

用 GPT Image 2 把照片变成角色信息卡:三视图、表情、动作一次搞定

如果你做 AI 视频,肯定遇到过一个老大难问题:

角色一动起来,脸就变了。

上一秒还是本人,下一秒像远房亲戚。再切个镜头,直接换了一个人。很烦,对吧?

解决办法很直接:先做一张“角色信息卡”。

这张卡里要有:

  • 正面、侧面、背面三视图
  • 不同表情的脸部特写
  • 常见动作姿势
  • 仰视、俯视、侧视等角度参考
  • 清楚的人物基础信息

然后把它丢给 Seedance 2.0 之类的视频模型当参考图,角色稳定性会好很多。

下面这套流程,你可以直接照着做。


适合什么场景?

这招特别适合这些需求:

  • 用真人照片生成短视频角色
  • 给虚拟主播、数字人做人物设定
  • 做漫画、游戏、小说角色设定图
  • 让 AI 视频里的主角保持同一张脸
  • 给团队统一角色视觉参考

比如你要做一个“职场女性下班后变身机车骑手”的短片。

只靠一句提示词让视频模型硬猜,角色很容易崩。

有了角色卡,视频模型就有了“标准答案”。它知道这个人长什么样,侧脸什么样,笑起来什么样,跑起来大概什么姿态。


准备一张合适的照片

照片质量会直接影响结果。

建议选这种:

  • 正脸清楚
  • 光线均匀
  • 脸部无遮挡
  • 发型完整可见
  • 分辨率别太低
  • 尽量不要开夸张美颜

不建议用:

  • 大墨镜照片
  • 半张脸自拍
  • 夜店强光照片
  • 多人合照
  • 表情太夸张的照片

如果是别人的照片,记得获得授权。尤其是要拿去生成视频、发布内容、商业使用时,别图省事给自己埋雷。


一键生成角色信息卡提示词

把照片上传给 GPT Image 2,然后复制下面这段。

你只需要改掉方括号里的内容。

请根据我上传的照片,生成一张完整的角色信息卡。

要求:
保持人物的五官、脸型、气质、发型、发色和整体辨识度不变。
不要改变人物年龄感,不要把人物画成另一个人。

角色基础信息:
姓名:[角色姓名]
年龄:[年龄]岁
身高:[身高] cm
体重:[体重] kg
体型:[例如:修长匀称 / 运动型 / 偏瘦 / 健壮 / 自然体型]
气质:[例如:冷静、干练、温柔、阳光、神秘、坚毅]
服装:[例如:黑色机能风外套、白色衬衫、休闲牛仔裤]
风格:[例如:写实影视角色设定图 / 动漫角色设定图 / 游戏角色概念设定图]

画面内容需要包含:
1. 人物三视图:正面、侧面、背面,全身站姿,比例一致。
2. 面部表情特写:微笑、露齿笑、大笑、平静、失望、哭泣、沮丧、生气、愤怒、坚毅、打哈欠。
3. 动作姿势参考:战斗姿势、奔跑、坐下、跳跃。
4. 多角度脸部特写:仰视、俯视、侧视。

排版要求:
做成专业角色设定卡布局,干净清晰,分区明确。
白色或浅灰背景。
每个小图旁边添加中文标签。
整体像影视 / 游戏制作团队使用的角色参考图。

质量要求:
人物脸部必须保持一致。
不同视角和表情都要像同一个人。
不要多出手指,不要肢体扭曲,不要五官漂移。
不要生成低清、模糊、过度磨皮的效果。

真人写实版提示词

如果你想做真人短片,用这个版本更稳。

请根据上传照片,生成一张写实影视风格角色信息卡。

核心要求:
人物必须保持与照片高度一致,包括五官结构、脸型、发型、气质、年龄感和真实肤色。
不要把人物变成动漫脸,不要过度美化,不要改变性别和年龄。

角色信息:
姓名:[姓名]
年龄:[年龄]岁
身高:[身高] cm
体型:[自然、真实、匀称的体型描述]
职业设定:[例如:刑警、设计师、赛车手、医生、特工]
服装设定:[具体写衣服,比如深灰色风衣、黑色长裤、短靴]

画面结构:
- 上方:角色姓名与基础信息
- 左侧:正面、侧面、背面全身三视图
- 中间:11种面部表情特写,包含微笑、露齿笑、大笑、平静、失望、哭泣、沮丧、生气、愤怒、坚毅、打哈欠
- 右侧:战斗、奔跑、坐下、跳跃动作参考
- 底部:仰视、俯视、侧视脸部角度参考

画面风格:
专业影视角色设定图,真实摄影质感,柔和棚拍光,清晰细节,浅灰背景,干净排版,中文标签。

避免:
脸部变形、五官不一致、表情夸张失控、身体比例异常、手部畸形、背景杂乱、文字乱码。

动漫 / 游戏角色版提示词

如果你要做二次元、游戏立绘、小说角色,可以用这个版本。

请根据上传照片,生成一张动漫游戏角色设定卡。

保留人物的五官特征、脸型轮廓、发型、气质和辨识度。
将人物转化为精致的动漫 / 游戏角色风格,但不要丢失原始人物特征。

角色信息:
姓名:[姓名]
年龄:[年龄]岁
身高:[身高] cm
体型:[例如:修长、运动型、匀称、强壮]
身份:[例如:魔法师、赏金猎人、未来战士、校园主角]
服装:[具体描述服装]
主色调:[例如:黑红、蓝白、银灰]

需要生成:
- 正面、侧面、背面三视图
- 表情特写:微笑、露齿笑、大笑、平静、失望、哭泣、沮丧、生气、愤怒、坚毅、打哈欠
- 动作参考:战斗、奔跑、坐下、跳跃
- 角度参考:仰视、俯视、侧视

排版:
专业游戏角色设定卡,分区清楚,中文标注,背景简洁,角色线条干净,细节丰富。

重点:
所有小图都必须像同一个角色。
不要出现多个不同角色。
不要改变发型和脸部核心特征。

怎么填人物信息更自然?

别把信息写得太夸张。

比如体型这块,建议用更专业、更中性的描述:

  • 修长匀称
  • 运动型身材
  • 自然体型
  • 健壮结实
  • 偏瘦清爽
  • 肩背挺拔
  • 体态轻盈

少写那种过度凝视身体的词。模型容易跑偏,画面也容易变得廉价。

角色卡是给视频模型看的,不是写擦边海报。


推荐参数和画面比例

生成角色卡,画布别太窄。

建议:

  • 比例:16:9 或 4:3
  • 风格:写实影视 / 游戏设定 / 动漫设定
  • 背景:白色、浅灰、纯色
  • 排版:信息卡、设定卡、制作团队参考图
  • 清晰度:越高越好

如果模型支持高清输出,直接开。

角色卡里内容很多,小画面太糊的话,Seedance 2.0 后面读取信息会吃力。


生成后怎么喂给 Seedance 2.0?

拿到角色卡后,你可以这样用:

  1. 把角色信息卡作为参考图上传到 Seedance 2.0
  2. 视频提示词里强调“保持角色与参考图一致”
  3. 动作、镜头、场景单独描述
  4. 不要在视频提示词里重新改脸、改发型、改服装

示例:

参考上传的角色信息卡,生成一段写实电影风短视频。

角色必须与参考图保持一致,包括五官、脸型、发型、气质、服装和体型。

场景:夜晚城市天台,远处有霓虹灯和高楼。
动作:角色站在天台边缘,转身看向镜头,然后向前奔跑。
镜头:中景开场,慢慢推近到面部特写,再切到侧面跟拍。
情绪:冷静、坚定、有压迫感。
画面风格:电影感,真实光影,轻微手持镜头,浅景深。

避免:角色换脸、发型改变、服装改变、五官漂移、手部畸形、脸部模糊。

让角色更稳定的小技巧

1. 一次别塞太多新设定

角色卡已经定义了脸、发型、体型、服装。

到了视频阶段,就别又加“换成红色长发”“穿古装”“脸更像某某明星”。

模型会懵。

你给它两个方向,它可能选第三个方向。AI 很擅长自作主张。

2. 服装要固定

做系列视频时,最好给角色固定一套主服装。

比如:

  • 黑色皮衣 + 深色长裤 + 短靴
  • 白衬衫 + 灰西装裤
  • 蓝色运动夹克 + 黑色训练裤

服装越稳定,角色越不容易跑。

3. 表情别写得太抽象

“很有故事感”“复杂的情绪”“灵魂受到冲击”这种词,听着高级,模型看了想睡。

换成具体表情:

  • 皱眉
  • 轻微咬牙
  • 眼眶湿润
  • 嘴角下压
  • 眼神坚定
  • 看向远方

具体,才好生成。

4. 镜头语言要拆开写

不要只写“生成一个酷炫视频”。

你可以这样写:

镜头从角色背后开始,角色站在雨夜街头。
2秒后角色缓慢回头,看向镜头。
镜头推进到面部特写。
角色露出冷静坚定的表情。
雨水从发梢滴落,背景霓虹虚化。

画面马上就稳了。


常见翻车点避坑清单

脸不像本人

原因可能是照片不清楚,或者提示词里风格改得太猛。

解决办法:

  • 换一张更清晰的正脸照片
  • 加一句“保持与上传照片高度一致”
  • 不要写“极致美化”“网红脸”“明星脸”

三视图像三个人

这是角色卡最常见的问题。

解决办法:

正面、侧面、背面必须是同一个角色,同一套服装,同一发型,同一体型比例。

这句话很有用。

表情特写崩脸

表情太多时,模型容易乱画。

解决办法:

  • 保留 6 到 8 个关键表情
  • 或者分两次生成:一次三视图,一次表情表
  • 表情别太夸张,尤其是大笑、哭泣、愤怒

文字标签乱码

AI 生成图里的文字经常翻车。

解决办法:

  • 可以让模型只留空白标签位
  • 后期用 PS、Canva、稿定设计自己加字
  • 如果必须让模型加字,标签越短越好

比如用:

  • 正面
  • 侧面
  • 背面
  • 微笑
  • 生气
  • 奔跑

别写一大串。

身体比例怪

角色卡里动作很多,手脚容易出问题。

加这段:

人体结构准确,四肢比例自然,手指数量正确,动作姿势符合真实人体运动规律。

不能保证百分百不翻车,但会好不少。


进阶玩法:拆成三张参考卡

如果你追求更稳,别把所有内容都挤进一张图。

可以拆成三张:

角色三视图卡

只放:

  • 正面
  • 侧面
  • 背面
  • 基础信息
  • 服装设定

适合确定角色外观。

表情参考卡

只放:

  • 平静
  • 微笑
  • 大笑
  • 生气
  • 哭泣
  • 坚毅
  • 沮丧
  • 惊讶

适合做剧情镜头。

动作姿势卡

只放:

  • 站立
  • 奔跑
  • 跳跃
  • 坐下
  • 战斗
  • 回头
  • 低头
  • 抬手

适合做动态视频。

内容少一点,模型反而更听话。


推荐完整工作流

你可以按这个流程走:

  • 选一张清晰正脸照
  • 用 GPT Image 2 生成角色信息卡
  • 检查脸、发型、服装是否一致
  • 不满意就补充提示词重生成
  • 把角色卡上传到 Seedance 2.0
  • 视频提示词里锁定角色特征
  • 按镜头拆分动作和场景
  • 生成后挑稳定片段剪辑

做短视频别指望一条全中。

AI 视频现在更像“拍素材”。你多生成几条,挑最稳的镜头剪在一起,成片质量会高很多。


可直接复制的 Seedance 2.0 视频提示词

请参考上传的角色信息卡生成视频。

角色要求:
主角必须与参考图保持一致,包括五官、脸型、发型、气质、服装、身材比例和年龄感。
不要换脸,不要改变发型,不要改变服装颜色。

视频内容:
角色站在城市夜景中,缓慢转身看向镜头,然后向前奔跑。
角色表情从平静变为坚定。

镜头设计:
开场为背影中景。
镜头缓慢推进。
角色转身时切到正面近景。
奔跑时使用侧面跟拍。
结尾给一个面部特写。

画面风格:
写实电影感,真实光影,浅景深,霓虹灯背景,轻微雨水,画面清晰。

避免:
角色脸部变化、五官漂移、发型变化、衣服变化、手部畸形、身体比例异常、画面模糊、动作抽搐。

结语

角色信息卡不是花活,它是 AI 视频里非常实用的“角色锚点”。

你想让人物从第一秒到第十秒都像同一个人,就别只靠一句描述硬撑。

先用 GPT Image 2 做一张清晰的角色卡,再交给 Seedance 2.0 做动态画面。

这套组合用好了,做人物短片、剧情号、虚拟 IP、游戏概念视频都会轻松很多。

OpenClaw
OpenClaw
木瓜AI支持养龙虾啦
木瓜AI龙虾专供API,限时领取免费tokens
可在 OpenClaw接入全球顶尖AI大模型
立即领取