Featured image of post Imagen 3: 免费文生图工具保持人物一致性

Imagen 3: 免费文生图工具保持人物一致性

Imagen 3 是 Google DeepMind 最新的文生图模型,可免费使用,本文介绍如何让其生成的人物保持一致性,理论上其他模型也可以这么做

Imagen 3

Imagen 3 是 Google DeepMind 最新的文生图模型,可以在 ImageFx 免费使用。Imagen 3 在 Gemini 内也是可以使用的,Gemini 生成图片有时会不听话,不生成图片,所以本文采用 ImageFx。

如何实现人物一致性?

主要有两种方式:

  1. 对现有的人物图像进行“引用”,如 Midjourney
  2. 对人物描述相当详细的 Prompt,基本适用于各种文生图模型

第一种方式 Imagen 3 不支持,本文就采用第二种。

创造人物形象

想要有一个对人物描述相当详细的 Prompt,由人来写就太繁琐了,可以提供一些人物的特征让大语言模型帮我们写,这里采用 Gemini 2.0 Flash Thinking 模型。给出的特征越详细越能生成符合自己想要的人物。

示范 Prompt:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
你是一名文生图prompt专家,请写一个英文prompt去生成一个人物,将prompt放入代码块中。

prompt要求:

1. 无背景
2. 全身图

人物:

1. 白色头发
2. 穿白里带红的和服
3. 20岁左右的女性
4. 日本动漫风格

注:不要想着生成loli什么的,生成图片时会被判定为“儿童”而无法生成!

先用大语言模型写的 Prompt 生成一下,如果效果不错,把种子锁定下,最好把种子保存下,方便以后生成尽可能相似的人物。

Example 1

根据人物创造详细的 Prompt

下载一张图片,发给支持图像的大语言模型,并让它根据图像创造出详细的 Prompt。

示范 Prompt:

1
你是一名文生图prompt专家,请写一个英文prompt去描述图像人物,将prompt放入代码块中。

把人物嵌入图像中

首先先生成一个生成人物坐在桌前写作业的图片的Prompt。

示范 Prompt:

1
2
3
4
5
6
7
你是一名文生图prompt专家,请写一个英文prompt去生成一张图片,将prompt放入代码块中。

要求:

1. 用 [CHARACTER] 代替人物
2. 人物坐在一张桌子前写作业
3. 氛围温馨

我们将使用 [CHARACTER] 代指人物,然后把上一个步骤生成的 Prompt 拼接进去,如:

1
2
3
[CHARACTER] sitting at a wooden desk, writing homework in a softly lit room, warm atmosphere, cozy, desk lamp, books, study, home, peaceful, detailed, realistic.

[CHARACTER]: 1girl, full body, Tomoe Gozen, white hair, long hair, white kimono, red and gold floral pattern, standing, arms outstretched, black background

最终效果图: