一貫した AI 画像を作るには、毎回の生成を単発のアイデアではなく、小さな制作システムとして扱います。必要なのは、参照画像のアンカー、再利用できるプロンプト骨格、スタイル表、修正ルールです。一貫性が崩れる原因は、固定すべき変数を守らずにプロンプトを書き直し続けることです。
要点:繰り返せるワークフロー
- 人物、商品の形、顔、服装、ロゴ位置、UI レイアウトが重要なら参照画像を使います。
- 固定項目と変数を分けます。身元、スタイル、カメラ、色、比率、背景、変更する場面を分離します。
- 最初の画像を生成し、最大のズレを診断して、その制御項目だけを修正します。
- 解決したプロンプトを名前付きレシピとして保存し、次のシリーズ画像に複製します。
- Vogue AI では、精密な指示には GPT Image 2、参照画像の速いバリエーションには Nano Banana、強いムード探索には Midjourney が向いています。
向いている人
この方法は、人物、商品、キャンペーン、ビジュアルスタイルを複数画像で保ちたいクリエイター、マーケター、創業者、デザイナー向けです。ピクセル単位の完全一致ではなく、実用的なシリーズを作るためにズレを減らす方法です。
このガイドの画像の役割
| 役割 | ソース | 理由 |
|---|---|---|
| ヒーロー | GPT Image 2 のストーリーボード画像 | 複数フレームの例はシリーズの一貫性を説明しやすいため、カバーとして使います。 |
| 身元セクション | Nano Banana の暗めのポートレート | 顔の参照画像は人物の一貫性と身元のズレを説明するのに適しています。 |
| スタイルセクション | Midjourney のファッション編集画像 | 色、光、レンズ、ムードを保ちながら主体を変える考え方を示せます。 |
一貫性は四つの制御で作る
| 制御 | 固定するもの | 変えてよいもの | よくある失敗 |
|---|---|---|---|
| 身元 | 顔、商品の形、服装の目印、ブランド要素、UI 階層。 | ポーズ、場面、切り抜き、表情、背景。 | 別人になったり商品が再設計されたりする。 |
| 構図 | 比率、カメラ距離、焦点、余白。 | 場面の細部、小物、チャンネル形式。 | 各画像が別キャンペーンのように見える。 |
| スタイル | 色、光、レンズ、質感、リアリティ。 | 主体の動き、季節テーマ、環境。 | 映画風、漫画風、スタジオ写真へ飛び移る。 |
| 修正ルール | 解決済みの骨格と参照画像の役割。 | 一度に一つの失敗だけ。 | 一つ直すと三つ問題が増える。 |
ステップ 1:プロンプト前にアンカーを決める
同じ人物、物体、パッケージ、画面、キャンペーンに見せたいなら、最初にアンカーを決めます。Vogue AI では参照画像を使い、その参照が何を制御するかを明確に書きます。

- 人物:顔の形、年齢感、髪型、体型、象徴的な服の色。
- 商品:シルエット、色、素材、ラベル位置、スケール。
- ブランドシリーズ:色、光、余白、文字の安全領域、アートディレクション。
- UI や画面:情報階層、デバイス枠、認識すべきプロダクト領域。
ステップ 2:固定フィールドと変数を分ける
安定したプロンプトは、重要な部分では退屈なくらい一定です。身元、カメラ、色、出力ルールを固定し、場面、文脈、ポーズ、チャンネル要件だけを変えます。
- Reference-led character: Use the uploaded reference as the identity anchor for [character]. Preserve face shape, hairstyle, age range, body proportions, and signature wardrobe color. Create a new [scene] with [lighting], [camera angle], and [aspect ratio]. Keep identity consistent, no extra people, no text, no watermark.
- Consistent product set: Use the uploaded product reference to preserve silhouette, material, color, label placement, and scale. Generate a [channel] image on a [background] with [lighting], [camera angle], and [composition]. Do not redesign the product, no fake logo text, no watermark.
- Series style system: Create image [number] in the same visual system as the previous frame: [palette], [lens], [lighting], [texture], [background language], and [render style]. Change only [variable]. Keep subject identity, framing rhythm, and atmosphere consistent.
- Revision prompt: Keep the previous image direction. Fix only [failure]: [specific correction]. Preserve subject identity, camera distance, palette, background, and aspect ratio. Do not introduce new props, people, logos, or text.
ステップ 3:シリーズ用のスタイル表を作る
スタイル表は、繰り返し使える視覚決定の短いリストです。長い形容詞より、どの項目が変わったかを確認しやすくなります。

| 項目 | 例 | 重要な理由 |
|---|---|---|
| 色 | 黒、骨白、落ち着いた金、赤のアクセント。 | 毎回別の配色になるのを防ぎます。 |
| 光 | 柔らかいキーライト、深い横影、弱いリムライト。 | 場面が変わっても同じムードを保ちます。 |
| レンズと裁切 | 85mm ポートレート感、胸上、3:4。 | 同じ撮影シリーズのリズムを作ります。 |
| 背景 | 最小限のスタジオ壁、軽い質感、文字なし。 | 一回限りのノイズを減らします。 |
| 出力ルール | 透かしなし、生成文字なし、参照身元を保持。 | 実務で使える素材にします。 |
ステップ 4:最初の結果を診断する
最初の画像は診断用です。身元が違えば参照の渡し方を強めます。構図が乱れていれば裁切と余白を直します。ブランド感が弱ければ色と光を修正します。
実例:同じ人物を三つの場面へ
依頼:若い陶芸家のローンチストーリーとして、スタジオポートレート、制作中、屋外マーケットの三枚を作る。人物は認識できる必要があり、ポーズと環境は変えてよい。
- アンカー:一枚のポートレートが顔、髪、年齢感、暖かい土色のジャケットを制御する。
- スタイル表:自然光、柔らかいフィルムコントラスト、浅い被写界深度、粘土とクリーム色、3:4。
- 変数:スタジオ、粘土を成形する手元、マーケットブースへ場面を変更。
- 確認ルール:顔、ジャケット色、色表がズレたら、好みを判断する前に差し戻す。
プロンプト版 1
- Use the uploaded portrait as the identity anchor for a young ceramic artist. Preserve face shape, hairstyle, age range, and warm earth-tone jacket. Create a natural daylight studio portrait in a ceramics workspace, soft film contrast, shallow depth of field, clay and cream palette, 3:4 aspect ratio, no extra people, no text, no watermark.
修正ルール
顔が変わったら、まだ場面は変えません。参照画像が顔の身元と髪を制御し、背景とポーズだけが変わると追加します。身元は正しいのにシリーズ感が弱い場合は、同じスタイル表を各場面に貼ります。
失敗と修正
| 問題 | 先に直すこと | 避けること |
|---|---|---|
| 同じプロンプトで別人になる | 参照アンカーを使い、固定する特徴を書く。 | 性格を表す形容詞を増やす。 |
| 商品形状が変わる | 参照がシルエット、素材、ラベル、スケールを制御すると書く。 | 形が安定する前に高級感を足す。 |
| スタイルがズレる | 同じ色、光、レンズ、裁切、背景を貼る。 | 毎回新しいムードを作る。 |
| 生成文字が素材を壊す | 空白を確保し、文字は別のデザインツールで入れる。 | モデルに完璧な文字組みを求める。 |
| 良い初回画像が修正で悪化する | 一度に一つの失敗だけを直す。 | 新しい案を全部同じプロンプトに入れる。 |
Vogue AI でのモデル選び
モデル選びはワークフロー上の判断です。GPT Image 2 は精密な指示と参照受け渡しに強く、Nano Banana は速いバリエーションや SNS 向け実験に便利で、Midjourney はムードやファッション構図、強いスタイル探索に向いています。
最終チェック
- プロンプトを読まなくても同じ人物、商品、ブランドだと分かりますか?
- 少なくとも三枚で固定項目が固定されていますか?
- 問題を解決したプロンプト版を保存しましたか?
- 生成文字、ロゴ、手、商品の細部は実際の用途に使えますか?
- 次の画像は一つの変数だけを変えて作れますか?
FAQ
無料で一貫した AI 画像を作れますか?
練習はできます。ただし安定性は料金より、参照画像の扱い、保存したプロンプト、修正ルールに左右されます。
参照画像は必要ですか?
身元が重要なら必要です。ムードやスタイルだけなら、文章のスタイル表で足りる場合があります。
同じ人物を別の場面に保つには?
参照画像で固定し、安定した特徴を定義し、カメラと色を保ち、場面だけを変えます。
商品が変形するのはなぜですか?
商品を固定物ではなく概念として書いている可能性があります。参照が形、素材、色、ラベル位置、スケールを制御すると書きます。
同じ seed は有効ですか?
ツールが seed を公開していれば助けになりますが、参照画像と安定した骨格の代わりにはなりません。
この方法で一貫した人物動画も作れますか?
静止画の参照を強くする準備にはなりますが、動画では動き、タイミング、フレーム間制約を別に確認する必要があります。