GPT Image 2 とは
OpenAI の最新世代の 画像生成モデルです。前世代の gpt-image-1 / DALL-E 系の弱点だった「画像内のテキスト(特に日本語などの非ラテン文字)が崩れる」「シリーズ物の絵柄が安定しない」問題を、特に強く改善してきたモデルです。製品名は「ChatGPT Images 2.0」、API での識別子が gpt-image-2。
何が変わったか
OpenAI 公式ブログ (Introducing ChatGPT Images 2.0) と TechCrunch の取材記事からまとめます。
1. GA 開始: 2026-04-22(前日 4-21 発表)。ChatGPT 全プランの利用者
と Codex ユーザに即日提供。有料プランは出力オプションが豊富。
2. 2K 解像度 — UI 部品・アイコン・小さな文字までシャープに出る。
3. 多言語テキスト描画の強化 — TechCrunch の記事より:
"Stronger understanding of non-Latin text rendering in languages like Japanese, Korean, Hindi, and Bengali" 日本語の文字を画像内に置く用途(メニュー、ポスター、漫画コマ、インフォグラフィック等)でこれまでより破綻しにくい。
4. "Thinking" モード — 1 リクエスト内で Web 検索を挟む / 1 プロンプト
から複数画像を生成 / 自己検証して品質を上げる、という反復型の生成が組み込まれた。
5. 複数画像の一貫性 — 同じスタイル / キャラ / 構成を保った
シリーズ画像を生成しやすくなった。「Create Everything at Once」表現で、複数アセットを 1 度に整合性を取りつつ作る用途を想定。
6. モデルの知識カットオフ: 2025-12 (TechCrunch より)。
7. OpenAI のコメント:
"Images 2.0 brings an unprecedented level of specificity and fidelity to image creation"
利用条件・プラン
・ChatGPT: 全プラン(Free / Plus / Pro / Team / Enterprise 想定)。ただし 有料プランほど高度な出力オプション が使える、と公式が明示。
・API: gpt-image-2 として即日利用可。
・Codex: 同じく即日対応。
価格について(公式: developers.openai.com/api/docs/pricing)
API 課金は トークン単位(per 1M tokens)。Standard と Batch の 2 tier:
・項目 / Standard / Batch
・Image Input / $8.00 / $4.00
・Cached Image Input / $2.00 / $1.00
・Image Output / $30.00 / $15.00
・Text Input / $5.00 / $2.50
・Cached Text Input / $1.25 / $0.625
・Codex 経由でも 同一料金(Codex 専用の別 tier はなし)。
・1 枚あたりの実コストは「画像生成ガイド」内の calculator で見積もれます(resolution / "thinking" モード使用で変動)。
・レート制限(RPM / TPM)は本ページには記載なし。組織のレート制限ページで別途確認のこと。
誰にどう効くか
非エンジニア / クリエイター
・日本語混じりの SNS 画像 / バナー / メニュー が、文字崩れを抑えてそのまま使えるレベルで出る可能性が高くなった。これまで「画像生成 → 文字部分は別ツールで貼り直し」していた工程を短縮。
・シリーズ画像の安定性 — キャラの絵柄や色味が回ごとに変わってしまう問題が軽減。漫画コマ、説明用イラスト、マニュアル画像などで特に効く。
LP / Web 制作者([@yoshio_nocode](https://x.com/yoshio_nocode) 事例)
yoshio さんの投稿そのまま引用すると:
「GPT image 2 で画像 LP を爆速制作した、画像の一貫性が高く Nano Banana より圧倒的に良い。input フォームとボタン部分はコーディングで出力し、上下は違和感なく結合。Codex なら image2 での画像生成からコーディングまで一気通貫で出来るし、これを Skill 化して次回以降も完璧に再現できる。」
ポイント:
・画像で見せたい部分(ヒーロー画像、解説図)は gpt-image-2 で生成、フォーム / ボタン / レイアウト部分は Codex がコードで生成、それを上下に結合する LP 制作フローが現実解になっている。
・Codex Skill 化: 一度作ったプロンプト + 生成 + 結合の手順を Skill として保存しておけば、別の LP に同じ品質で再現できる。
開発者
・API として呼べるので、社内ツールに「日本語テキストを正しく載せたバナーを定期生成」「会員 ID 入りのデジタル証書を発行」のようなワークフローを組み込める。
・"thinking" モードはトークン消費が増える可能性がある旨、出ている資料も。自分のワークロードでコスト試算してから本番に乗せるのが安全。