3 行で言うとは？

- 何が: OpenAI が画像生成モデル gpt-image-2 を GA （2026-04-22）。ChatGPT 全プラン、API、Codex で使える。 - 誰に: 画像生成を実務で使うクリエイター / マーケ / LP 制作者、特に日本語テキストを正確に画像内に出したい人、Codex を入口にしたい非エンジニア。 - 何が新しいか: 2K 解像度、非ラテン文字（日本語 / 韓国語 / ヒンディー語 / ベンガル語）の描画精度向上、複数画像の一貫性、 Web 検索 + 自己検証つきの "thinking" モード。

利用条件・プランは？

- ChatGPT: 全プラン（Free / Plus / Pro / Team / Enterprise 想定）。ただし有料プランほど高度な出力オプションが使える、と公式が明示。 - API: gpt-image-2 として即日利用可。 - Codex: 同じく即日対応。 ### 価格について（公式: developers.openai.com/api/docs/pricing） API 課金はトークン単位（per 1M tokens）。Standard と Batch の 2 tier: | 項目 | Standard | Batch | |---|---|---| | Image Input | $8.00 | $4.00 | | Cached Image Input | $2.00 | $1.00 | | Image Output | $30.00 | $15.00 | | Text Input | $5.00 | $2.50 | | Cached Text Input | $1.25 | $0.625 | - Codex 経由でも同一料金（Codex 専用の別 tier はなし）。 - 1 枚あたりの実コストは「画像生成ガイド」内の calculator で見積もれます（resolution / "thinking" モード使用で変動）。 - レート制限（RPM / TPM）は本ページには記載なし。組織のレート制限ページで別途確認のこと。

モデル更新2026.04.26AI経営実践ラボ編集部

OpenAI が GPT Image 2 を GA — 日本語テキスト描画と複数画像の一貫性が一段強化、Codex で「画像 LP を一気通貫」が現実に

Q: GPT Image 2 とは？

OpenAI の最新世代の 画像生成モデルです。前世代の gpt-image-1 / DALL-E 系の弱点だった「画像内のテキスト（特に日本語などの非ラテン文字）が 崩れる」「シリーズ物の絵柄が安定しない」問題を、特に強く改善してきた モデルです。製品名は「ChatGPT Images 2.0」、API での識別子が gpt-image-2。

# OpenAI が GPT Image 2 を GA — 日本語テキスト描画と複数画像の一貫性が一段強化、Codex で「画像 LP を一気通貫」が現実に。

GPT Image 25分

AI経営実践ラボ NOTEGPT Image 2AI

GPT Image 2 モデル更新記事一覧

この記事の要点

3行で言うと

# OpenAI が GPT Image 2 を GA — 日本語テキスト描画と複数画像の一貫性が一段強化、Codex で「画像 LP を一気通貫」が現実に。
GPT Image 2のモデル更新として、確認に必要な要点を整理しています。
料金、利用条件、対応プランを社内の運用ルールに合わせて確認してください。

この記事の目次

GPT Image 2 とは

OpenAI の最新世代の画像生成モデルです。前世代の gpt-image-1 / DALL-E 系の弱点だった「画像内のテキスト（特に日本語などの非ラテン文字）が崩れる」「シリーズ物の絵柄が安定しない」問題を、特に強く改善してきたモデルです。製品名は「ChatGPT Images 2.0」、API での識別子が gpt-image-2。

何が変わったか

OpenAI 公式ブログ (Introducing ChatGPT Images 2.0) と TechCrunch の取材記事からまとめます。

1. GA 開始: 2026-04-22（前日 4-21 発表）。ChatGPT 全プランの利用者

と Codex ユーザに即日提供。有料プランは出力オプションが豊富。

2. 2K 解像度 — UI 部品・アイコン・小さな文字までシャープに出る。

3. 多言語テキスト描画の強化 — TechCrunch の記事より:

"Stronger understanding of non-Latin text rendering in languages like Japanese, Korean, Hindi, and Bengali" 日本語の文字を画像内に置く用途（メニュー、ポスター、漫画コマ、インフォグラフィック等）でこれまでより破綻しにくい。

4. "Thinking" モード — 1 リクエスト内で Web 検索を挟む / 1 プロンプト

から複数画像を生成 / 自己検証して品質を上げる、という反復型の生成が組み込まれた。

5. 複数画像の一貫性 — 同じスタイル / キャラ / 構成を保った

シリーズ画像を生成しやすくなった。「Create Everything at Once」表現で、複数アセットを 1 度に整合性を取りつつ作る用途を想定。

6. モデルの知識カットオフ: 2025-12 （TechCrunch より）。

7. OpenAI のコメント:

"Images 2.0 brings an unprecedented level of specificity and fidelity to image creation"

利用条件・プラン

・ChatGPT: 全プラン（Free / Plus / Pro / Team / Enterprise 想定）。ただし有料プランほど高度な出力オプションが使える、と公式が明示。

・API: gpt-image-2 として即日利用可。

・Codex: 同じく即日対応。

価格について（公式: developers.openai.com/api/docs/pricing）

API 課金はトークン単位（per 1M tokens）。Standard と Batch の 2 tier:

項目	Standard	Batch
Image Input	$8.00	$4.00
Cached Image Input	$2.00	$1.00
Image Output	$30.00	$15.00
Text Input	$5.00	$2.50
Cached Text Input	$1.25	$0.625

・Codex 経由でも同一料金（Codex 専用の別 tier はなし）。

・1 枚あたりの実コストは「画像生成ガイド」内の calculator で見積もれます（resolution / "thinking" モード使用で変動）。

・レート制限（RPM / TPM）は本ページには記載なし。組織のレート制限ページで別途確認のこと。

誰にどう効くか

非エンジニア / クリエイター

・日本語混じりの SNS 画像 / バナー / メニューが、文字崩れを抑えてそのまま使えるレベルで出る可能性が高くなった。これまで「画像生成 → 文字部分は別ツールで貼り直し」していた工程を短縮。

・シリーズ画像の安定性 — キャラの絵柄や色味が回ごとに変わってしまう問題が軽減。漫画コマ、説明用イラスト、マニュアル画像などで特に効く。

LP / Web 制作者（[@yoshio_nocode](https://x.com/yoshio_nocode) 事例）

yoshio さんの投稿そのまま引用すると:

「GPT image 2 で画像 LP を爆速制作した、画像の一貫性が高く Nano Banana より圧倒的に良い。input フォームとボタン部分はコーディングで出力し、上下は違和感なく結合。Codex なら image2 での画像生成からコーディングまで一気通貫で出来るし、これを Skill 化して次回以降も完璧に再現できる。」

ポイント:

・画像で見せたい部分（ヒーロー画像、解説図）は gpt-image-2 で生成、フォーム / ボタン / レイアウト部分は Codex がコードで生成、それを上下に結合する LP 制作フローが現実解になっている。

・Codex Skill 化: 一度作ったプロンプト + 生成 + 結合の手順を Skill として保存しておけば、別の LP に同じ品質で再現できる。

開発者

・API として呼べるので、社内ツールに「日本語テキストを正しく載せたバナーを定期生成」「会員 ID 入りのデジタル証書を発行」のようなワークフローを組み込める。

・"thinking" モードはトークン消費が増える可能性がある旨、出ている資料も。自分のワークロードでコスト試算してから本番に乗せるのが安全。

触ってみるには / 注意点

・入口（一番簡単）: ChatGPT のブラウザ / アプリで画像生成 → 画面に日本語混じりのテキストを含む画像を頼む。Free プランでも利用可だが、細かい解像度 / 出力オプションは有料プランの方が広い。

・API で: gpt-image-2 を画像生成エンドポイントに指定。 Codex から呼ぶ場合は Codex 既定の image generation 経路から。

・既存 gpt-image-1 / DALL-E のワークフロー: モデル ID を gpt-image-2 に切り替えるだけで品質が上がる用途は多そう。ただしプロンプトの解釈クセは変わるので、重要なバナーは必ず A/B。

・Nano Banana / DALL-E 3 系との比較: yoshio さんの観測では「Nano Banana より圧倒的に良い」（一貫性面）。客観ベンチマークはまだ少ないので、自分のユースケースで試すのが確実。

・価格: 上記の表が現時点の公式値。Batch tier を使うと半額になるので、非リアルタイム用途（夜間バッチでの大量生成など）は積極的に Batch 化を検討。

・レート制限: 公式 Pricing ページには記載なし。組織のレート制限管理ページで自分の枠を確認。

・コンテンツポリシー: 公式は本記事の確認範囲では明示していませんでしたが、画像生成系は通常通り「実在人物・著作権・成人向け」等のガードがかかる前提で。