モデル更新2026.04.26AI経営実践ラボ編集部

OpenAI が GPT Image 2 を GA — 日本語テキスト描画と複数画像の一貫性が一段強化、Codex で「画像 LP を一気通貫」が現実に

# OpenAI が GPT Image 2 を GA — 日本語テキスト描画と複数画像の一貫性が一段強化、Codex で「画像 LP を一気通貫」が現実に。

GPT Image 25分
AI経営実践ラボ NOTEGPT Image 2AI
GPT Image 2モデル更新記事一覧

この記事の要点

3行で言うと

  • # OpenAI が GPT Image 2 を GA — 日本語テキスト描画と複数画像の一貫性が一段強化、Codex で「画像 LP を一気通貫」が現実に。
  • GPT Image 2のモデル更新として、確認に必要な要点を整理しています。
  • 料金、利用条件、対応プランを社内の運用ルールに合わせて確認してください。
この記事の目次

GPT Image 2 とは

OpenAI の最新世代の 画像生成モデルです。前世代の gpt-image-1 / DALL-E 系の弱点だった「画像内のテキスト(特に日本語などの非ラテン文字)が崩れる」「シリーズ物の絵柄が安定しない」問題を、特に強く改善してきたモデルです。製品名は「ChatGPT Images 2.0」、API での識別子が gpt-image-2

何が変わったか

OpenAI 公式ブログ (Introducing ChatGPT Images 2.0) と TechCrunch の取材記事からまとめます。

1. GA 開始: 2026-04-22(前日 4-21 発表)。ChatGPT 全プランの利用者

と Codex ユーザに即日提供。有料プランは出力オプションが豊富

2. 2K 解像度 — UI 部品・アイコン・小さな文字までシャープに出る。

3. 多言語テキスト描画の強化 — TechCrunch の記事より:

"Stronger understanding of non-Latin text rendering in languages like Japanese, Korean, Hindi, and Bengali" 日本語の文字を画像内に置く用途(メニュー、ポスター、漫画コマ、インフォグラフィック等)でこれまでより破綻しにくい。

4. "Thinking" モード — 1 リクエスト内で Web 検索を挟む / 1 プロンプト

から複数画像を生成 / 自己検証して品質を上げる、という反復型の生成が組み込まれた。

5. 複数画像の一貫性 — 同じスタイル / キャラ / 構成を保った

シリーズ画像を生成しやすくなった。「Create Everything at Once」表現で、複数アセットを 1 度に整合性を取りつつ作る用途を想定。

6. モデルの知識カットオフ: 2025-12 (TechCrunch より)。

7. OpenAI のコメント:

"Images 2.0 brings an unprecedented level of specificity and fidelity to image creation"

利用条件・プラン

ChatGPT: 全プラン(Free / Plus / Pro / Team / Enterprise 想定)。ただし 有料プランほど高度な出力オプション が使える、と公式が明示。

API: gpt-image-2 として即日利用可。

Codex: 同じく即日対応。

価格について(公式: developers.openai.com/api/docs/pricing)

API 課金は トークン単位(per 1M tokens)。Standard と Batch の 2 tier:

項目StandardBatch
Image Input$8.00$4.00
Cached Image Input$2.00$1.00
Image Output$30.00$15.00
Text Input$5.00$2.50
Cached Text Input$1.25$0.625

・Codex 経由でも 同一料金(Codex 専用の別 tier はなし)。

・1 枚あたりの実コストは「画像生成ガイド」内の calculator で見積もれます(resolution / "thinking" モード使用で変動)。

・レート制限(RPM / TPM)は本ページには記載なし。組織のレート制限ページで別途確認のこと。

誰にどう効くか

非エンジニア / クリエイター

日本語混じりの SNS 画像 / バナー / メニュー が、文字崩れを抑えてそのまま使えるレベルで出る可能性が高くなった。これまで「画像生成 → 文字部分は別ツールで貼り直し」していた工程を短縮。

シリーズ画像の安定性 — キャラの絵柄や色味が回ごとに変わってしまう問題が軽減。漫画コマ、説明用イラスト、マニュアル画像などで特に効く。

LP / Web 制作者([@yoshio_nocode](https://x.com/yoshio_nocode) 事例)

yoshio さんの投稿そのまま引用すると:

「GPT image 2 で画像 LP を爆速制作した、画像の一貫性が高く Nano Banana より圧倒的に良い。input フォームとボタン部分はコーディングで出力し、上下は違和感なく結合。Codex なら image2 での画像生成からコーディングまで一気通貫で出来るし、これを Skill 化して次回以降も完璧に再現できる。

ポイント:

画像で見せたい部分(ヒーロー画像、解説図)は gpt-image-2 で生成、フォーム / ボタン / レイアウト部分は Codex がコードで生成、それを上下に結合する LP 制作フローが現実解になっている。

Codex Skill 化: 一度作ったプロンプト + 生成 + 結合の手順を Skill として保存しておけば、別の LP に同じ品質で再現できる。

開発者

・API として呼べるので、社内ツールに「日本語テキストを正しく載せたバナーを定期生成」「会員 ID 入りのデジタル証書を発行」のようなワークフローを組み込める。

・"thinking" モードはトークン消費が増える可能性がある旨、出ている資料も。自分のワークロードでコスト試算してから本番に乗せるのが安全。

触ってみるには / 注意点

入口(一番簡単): ChatGPT のブラウザ / アプリで画像生成 → 画面に日本語混じりのテキストを含む画像を頼む。Free プランでも利用可だが、細かい解像度 / 出力オプションは有料プランの方が広い。

API で: gpt-image-2 を画像生成エンドポイントに指定。 Codex から呼ぶ場合は Codex 既定の image generation 経路から。

既存 gpt-image-1 / DALL-E のワークフロー: モデル ID を gpt-image-2 に切り替えるだけで品質が上がる用途は多そう。ただしプロンプトの解釈クセは変わるので、重要なバナーは必ず A/B

Nano Banana / DALL-E 3 系との比較: yoshio さんの観測では「Nano Banana より圧倒的に良い」(一貫性面)。客観ベンチマークはまだ少ないので、自分のユースケースで試すのが確実。

価格: 上記の表が現時点の公式値。Batch tier を使うと半額になるので、非リアルタイム用途(夜間バッチでの大量生成など)は積極的に Batch 化を検討。

レート制限: 公式 Pricing ページには記載なし。組織のレート制限管理ページで自分の枠を確認。

コンテンツポリシー: 公式は本記事の確認範囲では明示していませんでしたが、画像生成系は通常通り「実在人物・著作権・成人向け」等のガードがかかる前提で。

関連リンク

・公式ブログ: <https://openai.com/index/introducing-chatgpt-images-2-0>

・開発者コミュニティ告知: <https://community.openai.com/t/introducing-gpt-image-2-available-today-in-the-api-and-codex/1379479>

・TechCrunch 取材: <https://techcrunch.com/2026/04/21/chatgpts-new-images-2-0-model-is-surprisingly-good-at-generating-text>

・実用事例 (@yoshio_nocode — Codex で画像 LP): <https://x.com/yoshio_nocode/status/2046948597732880769>

・API Pricing 詳細 (gpt-image-2 含む): <https://developers.openai.com/api/docs/pricing>

_Status: accepted (approved 2026-04-26T14:36Z by yahiro)._

タグ(0件):タグ未設定
もっと見る