
gpt-image-2 でブログ・SNS 画像を量産する実践ガイド — Sales Claw が毎週やっている「ホワイトボード説明図」の作り方を一般読者向けに公開
gpt-image-2 は OpenAI が2026-04-21に出した「描く前に考える」第3世代画像 AI。1024×1024 medium で約 $0.05/枚、日本語含む99% 文字精度、最大16枚の参考画像、2K 出力対応。ChatGPT / API / Codex CLI の3ルートで呼べる。Sales Claw のブログ画像はこのモデルで月100枚規模を量産。本記事は「何ができて、何が落とし穴か」「1枚目をどう作るか」を一般読者向けに整理。

中澤 圭志
@keishi_nakazawaSales Claw 開発者

Key Facts
発表日 / 提供開始
2026-04-21 発表 / 4-22 ChatGPT / 5月上旬 API・Codex 一般公開
料金 (1024×1024)
low $0.006 / medium $0.053 / high $0.211 (per image)
主要新機能 (4本柱)
99% 文字精度 / 描画前推論 / 16枚参考画像 / 100+ オブジェクト
呼び出しルート
ChatGPT (Plus〜) / API (images.generate) / Codex CLI (image_generation)
「ブログのアイキャッチを毎回作るのがしんどい」「画像 AI は試したけど、 テキストが崩れて使い物にならなかった」「Midjourney と DALL-E と gpt-image どれを使えばいいの?」 「Codex CLI から画像を生成できるって本当?」—— 本記事では、OpenAI が 2026-04-21 に出した gpt-image-2 を一次情報ベースで 整理し、Sales Claw が このブログの全カバー画像・本文説明図を量産している実運用ノウハウを 一般読者向けに公開します。プロンプトテンプレ、料金試算、よくある事故、3 ルートの使い分け まで全部つなげます。
本記事は OpenAI 公式 Newsroom (gpt-image-2 発表)・OpenAI Developer Community 公式スレッド・ OpenAI Codex CLI Features ページ・OpenAI API Pricing ページを一次情報として参照しています。 Codex CLI そのものは Codex CLI と Claude Code の横断比較 を、Sales Claw が並走させている AI 開発環境は GitHub Copilot 2026 年版の解説 を、ブラウザ × AI で画像をどう使うかは ChatGPT Atlas の一般読者向け解説 を、AI に環境を渡す MCP の仕組みは MCP 完全ガイド を併読してください。
1. gpt-image-2 とは — 「描く前に考える」画像 AI が 2026 年に来た

gpt-image-2 (ジーピーティー・イメージ・ツー) は、OpenAI が 2026 年 4 月 21 日に発表した画像生成モデルです。発表ブログでは 「the first true Agentic image generation model」と紹介されており、「描く前に構図とレイアウトを推論する段階を持つ」のがコアの新機能。
身近な比喩で説明すると、従来の画像 AI は「いきなりキャンバスに筆を入れる絵描き」でした。 頭の中で構図を整理する前にピクセルを生成するため、「文字が枠からはみ出る」「左右が逆」 「左ゾーンの要素が 5 個と書いたのに 3 個しか描けていない」などの事故が日常茶飯事でした。 gpt-image-2 は 「まず鉛筆でラフを引き、レイアウトを検証してから本書きする絵描き」に 近い動きをします。これによって、ビジネス用途で求められる「正確さ」が一段上がりました。
翻訳すると 【公式発表】 「本日より、開発者は gpt-image-2 を API および Codex で利用できます。 構図を描画前に計画できる、初の native reasoning を持つ画像モデルです」。 この「描画前に推論する」が、後述する Sales Claw のホワイトボード説明図量産で 鍵になります。
2. 2026-05 時点で何ができるのか — 4 つの新機能と従来比

OpenAI 公式・Developer Community・dev.to の技術解説を統合すると、gpt-image-2 の 新機能は 4 本柱に整理できます。
| 機能 | 前世代 (1.5) | gpt-image-2 (2026-04) |
|---|---|---|
| 多言語の文字精度 | 英語 90% / 日本語 70-80% | 英語 99% / 日本語含む 99% (どの文字体系でも) |
| 描く前の推論 | なし (即生成) | あり (構図・レイアウト・矛盾チェック) |
| マルチターン編集 | 人物・小物が崩れがち | 文脈を保持して連続編集できる |
| 1 シーン内のオブジェクト数 | 実用上 30-50 個が上限 | 100+ 個まで対応 |
| 対応解像度 | 1024 / 1536 | 1024 / 1536 / 2048 (2K) / 一部 4K |
| 参考画像入力 | 1-3 枚 | 最大 16 枚 |
3. 料金の現実 — 1 枚いくら? 月いくら? のリアルな試算
gpt-image-2 の料金は 「トークン課金」です。OpenAI 公式の API Pricing ページに 以下の単価が掲載されています:
| 項目 | 単価 (USD / 1M tokens) |
|---|---|
| 画像入力 (参考画像のトークン化) | $8.00 |
| キャッシュ済み画像入力 | $2.00 |
| 画像出力 | $30.00 |
| テキスト入力 (プロンプト) | $5.00 |
【公式発表】 OpenAI 公式のコスト計算ツールに基づくと、 1024×1024 1 枚あたりの実コストは:
| 品質 | 1 枚あたり (USD) | 100 枚あたり (USD) | 日本円 (1ドル=155円) |
|---|---|---|---|
| low | $0.006 | $0.6 | 約 93 円 / 100 枚 |
| medium | $0.053 | $5.3 | 約 822 円 / 100 枚 |
| high | $0.211 | $21.1 | 約 3,271 円 / 100 枚 |
4. 呼び出し方の 3 ルート — ChatGPT / API / Codex CLI の使い分け

gpt-image-2 は 3 つのルートから呼べます。それぞれの向き不向きを整理します。
4-1. ChatGPT (Plus / Team / Pro / Enterprise) — 1 枚目を試すならここ
ブラウザの ChatGPT に 「○○の画像を作って」と書くだけ。2026-04-22 から Plus 以上のユーザーが gpt-image-2 をデフォルトで使えるように なりました。プログラミング不要・即時プレビュー・チャット内で修正指示が出せる、と最も手軽。 Sales Claw でも 「1 枚目のプロンプト試行錯誤」「クライアント MTG 中のラフ作成」は ChatGPT を使っています。
4-2. API (Images API / Responses API) — 量産・バッチならここ
OpenAI Python SDK / Node SDK で client.images.generate(model="gpt-image-2", prompt=...)を叩く方式。すべてプログラム制御で、バッチ生成・ファイル名自動付与・ メタデータ DB 保存・後段の自動検査 (PNG マジックバイト確認等) まで全部できます。月数十枚以上の量産・本番運用は API 一択。
4-3. Codex CLI (image_generation tool) — Sales Claw が選んだルート
OpenAI が出している Codex CLI には、2026-04-21 からimage_generation という組み込みツールが搭載されています。 ターミナルから codex exec ... "画像を生成して" と書くと、 Codex が裏で gpt-image-2 を呼んで ~/.codex/generated_images/ に PNG を保存します。Codex プランの月間枠を消費するので、API 単体課金よりも会計が単純。
| 用途 | 推奨ルート | 理由 |
|---|---|---|
| 今日 1 枚試したい | ChatGPT | ブラウザだけで完結、即フィードバック |
| プロンプト試行錯誤 (10-30 枚) | ChatGPT or Codex | 修正指示しやすい、バージョン管理しやすい |
| 月 30 枚以上の量産 | API or Codex CLI | スクリプト化、ファイル名・メタデータ管理 |
| CI に組み込んで本番運用 | API | 権限管理・コスト管理・エラーハンドリングが堅牢 |
| Codex Plan を契約済みのチーム | Codex CLI | プラン枠を消費するので会計がシンプル |
5. Sales Claw のプロンプト設計 — 3 系統に固定する
gpt-image-2 の品質は プロンプトの「型」で決まります。Sales Claw では ブログ画像を 3 系統に固定することで品質を安定させています。
5-1. 中密度ホワイトボード説明図 (アイキャッチ用)
記事冒頭のカバー画像はこれ。タイトル + サブタイトル + 中央メタファー + 左右ゾーン 2 個 (各 3-5 要素) + 黄色付箋ハイライト 1 個で構成します。3 秒眺めれば全体像が 掴める密度感を目指します。
5-2. 高密度ホワイトボード説明図 (本文用)
本文中の説明画像はこれ。番号付き 3 ステージ / 比較表 / 要点フロー / 付箋多数を 詰め込んで、じっくり読めば全部わかる密度感を目指します。アイキャッチより情報密度が高い。
5-3. 黒板 + 手描き風 (重め / 玄人向け)
ポストモーテム記事や技術深掘り記事で使用。黒板 + チョーク + 暖色強調 1 色の組み合わせで、ホワイトボード版より「重み」を出します。一般読者向け記事では 基本使いません。
6. はじめる手順 — ふつうの人が今日 1 枚作るまでの 3 ステップ


gpt-image-2 を 今日 1 枚試したい場合の最短ルートは ChatGPT です。
- Step 1: ChatGPT Plus ($20/月) にログイン。 Free プランでも一部利用可能ですが、回数制限がきついので Plus が現実的。 法人なら Team ($25/seat/月)、開発者なら API 課金 ($0.05/枚〜) で十分。
- Step 2: プロンプトを入れる。 上記 5 ブロック (Concept / Layout / Style / Constraints / Output) で。 初回はテンプレ通り、慣れたら省略して大丈夫です。
- Step 3: 修正指示を出す。 チャット内で「左ゾーンに『監査ログ』を追加して」「黄色付箋の文言を『2026 年版』に変えて」 のように具体的に。「もっと良くして」「やり直して」は禁句です (意図が伝わらない)。
7. リスクと注意点 — 商標安全 / 著作権 / SVG 偽 PNG 事故

7-1. 商標安全 — 公式アイコンの「正確再現」は NG
Claude Code の Asterisk アイコン、Codex のロゴ、GPT のアイコンなどを正確に再現させると、商標権・パブリシティ問題のリスクがあります。 Sales Claw では 「Constraints: 公式ロゴ・商標・アプリアイコンを正確に再現しない」を 毎回プロンプトに入れることで、editorial illustration として安全に運用しています。
7-2. 著作権 — 商用利用は基本 OK だが念のため確認
OpenAI の利用規約上、API 経由で生成した画像の権利は利用者に帰属します。 ただし生成プロセスが学習データに引きずられて 既存著作物に酷似するリスクは ゼロではないので、商用利用前に 逆画像検索で類似品が無いか確認する一手間を 推奨します。【未確認】 日本の著作権法上の取り扱いは判例蓄積中で、 最終判断は専門家に確認してください。
7-3. SVG 偽 PNG 事故 — Codex CLI 旧版の罠
Sales Claw が 実際に踏んだ事故。codex 0.118 + -m gpt-5.4を指定すると、テキストモデルにフォールバックして SVG コードが生成され、 それを sharp ライブラリで PNG にラスタライズした「偽 PNG」が成果物になっていました。 手描き風が「コードで描いた SVG」感丸出しになり、ブログのトーンを壊しました。
7-4. 文字崩れ (旧モデル比改善)
前世代 gpt-image-1.5 では日本語の文字崩れ率が約 35% でしたが、gpt-image-2 では事実上 0%に。ただし長文 (50 字超)や細かいフォントでは まだ崩れることがあるので、画像内テキストは 1 タイトル + 1 サブタイトル + ラベル数個に 留めるのが安全です。
7-5. コスト膨張 (再生成ループ)
1 枚 $0.05 でも、再生成 10 回繰り返せば $0.5。月 32 枚 × 5 回再生成で $8 (約 1,240 円)。 個人なら無視できますが、CI / 自動化に組み込む場合は 「再生成回数の上限」を スクリプトで明示しておくのが安全。Sales Claw の wrapper は 1 枚あたり最大 1 回試行に 固定しています (失敗したら人間が確認)。
8. 業務利用と Sales Claw 文脈 — ブログ・SNS 量産に組み込む現実解

Sales Claw の現実解を全公開します。このブログの全画像 (約 100 枚以上) は 以下のワークフローで生成しています。
| ステップ | 所要時間 | 使うツール |
|---|---|---|
| 構成設計 (H2 と画像の対応決め) | 10 分 | 手書きメモ or Notion |
| プロンプト 4 本書く | 5 分 | 5 ブロックテンプレを流用 |
| cover 生成 (gpt-image-2 medium) | 3 分 | npm run blog:image-gen --kind cover |
| body-1 / body-2 / body-3 生成 (各 3 分) | 9 分 | npm run blog:image-gen --kind body-N |
| Python 図解 3 枚 (matplotlib) | 5 分 | scripts/blog-diagrams/<slug>.py |
| 検査 (PNG マジックバイト + ファイルサイズ) | 2 分 | wrapper script の自動検査 |
| 合計 | 約 34 分 / 7 枚 | — |
営業文脈での応用: Sales Claw 本体は問い合わせフォーム営業の自動化ツールですが、 gpt-image-2 でブログ・SNS の画像コストが下がったことで、「コンテンツ営業 (ブログ → 記事化 → SNS → リード獲得)」の単価そのものが下がりました。 AI による画像生成は 「営業組織のマーケティング担当業務を圧縮する」方向で 現実的に効きます。「営業 AI」と並行して「マーケ AI」を導入する流れが 2026 年の現在地です。
【著者見解】 2026 年下半期は 「gpt-image-2 経由で画像コストがゼロに近づいた前提で、 ブログと SNS の出稿頻度をどこまで上げられるか」が中小チームの差別化要因に なると考えています。Sales Claw も 週 5 記事 → 週 8-10 記事への増産を 画像生成コスト面では既に達成しており、ボトルネックは「画像」から「企画と一次情報の確認」に 移りました。読者の方も、ぜひ自分のブログ・LP・SNS で gpt-image-2 を試してみてください。
よくある質問
gpt-image-2 とは何ですか?
1枚いくらかかりますか?
ChatGPT / API / Codex CLI のどれを使えばいいですか?
Codex CLI で gpt-image-2 を呼ぶときの注意点は?
プロンプトはどう書けばいいですか?
日本語の文字は正しく描けますか?
商用利用しても大丈夫ですか?
営業や業務にどう活かせますか?
参考文献
本記事は X 公式アカウントと公式ドキュメントを一次情報として参照しています。
- [01]
- [02]OpenAI Codex CLI — Features (公式 Docs)2026-05-17
- [03]OpenAI API — Pricing (公式)2026-05-17
- [04]
- [05]
- [06]
- [07]
- [08]


