ツール解説gpt-image-2

gpt-image-2 でブログ・SNS 画像を量産する実践ガイド — Sales Claw が毎週やっている「ホワイトボード説明図」の作り方を一般読者向けに公開

gpt-image-2 は OpenAI が2026-04-21に出した「描く前に考える」第3世代画像 AI。1024×1024 medium で約 $0.05/枚、日本語含む99% 文字精度、最大16枚の参考画像、2K 出力対応。ChatGPT / API / Codex CLI の3ルートで呼べる。Sales Claw のブログ画像はこのモデルで月100枚規模を量産。本記事は「何ができて、何が落とし穴か」「1枚目をどう作るか」を一般読者向けに整理。

中澤圭志

@keishi_nakazawa

Sales Claw 開発者

2026年5月17日·12 分

gpt-image-2 でブログ・SNS 画像を量産する実践ガイド — Sales Claw が毎週やっている「ホワイトボード説明図」の作り方を一般読者向けに公開

Key Facts

発表日 / 提供開始

2026-04-21 発表 / 4-22 ChatGPT / 5月上旬 API・Codex 一般公開

料金 (1024×1024)

low $0.006 / medium $0.053 / high $0.211 (per image)

主要新機能 (4本柱)

99% 文字精度 / 描画前推論 / 16枚参考画像 / 100+ オブジェクト

呼び出しルート

ChatGPT (Plus〜) / API (images.generate) / Codex CLI (image_generation)

DATA— まず前提（聞きなれない言葉を 30 秒で整理）

gpt-image-2: OpenAI が 2026-04-21 に発表した第 3 世代画像生成モデル。前世代 gpt-image-1 (2025-04) / gpt-image-1.5 (2025-12) の後継で、初めて「描く前に推論する」O 系思考を画像生成に持ち込んだモデル。
O 系推論 / Agentic 画像生成: いきなりピクセルを生成せず、構図・レイアウト・配置・矛盾チェックを先に「考える」段階を挟む方式。「文字が枠からはみ出る」「左右が逆」のような事故が大幅に減る。
Codex CLI: OpenAI が出している ターミナル用 AI コーディングツール。 2026-04-21 から image_generation という組み込みツールを持っていて、ターミナルから "絵を描いて" と書くだけで gpt-image-2 を呼べる。
image_generation tool: Codex CLI / Responses API が公式に持つ「画像生成専用のツール呼び出し」機能。テキストモデルに SVG を書かせるのとは別物で、これを呼ばないと 本物のラスター画像にならない。
ホワイトボード説明図: Sales Claw のブログで実運用している固定スタイル。先生がホワイトボードに手書きしているように、タイトル + 中央メタファー + 左右ゾーン + 黄色付箋 1 個で構成する。

「ブログのアイキャッチを毎回作るのがしんどい」「画像 AI は試したけど、テキストが崩れて使い物にならなかった」「Midjourney と DALL-E と gpt-image どれを使えばいいの？」「Codex CLI から画像を生成できるって本当？」—— 本記事では、OpenAI が 2026-04-21 に出した gpt-image-2 を一次情報ベースで整理し、Sales Claw が このブログの全カバー画像・本文説明図を量産している実運用ノウハウを一般読者向けに公開します。プロンプトテンプレ、料金試算、よくある事故、3 ルートの使い分けまで全部つなげます。

本記事は OpenAI 公式 Newsroom (gpt-image-2 発表)・OpenAI Developer Community 公式スレッド・ OpenAI Codex CLI Features ページ・OpenAI API Pricing ページを一次情報として参照しています。 Codex CLI そのものは Codex CLI と Claude Code の横断比較を、Sales Claw が並走させている AI 開発環境は GitHub Copilot 2026 年版の解説を、ブラウザ × AI で画像をどう使うかは ChatGPT Atlas の一般読者向け解説を、AI に環境を渡す MCP の仕組みは MCP 完全ガイドを併読してください。

WARNING— 免責事項 / 法的な注意点

本記事は 2026-05-17 時点の公式情報をもとに整理した解説であり、法律・契約上の 最終判断は専門家に相談してください。特に下記の領域は状況によって個別判断が必要です:

著作権・パブリシティ権: AI 生成画像の商用利用について、たとえば「公式アイコンを模倣する」用途は最高裁判例が固まっていません
個人情報・顔画像: 実在人物の顔を生成する場合は本人同意・パブリシティ権・肖像権の整理が必要
営業 / マーケ用途: 同じ画像を BtoB の問い合わせフォームから送るときは 特定電子メール法・CAPTCHA 検出時の停止・送信頻度制限・オプトアウト導線・監査ログ保存などのコンプライアンス要件もセットで整える必要があります (詳細は Sales Claw の運用ノートを参照)
提供条件の変更: API 価格・モデル仕様は OpenAI 側で随時更新されるため、本番運用前に公式 Pricing ページを再確認してください

1. gpt-image-2 とは — 「描く前に考える」画像 AI が 2026 年に来た

gpt-image-2 を中央に置いた中密度ホワイトボード説明図。タイトル「gpt-image-2 でブログ画像を量産する」サブタイトル「描く前に考える画像 AI の使いどころ」。中央に大きな視覚メタファー「思考の脳と絵筆を繋いだ装置」。左ゾーン「インプット」(プロンプト / 参考画像 16 枚 / スタイル指示 / 言語) と右ゾーン「アウトプット」(2K 画像 / 99% 文字精度 / 100+ オブジェクト / 任意スタイル)。中央下に黄色付箋ハイライト「ChatGPT / API / Codex CLI の 3 ルートで呼べる」。 — 図: gpt-image-2 を 1 枚で俯瞰 — インプット 4 軸 × アウトプット 4 軸 × 3 つの呼び出しルート (中密度ホワイトボード説明図)

gpt-image-2 (ジーピーティー・イメージ・ツー) は、OpenAI が 2026 年 4 月 21 日に発表した画像生成モデルです。発表ブログでは「the first true Agentic image generation model」と紹介されており、「描く前に構図とレイアウトを推論する段階を持つ」のがコアの新機能。

身近な比喩で説明すると、従来の画像 AI は「いきなりキャンバスに筆を入れる絵描き」でした。頭の中で構図を整理する前にピクセルを生成するため、「文字が枠からはみ出る」「左右が逆」「左ゾーンの要素が 5 個と書いたのに 3 個しか描けていない」などの事故が日常茶飯事でした。 gpt-image-2 は 「まず鉛筆でラフを引き、レイアウトを検証してから本書きする絵描き」に近い動きをします。これによって、ビジネス用途で求められる「正確さ」が一段上がりました。

翻訳すると 【公式発表】 「本日より、開発者は gpt-image-2 を API および Codex で利用できます。構図を描画前に計画できる、初の native reasoning を持つ画像モデルです」。この「描画前に推論する」が、後述する Sales Claw のホワイトボード説明図量産で鍵になります。

2. 2026-05 時点で何ができるのか — 4 つの新機能と従来比

gpt-image-2 の 4 つの新機能を並べた高密度ホワイトボード説明図。番号付きで (1) 多言語 99% 文字精度 (日本語/英語/アラビア語/中国語の例)、(2) 描画前推論 (構図ラフ → 検証 → 本書きの 3 段階)、(3) コンテキスト維持マルチターン編集 (1 枚目 → 2 枚目 → 3 枚目で人物・背景・小物が保たれる)、(4) 100+ オブジェクト & 任意スタイル (浮世絵/水彩/ピクセルアートの例) を図示。下部に従来モデルとの比較表「文字精度: 80% → 99% / 推論: なし → あり / 参考画像: 1-3 枚 → 16 枚 / 解像度: 1K → 2K」。 — 図: gpt-image-2 の 4 つの新機能と従来比 (高密度ホワイトボード説明図)

OpenAI 公式・Developer Community・dev.to の技術解説を統合すると、gpt-image-2 の新機能は 4 本柱に整理できます。

gpt-image-2 の 4 つの新機能 (vs 前世代 gpt-image-1.5)
機能	前世代 (1.5)	gpt-image-2 (2026-04)
多言語の文字精度	英語 90% / 日本語 70-80%	英語 99% / 日本語含む 99% (どの文字体系でも)
描く前の推論	なし (即生成)	あり (構図・レイアウト・矛盾チェック)
マルチターン編集	人物・小物が崩れがち	文脈を保持して連続編集できる
1 シーン内のオブジェクト数	実用上 30-50 個が上限	100+ 個まで対応
対応解像度	1024 / 1536	1024 / 1536 / 2048 (2K) / 一部 4K
参考画像入力	1-3 枚	最大 16 枚

INSIGHT— ブログ用途で一番効いたのは「文字精度」

【自社検証メモ】 Sales Claw は 2025-12 〜 2026-05 にかけて gpt-image-1.5 で約 80 枚のブログ画像を生成しましたが、そのうち 約 35% で日本語タイトル・ラベルが崩れた状態 (「営業」が「営美」になる等) で再生成に時間を取られていました。2026-05 に gpt-image-2 へ切り替えてから 14 枚生成し、文字崩れによる再生成は 0 件。再生成コストが 1/3 以下になった実感があります。ただしサンプル数 14 枚は少なく、長期では再評価が必要です。

検証条件: 1024×1024 medium quality / 日本語タイトル + 英字コマンド名混在 / Sales Claw ブログ用
期間: 2025-12 〜 2026-05 (gpt-image-1.5) / 2026-05 (gpt-image-2)
サンプル数: 1.5 で 80 枚、2 で 14 枚
観察: 文字崩れ率 35% → 0%、推論時間 +3〜5 秒、出力サイズ約 1.5 倍
限界: 14 枚は小さい / プロンプト書き方も同時に改善したので寄与分は分解できない

3. 料金の現実 — 1 枚いくら? 月いくら? のリアルな試算

gpt-image-2 の料金は 「トークン課金」です。OpenAI 公式の API Pricing ページに以下の単価が掲載されています:

gpt-image-2 の単価 (OpenAI 公式 API Pricing 2026-05 時点)
項目	単価 (USD / 1M tokens)
画像入力 (参考画像のトークン化)	$8.00
キャッシュ済み画像入力	$2.00
画像出力	$30.00
テキスト入力 (プロンプト)	$5.00

【公式発表】 OpenAI 公式のコスト計算ツールに基づくと、 1024×1024 1 枚あたりの実コストは:

1 枚あたりのコスト目安 (1024×1024、テキストプロンプトのみ)
品質	1 枚あたり (USD)	100 枚あたり (USD)	日本円 (1ドル=155円)
low	$0.006	$0.6	約 93 円 / 100 枚
medium	$0.053	$5.3	約 822 円 / 100 枚
high	$0.211	$21.1	約 3,271 円 / 100 枚

4. 呼び出し方の 3 ルート — ChatGPT / API / Codex CLI の使い分け

gpt-image-2 を呼ぶ 3 つのルートを並べた高密度ホワイトボード説明図。中央上に「gpt-image-2 を呼ぶ 3 ルート」。3 列構成: 左「ChatGPT (Plus/Team/Pro/Enterprise)」(ブラウザでチャット入力 / 1 枚ずつ手作業 / $20〜/月 / 1 枚目に最適)、中央「API (Responses API / Images API)」(images.generate() / フルプログラマブル / 1 枚 $0.05〜 / 量産・バッチに最適)、右「Codex CLI (image_generation tool)」(ターミナルから自然言語 / Codex プラン消費 / wrapper 経由必須 / Sales Claw 推奨ルート)。下部の矢印で「1 枚 → 数枚: ChatGPT / 数十枚 → 数百枚: API or Codex / プロンプト試行錯誤: Codex」と用途別の選び方フロー。 — 図: gpt-image-2 を呼ぶ 3 ルートと用途別の選び方 (高密度ホワイトボード説明図)

gpt-image-2 は 3 つのルートから呼べます。それぞれの向き不向きを整理します。

4-1. ChatGPT (Plus / Team / Pro / Enterprise) — 1 枚目を試すならここ

ブラウザの ChatGPT に 「○○の画像を作って」と書くだけ。2026-04-22 から Plus 以上のユーザーが gpt-image-2 をデフォルトで使えるようになりました。プログラミング不要・即時プレビュー・チャット内で修正指示が出せる、と最も手軽。 Sales Claw でも 「1 枚目のプロンプト試行錯誤」「クライアント MTG 中のラフ作成」は ChatGPT を使っています。

4-2. API (Images API / Responses API) — 量産・バッチならここ

OpenAI Python SDK / Node SDK で client.images.generate(model="gpt-image-2", prompt=...)を叩く方式。すべてプログラム制御で、バッチ生成・ファイル名自動付与・メタデータ DB 保存・後段の自動検査 (PNG マジックバイト確認等) まで全部できます。月数十枚以上の量産・本番運用は API 一択。

4-3. Codex CLI (image_generation tool) — Sales Claw が選んだルート

OpenAI が出している Codex CLI には、2026-04-21 からimage_generation という組み込みツールが搭載されています。ターミナルから codex exec ... "画像を生成して" と書くと、 Codex が裏で gpt-image-2 を呼んで ~/.codex/generated_images/ に PNG を保存します。Codex プランの月間枠を消費するので、API 単体課金よりも会計が単純。

WARNING— 🛑 Codex CLI で gpt-image-2 を呼ぶときの絶対条件

ターミナル直叩きは 事故の温床です。Sales Claw では過去にcodex 0.118 + -m gpt-5.4 指定でテキストモデルにフォールバックし、 SVG コードを書かれて sharp でラスタライズした「偽 PNG」を公開してしまった事故がありました。再発防止のため、以下の wrapper script (npm run blog:image-gen) 経由を必須化しています。

codex CLI のバージョンは 0.130.0 以上 (gpt-5.5 系で image_generation が呼べる)
-m フラグは絶対に渡さない (デフォルトモデルで OK)
--enable image_generation を必ず付ける
--dangerously-bypass-approvals-and-sandbox を付ける (Windows sandbox 回避)
プロンプト先頭に 「Generate a real raster image. Do NOT write SVG.」を強制注入
生成後にファイルサイズ ≥ 500 KB / 解像度 ≥ 1024×576 / PNG マジックバイトを検査
検査失敗なら exit 1 で止める (偽 PNG の公開を防ぐ)

3 ルートの使い分け
用途	推奨ルート	理由
今日 1 枚試したい	ChatGPT	ブラウザだけで完結、即フィードバック
プロンプト試行錯誤 (10-30 枚)	ChatGPT or Codex	修正指示しやすい、バージョン管理しやすい
月 30 枚以上の量産	API or Codex CLI	スクリプト化、ファイル名・メタデータ管理
CI に組み込んで本番運用	API	権限管理・コスト管理・エラーハンドリングが堅牢
Codex Plan を契約済みのチーム	Codex CLI	プラン枠を消費するので会計がシンプル

5. Sales Claw のプロンプト設計 — 3 系統に固定する

gpt-image-2 の品質は プロンプトの「型」で決まります。Sales Claw ではブログ画像を 3 系統に固定することで品質を安定させています。

5-1. 中密度ホワイトボード説明図 (アイキャッチ用)

記事冒頭のカバー画像はこれ。タイトル + サブタイトル + 中央メタファー + 左右ゾーン 2 個 (各 3-5 要素) + 黄色付箋ハイライト 1 個で構成します。3 秒眺めれば全体像が掴める密度感を目指します。

DATA— 中密度ホワイトボード説明図のプロンプトテンプレ

Concept: 中密度ホワイトボード説明図。テーマは「<記事の 1 行サマリ>」。
Layout:
  - タイトル: 太字日本語 2 段 (タイトル + サブタイトル)
  - 中央: 視覚メタファー 1 つ (USB-C / 橋 / 配管 / 装置 など)
  - 左ゾーン: 名前付き要素 3-5 個 (ラベル付き)
  - 右ゾーン: 名前付き要素 3-5 個 (ラベル付き)
  - 中央下: 黄色付箋ハイライト 1 個 (核心メッセージ)
Style: 先生がホワイトボードに手で描いて説明している瞬間。
        フリーハンドの線、わずかに歪んだ図形、見出しは太字くっきり。
Language: 画像内のテキストはすべて日本語 (固有名詞・コマンド名のみ英字 OK)。
Constraints:
  - 公式ロゴ・商標・アプリアイコンを正確に再現しない
  - Sales Claw editorial illustration である
  - 数値・グラフは含めない (それは Python 担当)
Output: 1024×1024 PNG, real raster image (not SVG).

5-2. 高密度ホワイトボード説明図 (本文用)

本文中の説明画像はこれ。番号付き 3 ステージ / 比較表 / 要点フロー / 付箋多数を詰め込んで、じっくり読めば全部わかる密度感を目指します。アイキャッチより情報密度が高い。

5-3. 黒板 + 手描き風 (重め / 玄人向け)

ポストモーテム記事や技術深掘り記事で使用。黒板 + チョーク + 暖色強調 1 色の組み合わせで、ホワイトボード版より「重み」を出します。一般読者向け記事では基本使いません。

6. はじめる手順 — ふつうの人が今日 1 枚作るまでの 3 ステップ

gpt-image-2 で今日 1 枚作るための 3 ステップを並べた高密度ホワイトボード説明図。番号付きステージで Step 1「ChatGPT Plus にログイン (or 既存契約を確認、$20/月)」、Step 2「『○○の中密度ホワイトボード説明図を作って』とプロンプト入力」(プロンプト 5 ブロックの例も添える)、Step 3「気に入らない箇所をチャットで修正指示 (『左ゾーンに『監査ログ』を追加して』など)」。下部に「上達のコツ」黄色付箋 3 個: (1) 1 枚目から完璧を狙わない、(2) 修正指示は具体的に、(3) プロンプトを資産化する。 — 図: 今日 1 枚作るための 3 ステップ (高密度ホワイトボード説明図)

gpt-image-2 リリースタイムライン。横軸 2025-04 〜 2026-05、縦軸モデル世代。2025-04-23 gpt-image-1 リリース、2025-12-08 gpt-image-1.5 リリース、2026-04-21 gpt-image-2 発表 (API/Codex 同時開放)、2026-04-22 ChatGPT 一般展開、2026-05 上旬 API 開発者向け一般公開、というマイルストーンが時系列に並ぶ折れ線グラフ。 — 図: gpt-image-2 までの 12 ヶ月 — OpenAI 画像生成モデルの進化タイムライン (Python 図解)

gpt-image-2 を 今日 1 枚試したい場合の最短ルートは ChatGPT です。

Step 1: ChatGPT Plus ($20/月) にログイン。 Free プランでも一部利用可能ですが、回数制限がきついので Plus が現実的。法人なら Team ($25/seat/月)、開発者なら API 課金 ($0.05/枚〜) で十分。
Step 2: プロンプトを入れる。上記 5 ブロック (Concept / Layout / Style / Constraints / Output) で。初回はテンプレ通り、慣れたら省略して大丈夫です。
Step 3: 修正指示を出す。チャット内で「左ゾーンに『監査ログ』を追加して」「黄色付箋の文言を『2026 年版』に変えて」のように具体的に。「もっと良くして」「やり直して」は禁句です (意図が伝わらない)。

7. リスクと注意点 — 商標安全 / 著作権 / SVG 偽 PNG 事故

gpt-image-2 の主要リスク 5 項目を棒グラフで表現。横軸リスク項目、縦軸影響度 (低-中-高)。(1) 商標安全 (公式ロゴ正確再現): 高、(2) 著作権 (生成画像の権利帰属): 中、(3) SVG 偽 PNG 事故 (Codex 旧版): 高、(4) 文字崩れ (旧モデル比改善): 低、(5) コスト膨張 (再生成ループ): 中、という 5 本の棒。 — 図: gpt-image-2 利用時の主要リスク 5 項目と影響度 (Python 図解)

7-1. 商標安全 — 公式アイコンの「正確再現」は NG

Claude Code の Asterisk アイコン、Codex のロゴ、GPT のアイコンなどを正確に再現させると、商標権・パブリシティ問題のリスクがあります。 Sales Claw では 「Constraints: 公式ロゴ・商標・アプリアイコンを正確に再現しない」を毎回プロンプトに入れることで、editorial illustration として安全に運用しています。

7-2. 著作権 — 商用利用は基本 OK だが念のため確認

OpenAI の利用規約上、API 経由で生成した画像の権利は利用者に帰属します。ただし生成プロセスが学習データに引きずられて 既存著作物に酷似するリスクはゼロではないので、商用利用前に 逆画像検索で類似品が無いか確認する一手間を推奨します。【未確認】 日本の著作権法上の取り扱いは判例蓄積中で、最終判断は専門家に確認してください。

7-3. SVG 偽 PNG 事故 — Codex CLI 旧版の罠

Sales Claw が 実際に踏んだ事故。codex 0.118 + -m gpt-5.4を指定すると、テキストモデルにフォールバックして SVG コードが生成され、それを sharp ライブラリで PNG にラスタライズした「偽 PNG」が成果物になっていました。手描き風が「コードで描いた SVG」感丸出しになり、ブログのトーンを壊しました。

7-4. 文字崩れ (旧モデル比改善)

前世代 gpt-image-1.5 では日本語の文字崩れ率が約 35% でしたが、gpt-image-2 では事実上 0%に。ただし長文 (50 字超)や細かいフォントではまだ崩れることがあるので、画像内テキストは 1 タイトル + 1 サブタイトル + ラベル数個に留めるのが安全です。

7-5. コスト膨張 (再生成ループ)

1 枚 $0.05 でも、再生成 10 回繰り返せば $0.5。月 32 枚 × 5 回再生成で $8 (約 1,240 円)。個人なら無視できますが、CI / 自動化に組み込む場合は 「再生成回数の上限」をスクリプトで明示しておくのが安全。Sales Claw の wrapper は 1 枚あたり最大 1 回試行に固定しています (失敗したら人間が確認)。

8. 業務利用と Sales Claw 文脈 — ブログ・SNS 量産に組み込む現実解

Sales Claw のブログ画像生成ワークフロー。横軸ステップ、縦軸所要時間 (分)。Step 1 構成設計 (10 分) → Step 2 プロンプト書く (5 分) → Step 3 cover 生成 (3 分) → Step 4 body-1 生成 (3 分) → Step 5 body-2 生成 (3 分) → Step 6 body-3 生成 (3 分) → Step 7 Python 図解 3 枚 (5 分) → Step 8 検査 (PNG 確認) (2 分)。合計 34 分で 7 枚生成、人間が同等品質の Canva 制作する場合の 2-3 時間と比較した棒グラフ。 — 図: Sales Claw のブログ画像 7 枚を 34 分で量産するワークフロー (Python 図解)

Sales Claw の現実解を全公開します。このブログの全画像 (約 100 枚以上) は以下のワークフローで生成しています。

Sales Claw のブログ画像量産ワークフロー (1 記事 7 枚分)
ステップ	所要時間	使うツール
構成設計 (H2 と画像の対応決め)	10 分	手書きメモ or Notion
プロンプト 4 本書く	5 分	5 ブロックテンプレを流用
cover 生成 (gpt-image-2 medium)	3 分	npm run blog:image-gen --kind cover
body-1 / body-2 / body-3 生成 (各 3 分)	9 分	npm run blog:image-gen --kind body-N
Python 図解 3 枚 (matplotlib)	5 分	scripts/blog-diagrams/<slug>.py
検査 (PNG マジックバイト + ファイルサイズ)	2 分	wrapper script の自動検査
合計	約 34 分 / 7 枚	—

営業文脈での応用: Sales Claw 本体は問い合わせフォーム営業の自動化ツールですが、 gpt-image-2 でブログ・SNS の画像コストが下がったことで、「コンテンツ営業 (ブログ → 記事化 → SNS → リード獲得)」の単価そのものが下がりました。 AI による画像生成は 「営業組織のマーケティング担当業務を圧縮する」方向で現実的に効きます。「営業 AI」と並行して「マーケ AI」を導入する流れが 2026 年の現在地です。

【著者見解】 2026 年下半期は 「gpt-image-2 経由で画像コストがゼロに近づいた前提で、ブログと SNS の出稿頻度をどこまで上げられるか」が中小チームの差別化要因になると考えています。Sales Claw も 週 5 記事 → 週 8-10 記事への増産を画像生成コスト面では既に達成しており、ボトルネックは「画像」から「企画と一次情報の確認」に移りました。読者の方も、ぜひ自分のブログ・LP・SNS で gpt-image-2 を試してみてください。

今すぐ Sales Claw で、営業をもっとスマートに。

無料・MIT ライセンス。インストールせずにライブデモも試せます。

無料でダウンロードライブデモを試す GitHub

よくある質問

gpt-image-2 とは何ですか?

OpenAI が2026年4月21日に発表した第3世代画像生成モデルです。前世代 gpt-image-1 (2025-04) / gpt-image-1.5 (2025-12) の後継で、初めて「描く前に構図とレイアウトを推論する」O 系思考を画像生成に持ち込んだのが最大の進化点。主な機能は (1) 多言語の99% 文字精度 (日本語含む)、(2) 描画前推論 (Agentic 画像生成)、(3) コンテキスト維持マルチターン編集、(4) 最大16枚の参考画像入力、(5) 100以上のオブジェクトを1シーン内に配置、(6) 2K 解像度対応 (一部4K)。ChatGPT (Plus以上、2026-04-22から)、API (5月上旬から開発者向け)、Codex CLI (image_generation tool 経由) の3ルートで呼べます。

1枚いくらかかりますか?

OpenAI 公式 API Pricing に基づく1024×1024画像のコスト目安は、low quality で約 $0.006/枚、medium quality で約 $0.053/枚、high quality で約 $0.211/枚です。トークン単価は画像入力 $8/1M tokens、キャッシュ済み画像入力 $2、画像出力 $30、テキスト入力 $5 (per 1M tokens) で、参考画像を16枚積むほど入力コストが乗ります。Sales Claw のブログ画像 (1記事4枚 × 月8記事 = 月32枚) を medium で生成すると月約 $1.7 (約260円)、high でも月 $6.7 (約1,040円)。Canva 等で手作業すると1枚15-30分かかることを考えると、10倍以上の効率化になります。

ChatGPT / API / Codex CLI のどれを使えばいいですか?

用途で選びます。(1) 1枚だけ試したい・プロンプト試行錯誤したい → ChatGPT Plus ($20/月) が最も手軽。ブラウザだけで完結し、修正指示もチャットで出せます。(2) 月30枚以上の量産・本番自動化 → API (images.generate) 一択。完全プログラマブルで、ファイル名自動付与・メタデータ DB 保存・PNG 検査まで全部できます。(3) Codex CLI を契約済み・ターミナル中心の開発者 → Codex CLI の image_generation tool 経由が最適。Codex プランの月間枠を消費するので会計が単純です。Sales Claw は「Codex CLI + wrapper script (npm run blog:image-gen)」を選んでいます。

Codex CLI で gpt-image-2 を呼ぶときの注意点は?

Sales Claw が実際に踏んだ事故として、codex 0.118 + -m gpt-5.4 を指定するとテキストモデルにフォールバックし、SVG コードが生成され、sharp ライブラリで PNG にラスタライズした「偽 PNG」が公開されたことがあります。再発防止のため、(1) codex CLI のバージョンを0.130.0以上にする、(2) -m フラグは絶対に渡さない (デフォルトモデルで OK)、(3) --enable image_generation を必ず付ける、(4) --dangerously-bypass-approvals-and-sandbox を付ける、(5) プロンプト先頭に「Generate a real raster image. Do NOT write SVG.」を強制注入する、(6) 生成後にファイルサイズ ≥ 500 KB・解像度 ≥ 1024×576・PNG マジックバイトを検査する、の6点をすべて満たす wrapper script (Sales Claw の場合は npm run blog:image-gen) 経由で呼び出すのが必須です。

プロンプトはどう書けばいいですか?

Sales Claw では「Concept / Layout / Style / Constraints / Output」の5ブロック構成 (各1-3行、合計200-400字) を全画像で使い回しています。長文プロンプトは AI に読み飛ばされるので、短く狙いを絞った指示が高品質。中密度ホワイトボード説明図 (アイキャッチ用) は「タイトル + サブタイトル + 中央メタファー1個 + 左右ゾーン2個 (各3-5要素) + 黄色付箋ハイライト1個」、高密度ホワイトボード説明図 (本文用) は「番号付き3ステージ / 比較表 / 要点フロー / 付箋多数」の構成。「公式ロゴ・商標・アプリアイコンを正確に再現しない」「Sales Claw editorial illustration である」を Constraints に必ず含めるのが商標安全の基本です。

日本語の文字は正しく描けますか?

はい、ほぼ正しく描けます。OpenAI 公式の宣伝では「any language/script で99% 精度」とされており、Sales Claw の自社検証 (14枚) でも日本語タイトル・ラベルの文字崩れは0件でした。ただしサンプル数が小さく、(1) 50字を超える長文、(2) 細かいフォント、(3) 縦書き、(4) 特殊な漢字 (旧字体・異体字) では崩れることがあります。安全策として、画像内テキストは「1タイトル + 1サブタイトル + ラベル数個」に留め、長い説明文は画像外のキャプションに置くのが運用上の最適解。なお前世代 gpt-image-1.5 では日本語崩れ率が約35% だったため、ブログ・LP・SNS の日本語タイトル入り画像が必要な用途では gpt-image-2 が現実的な第一候補です。

商用利用しても大丈夫ですか?

OpenAI の利用規約上、API 経由で生成した画像の権利は利用者に帰属するため、商用利用は基本的に OK です。ただし2つの注意点があります。(1) 商標安全: Claude Code の Asterisk アイコン、Codex のロゴ、GPT のアイコンなどを「正確に再現」させると商標権・パブリシティ問題のリスクがあるため、プロンプトに「公式ロゴ・商標・アプリアイコンを正確に再現しない」を必ず入れます。(2) 既存著作物との類似: 生成プロセスが学習データに引きずられて既存著作物に酷似するリスクはゼロではないため、商用利用前に逆画像検索で類似品が無いか確認する一手間を推奨します。【未確認】日本の著作権法上の取り扱いは判例蓄積中で、最終判断は専門家に確認してください。

営業や業務にどう活かせますか?

コンテンツ営業 (ブログ → 記事化 → SNS → リード獲得) の単価が劇的に下がります。Sales Claw の場合、画像 AI を本格導入してから週5記事 → 週8-10記事への増産が実現し、ボトルネックが「画像制作」から「企画と一次情報の確認」に移りました。具体的な活用パターン: (1) ブログのアイキャッチを毎回 Canva で15-30分かけて作っていたチームは、プロンプト5分 + 生成3分 + 修正指示3分 = 約10分/枚に短縮可能。(2) SNS 用カルーセル投稿の画像 (Instagram / Threads) を一括生成。(3) 営業資料の挿絵・コンセプト図。(4) LP の補助イラスト。Sales Claw 本体は問い合わせフォーム営業自動化ツールですが、gpt-image-2 のような画像 AI と組み合わせることで、「営業 AI」と並行して「マーケ AI」を導入する流れが2026年の現在地です。

参考文献

本記事は X 公式アカウントと公式ドキュメントを一次情報として参照しています。

[01]
OpenAI Developer Community — Introducing gpt-image-2 (公式)2026-04-21
[02]
OpenAI Codex CLI — Features (公式 Docs)2026-05-17
[03]
OpenAI API — Pricing (公式)2026-05-17
[04]
Codex Blog — Image Generation in Codex CLI: gpt-image-2 and the $imagegen Skill2026-04-27
[05]
OpenAI Codex on GitHub — image_generation tool implementation2026-05-17
[06]
dev.to — gpt-image-2 API Developer Guide: Pricing, Thinking Mode, Production Integration2026-04-25
[07]
GitHub — gpt_image_2_skill (Codex prompt gallery, CLI, agentic skill)2026-05-17
[08]
GitHub Issue — Codex App built-in image_gen output dimensions (#19175)2026-05-10

この記事の著者