AIニュースOpenAI Codex

OpenAI Codex が "夜中も働く同僚" になった日？ Goal Mode GA を一般読者向けに整理

OpenAI Codex が 1 週間で "夜中も走り続ける同僚" に変わりました。Goal Mode の GA 化、Mac ロック後も動く Locked Computer Use、Cmd 2 回でスクショ送信 Appshots、企業向け Plugin Marketplace、CLI 0.132-0.134 を一般読者向けに整理し、コスト暴走・権限渡しすぎ・法務適合の 3 つのリスクと、Sales Claw 視点の安全運用も併せて解説します。

中澤圭志

@keishi_nakazawa

Sales Claw 開発者

2026年5月27日·14 分

OpenAI Codex が "夜中も働く同僚" になった日？ Goal Mode GA を一般読者向けに整理

Key Facts

リリース期間

2026-05-20 〜 2026-05-26 (Codex Thursday)

Codex App 26.519

Goal Mode GA / Locked Computer Use / Appshots / Plugin Marketplace

Codex CLI

0.132.0 → 0.133.0 → 0.134.0 (履歴検索 / --profile 統一)

Sales Claw 文脈

監査ログ・自動停止条件付きで "夜通し走る AI" を業務に乗せる

この記事を一言で言うと
2026 年 5 月 20 日から 26 日までのわずか 1 週間で、OpenAI Codex (オープン AI が出しているコーディング AI 道具) が連続で大型アップデートを出しました。これまで「1 つの指示を出して、終わるまで待つ」道具だった Codex が、「目標を渡して、夜中でも何時間でも自分で考えて走り続ける同僚」に進化しています。具体的には、長期目標追求モード (Goal Mode) が実験から正式機能になり、Mac の画面ロック後でもデスクトップアプリを操作できる Locked Computer Use、Cmd キー 2 回押しで前面のアプリのスクリーンショットを Codex に送る Appshots、企業向けの Plugin Marketplace、コマンドライン版 0.132〜0.134 までが一気に投入されました。AI に詳しくない方にも「1 週間で何が起きて、ふつうの人や中小事業者にどう関係するか」を、夜勤の同僚と医療現場のたとえで整理します。

結論: 今回のアップデートで Codex は「依頼書を 1 行渡せば、夜通し走り続けて翌朝に成果物を置いておく同僚」に近づきました。とくに Goal Mode の GA (一般提供) 化と Locked Computer Use の組合せは、コーディングだけでなく営業・調査・カスタマーサポートのような「人が画面の前にいなくても回したい業務」全体に効く変化です。一方で「夜通し走るほどコストが膨らむ」「権限を渡しすぎて事故る」という新しいリスクも同時に出てきました。今すぐ全部触る必要はありませんが、業務に AI を入れている人は今週中に Codex の新機能を確認しておかないと、来月の請求書か事故対応のどちらかで困ります。

「Codex って ChatGPT と何が違うの?」「夜中も走る AI ってどういうこと? 怖くない?」「うちみたいな中小事業者にも関係ある話?」 —— 本記事ではこの 3 つの疑問に対し、2026 年 5 月 20 日から 26 日にかけてリリースされた Codex の連続アップデートがどう答えるかを、OpenAI 公式 GitHub Releases と公式 Codex Changelog を一次情報として参照しながら、Sales Claw 開発者の視点で整理します。

Codex がここまで連続的に動いた 1 週間は珍しく、業界では「Codex Thursday」と呼ばれる飛び道具的なリリース日が 5/21 に設定され、その前後で CLI (コマンドライン版) 3 連発・デスクトップアプリ 1 大型回・新規エンタープライズ機能が一気に出ました。本記事は、その中でも一般読者にとって意味の大きい 4 つの機能 (Goal Mode GA / Locked Computer Use / Appshots / Plugin Marketplace) と、コマンドライン版 0.132〜0.134 の中身を中心に解説します。

本記事は OpenAI Codex 公式 Changelog / openai/codex GitHub Releases / Codex Feature Maturity 公式 / Codex Docs Hub を一次情報として参照しています。Sales Claw の無料ダウンロードページもあわせてどうぞ。

1. Codex が "夜中も働く同僚" に変わった — 一言で言うと

まず前提: Codex (コーデックス) は、OpenAI 社 (ChatGPT を作っている会社) が出しているコーディング AI の道具です。「コーディング AI」というのは、ふつう人間がキーボードで書くプログラムのコードを、AI に書かせる仕組みのことです。Codex 自体はChatGPT アプリの中・専用のデスクトップアプリ・パソコンのターミナル (黒い画面)・スマホアプリ・VS Code / JetBrains などの開発ツールの中、と複数の入口から呼び出せる「同じ AI に複数の入口がある」設計になっています。

ここで重要な用語を 3 つ、普通の言葉に翻訳しておきます。

専門用語	普通の言葉に直すと	身近なたとえ
Goal Mode (ゴールモード)	「依頼書」を渡すと、終わるまで自分で考えて走り続けるモード	「この案件、月末までに仕上げといて」と頼む夜勤の同僚
Computer Use (コンピューターユース)	AI が人間の代わりに自分のパソコン画面を操作する仕組み	あなたのマウスを借りて、AI が代わりにクリックしている状態
GA (一般提供 / 正式機能化)	「実験版」「ベータ」から、正式に「お客様にお使いいただいて大丈夫」と公式が宣言した状態	新薬の臨床試験フェーズが終わって保険適用になった瞬間

この 3 つの用語が同時に動いたのが今回のニュースです。【公式発表】 OpenAI 公式 Codex Changelog (2026-05-21 付) によると、Goal Mode は「実験的機能ではなくなり、Codex アプリ・IDE 拡張・コマンドライン版で利用可能になりました」と明記されています。同じ Changelog で Remote Locked Computer Use (Mac ロック後にデスクトップアプリを操作する機能) が「短命の認可」「画面カバー」「ローカル入力時の自動リロック」という安全装置付きで投入されました。

【著者見解】 ここまで 1 週間で連続して出てきたのを、Sales Claw 開発者の立場から見ると、「業界が "1 問 1 答" から "目標達成型自律" に確定的に切り替わるサイン」です。これまでの ChatGPT 型の使い方は「質問する→答えが返る→次の質問」のキャッチボールでしたが、Goal Mode は「目標を渡す→自分でタスク分解する→走る→失敗したら自分で立て直す→終わるまで止まらない」という別の物体です。営業エージェント・調査エージェント・カスタマーサポートエージェントを作っている Sales Claw のような道具にも、同じ流れが半年以内に来ます。

2. 5 つのアップデートを 1 枚で — Codex Thursday 2026-05-21 を中心に

2026-05-20〜26 の Codex 連続アップデート 5 機能俯瞰マップ。Goal Mode GA / Locked Computer Use / Appshots / Plugin Marketplace / CLI 0.132-0.134 の役割と関係性を矢印で結んだホワイトボード説明図 — 図: 5 機能の役割俯瞰。Goal Mode が「自律実行の中核」、Locked Computer Use と Appshots が「画面越しの目と手」、Plugin Marketplace が「企業向け配布の箱」、CLI 0.132-0.134 が「足回り改善」

まずは時系列で整理します。OpenAI 公式 GitHub Releases の openai/codex リポジトリと公式 Codex Changelog から日付を確認した結果は以下の通りです。

日時 (UTC)	製品	バージョン	主な変化
5/20 01:52	Codex CLI	v0.132.0	Python SDK 認証一級化、テキスト専用 turn API、exec resume の output schema
5/21 (Codex Thursday)	Codex App	26.519	Goal Mode GA / Locked Computer Use / Appshots / Plugin Marketplace
5/21 16:48	Codex CLI	v0.133.0	Goal 機能のデフォルト有効化、remote-control 前面化、Permission profile 拡張
5/26 19:13	Codex CLI	v0.134.0	会話履歴検索、--profile 統一、MCP 設定改善、Windows TUI 描画修正

この中で太字でハイライトしたデスクトップアプリ 26.519 と CLI 0.133 / 0.134 が中核です。コマンドライン版 0.132 (5/20) は Python SDK 経由で Codex を呼ぶ開発者向けの足回り更新で、一般読者には直接の関係は薄いですが、後述する「他のシステムに Codex を組み込みやすくなった」流れの一部です。

【著者見解】 なぜ 5/21 に集中投下されたかというと、OpenAI 側で「Goal Mode を GA にする」目標日が 5/21 に固定されていて、その動きに合わせて CLI・IDE 拡張・デスクトップアプリ・モバイルを同時に揃える必要があったと推測されます。CLI 0.133 (5/21 16:48 UTC) でも「Goals are now enabled by default」とリリースノートに記載されており、デスクトップアプリ側との同期が意図的だったことが読み取れます。

3. Goal Mode が「実験」から正式機能に — 何が変わったか

Goal Mode の使い方は驚くほどシンプルです。Codex のチャット画面で /goal と入力すると、目標を 1 行で書く欄が出てきます。たとえば「Sales Claw のリポジトリで Python の依存関係を 3.12 から 3.13 にアップグレードして、テストが全部通る状態まで持っていく」と書くと、Codex は(1) 現在の依存ライブラリ一覧を確認する、(2) 各ライブラリの 3.13 対応版を調べる、(3) 互換性のないものは代替を探す、(4) コードを直す、(5) テストを実行する、(6) 失敗したらエラーを読んで直す、(7) 全部通るまでループを繰り返すを自分で考えて、自分で走ります。

これまで実験版だった頃から大きく変わったのは、(A) セッション切れ・トークン上限リセット・ネットワーク切断などで作業が止まっても、再開時に状態を復元して続きから走れる、(B) 進捗が常に可視化される、(C) 失敗時に自動でやり直す方針を Codex 自身が立てるという 3 点です。【公式発表】 OpenAI 公式 Codex CLI v0.133.0 リリースノートには「Goals are now enabled by default, backed by dedicated storage, and track progress across active turns」と明記され、専用ストレージで進捗を保存する設計に変わりました。

【著者見解】 Sales Claw 開発者の感覚で言うと、これは「AI が "短距離走" から "マラソンランナー" に進化した」変化です。これまでの AI は、1 つの長いプロンプトで 10 分〜30 分のタスクをやらせるのが限界でした。Goal Mode は「目標が達成されるまで止まらない」がデフォルトなので、夜中 23 時に依頼して翌朝 8 時に成果物が完成している、という運用が現実的になります。

Goal Mode の活用範囲はコーディング以外にも広がります。【公式発表】 OpenAI の用例として明示されているのは「パッケージ移行」「テストカバレッジ向上」「フレーキーテスト (不安定なテスト) の再現」「夜間のリファクタリング」「パフォーマンスプロファイリングとパッチ適用」など、いずれも「次の手が、その前の手の結果に依存する」タスクです。営業エージェントで言えば、「リスト 1,000 社をスキャンして、フォーム送信できる会社だけ抽出して、それぞれの企業情報を読んで個別の文面を生成する」のような連続作業がここに当たります。

4. Locked Computer Use と Appshots — Mac ロック後も走り続ける目と手

Locked Computer Use の動作フロー説明図。左に「Mac ロック中の画面 (画面カバー表示)」、中央に「Codex がデスクトップアプリを内部で操作」、右に「ローカルキーボード入力で自動リロック」を配置し、安全装置として「短命の認可」「画面カバー」「ローカル入力時の自動リロック」を青枠で囲ったホワイトボード説明図 — 図: Locked Computer Use の安全装置 3 点セット。短命の認可・画面カバー・ローカル入力時の自動リロックで、人が画面前にいなくても AI に画面を任せて良い設計になっている

Locked Computer Use の何が画期的かを理解するには、これまでの「Computer Use」(AI がパソコンを操作する仕組み) の限界を知る必要があります。従来は「人間が画面の前にいて、AI の動きを見守っている」前提でした。理由は単純で、(1) AI が暴走したら止められる人が必要、(2) 画面がロックされていると AI も操作できない、(3) リモートからの開始は信頼性が低い、という 3 点が解決されていなかったからです。

【公式発表】 Codex App 26.519 の Locked Computer Use は、この 3 点を以下の安全装置で解決しています。

短命の認可 (short-lived authorization): 1 回のセッションごとに「Codex がパソコンを操作してよい時間」が短時間に区切られる。期限が切れたら自動で操作を止める
画面カバー (covered displays): 物理ディスプレイには「Codex が作業中」のカバー画面が表示されて、肩越しに作業内容が覗かれない
ローカル入力時の自動リロック (relock on local input): 物理キーボード・マウスに入力が入った瞬間 (= 人が席に戻ったとき)、即座に Codex の操作を停止して画面を再ロックする

この 3 点セットによって、「人が会議に出ている間に Codex が黙々と作業を進める」「外出先からスマホで Codex を起動して、自宅の Mac で資料作成を依頼する」が現実的になりました。【未確認】 Windows 版 Locked Computer Use の予定は公式に明言されていません。Mac の画面ロック挙動を OS レベルで使う設計のため、Windows 側のロック画面実装と互換性のある仕組みを別途用意する必要があると推測されます。

Appshots は別軸の便利機能です。MacBook の Cmd キー (⌘) を 2 回押すと、現在前面に出ているアプリのスクリーンショットが Codex のスレッドに添付されます。【公式発表】 OpenAI Codex Changelog (2026-05-21) によると「Appshots lands on macOS, letting you inject the frontmost window into any Codex thread with a double Command key press」と記載されています。

身近な使い方は、「エラー画面を撮って Codex に直してもらう」「Figma のデザイン画面を撮って Codex にコードに変換してもらう」「Slack のスレッドを撮って Codex に要約してもらう」のような「画面を見せながら相談する」流れの摩擦が消えることです。これまでもスクリーンショットを撮ってチャット欄にドラッグすればできましたが、Cmd × 2 で済むのは想像以上に行動コストを下げます。

項目	従来の Computer Use (人が画面前にいる前提)	Locked Computer Use (5/21 GA)
画面の状態	ロック解除中のみ	ロック中でも操作可能
安全装置	人間が常時監視	短命認可 / 画面カバー / 自動リロック
リモート起動	実質困難	Codex Mobile から起動可能
使えるシーン	机に座っているとき限定	会議中・外出中・夜間も可能
事故時の止め方	人がマウス・キーボードで介入	物理入力で自動停止 (相手から見ると即時)

Sales Claw も Codex と同じ思想で、夜中も走るエージェントを安全に運用する設計を採用しています。

無料・MIT ライセンス。インストールせずにライブデモも試せます。

無料でダウンロードライブデモを試す GitHub

5. Plugin Marketplace とコマンドライン版 0.132〜0.134 の中身

Plugin Marketplace は企業 IT 向けの機能です。「Plugin」というのは、Codex に追加機能を後付けする部品 (拡張) のことで、たとえば「Salesforce と連携する」「社内 Wiki から検索する」「自社の API を叩く」などの個別機能を Codex に教え込めます。【公式発表】 OpenAI Codex Changelog (2026-05-21) によると、Plugin Marketplace は「reusable plugin bundles that include skills, app integrations, MCP servers, lifecycle hooks」を提供する仕組みで、まずは ChatGPT Business 向けに開放、エンタープライズ向け展開も準備中とのこと。

ここで MCP (Model Context Protocol) という用語が出てきます。MCP は「AI とツールをつなぐ共通の蛇口」のような規格で、Anthropic が提唱して業界全体に広がっているものです。Codex も MCP に対応していて、Plugin Marketplace 経由で「社内の Notion を見られる MCP サーバ」「自社の Postgres を SELECT できる MCP サーバ」のような拡張を社員全員に配れるようになります。MCP の詳細は MCP 完全ガイドにまとめてあります。

コマンドライン版 0.132〜0.134 の変化を 1 つの表で整理します。

バージョン	日付 (UTC)	主な新機能 (一般読者向け要約)
v0.132.0	5/20 01:52	Python SDK で Codex を呼ぶときの認証が公式サポート / 簡単なテキストワークフローを文字列だけで書けるように / 構造化出力 (JSON 形式の決まった枠) で再開できるように
v0.133.0	5/21 16:48	Goal Mode がデフォルト有効化 / リモート制御コマンドが前面実行 / 権限プロファイルに継承機能と requirements.toml 管理 / プラグイン発見の改善
v0.134.0	5/26 19:13	会話履歴の検索 (大文字小文字を区別しない) / --profile フラグの統一 / MCP 設定のサーバ別環境変数 / 読み取り専用 MCP ツールの並行実行 / Windows TUI 描画修正

とくに会話履歴検索 (0.134) は一般読者にも嬉しい機能です。「あの便利なやり方、先週 Codex に教えてもらった気がするけど、どのスレッドだっけ」を毎日繰り返している方は、これだけのために 0.134 にアップグレードする価値があります。

権限プロファイル (Permission profiles, 0.133) も実運用では大きい変更です。「--profile dev なら全部許可、--profile prod ならファイル書き込みは禁止、--profile review なら読み取りのみ」のように、状況ごとに権限のセットを切り替えられます。【著者見解】 Sales Claw のような営業エージェントを設計している立場から見ると、「営業リスト読み取り用」「テスト送信用」「本番送信用」のように業務段階で権限を切り替える運用と同じ思想で、業界が「権限の細分化」を標準装備にする方向に動いていることが分かります。

6. 始め方 — 個人・中小事業者・企業の 3 シナリオ

図: 3 シナリオの始め方。今日触れるのは個人パターン。中小事業者・企業は段階を踏む必要がある

ここから「明日からどう触ればいいか」を 3 シナリオで整理します。

個人 (5 分で開始)

1 番手軽なのは、すでに ChatGPT Plus (月 $20) を使っている人です。Codex App (デスクトップ版) を https://chatgpt.com/features/desktop/ からダウンロードしてインストールし、ChatGPT アカウントでログインするだけで Goal Mode と Appshots が使えます。Locked Computer Use は macOS のみ。

最初の 1 回は、小さなリポジトリで Goal Mode を試すのがおすすめです。たとえば「この README ファイルを読みやすく書き換えて、目次を追加して」のような 5〜10 分で終わる目標から始めてください。いきなり一晩走らせる目標を投げるとコストが想像以上に膨らみます。

中小事業者 (1〜2 週間で導入)

従業員 10〜100 名規模の事業者は、ChatGPT Business プラン (1 ユーザーあたり月 $25 程度から) を契約し、社員に Codex App を配ります。Plugin Marketplace 経由で「社内 Wiki 検索」「営業案件管理」などの共通ツールを集中配布できるので、1 人ずつ手作業でセットアップする手間が省けます。

導入時にやるべきことは 3 点: (1) 使用量上限をユーザー単位で設定する (Uber が 4 ヶ月で 2026 年 AI 予算を使い切った事例があるため)、(2) Permission profileで「営業」「開発」「経営」など職種別に権限を切り分ける、(3) 監査ログを保存する設定を最初から有効にする。

企業 (1〜3 ヶ月で展開)

従業員 500 名以上の企業は、IT 部門と法務・セキュリティ部門を巻き込んで段階展開します。(1) 部門単位のパイロット導入 (50 人規模)、(2) Permission profile の標準設計と監査ログ運用、(3) 既存のセキュリティツールとの連携 (DLP・SIEM・SASE 等)、(4) 全社展開、の順で進めます。【著者見解】 Claude 側で同時期に Claude Compliance API と 28 統合パートナーが発表されたように、業界全体が「AI を SaaS と同じ管理枠に乗せる」方向に動いています。Codex 側でも同種の発表が 2026 年後半に出てくる可能性が高いと推測します。

7. リスクと注意点 — 「夜中も走る」の対価

WARNING— この記事執筆時点の Codex 自律実行で実際に起きうるリスク

コスト暴走: Goal Mode は「終わるまで止まらない」がデフォルト。Uber は 5,000 人のエンジニアに展開して 4 ヶ月で年初 AI 予算を使い切った (2026-04 公表)
権限渡しすぎ: Locked Computer Use で AI に画面操作を委任しすぎると、想定外の操作 (誤送信・誤削除・誤発注) が発生する可能性
監査の難しさ: 自律実行中の AI が何をしたか後追いするには、専用の監査ログ機構が必要 (権限プロファイルだけでは追跡不足)
規約と法務: 営業・カスタマーサポートのような外部接触業務に AI を入れる場合、特定電子メール法・個人情報保護法・特商法への適合確認が必須
業務影響の連鎖: 夜中に AI が動いた成果物を翌朝の人間が引き継ぐ前提が崩れると、「誰が責任を持つのか」が曖昧になる組織リスク

コスト暴走 — Uber の教訓

【公式発表】 2026 年 4 月、Uber CTO Praveen Neppalli Naga が The Information の取材で「2026 年 AI 予算を 4 ヶ月で使い切った」と認めました。Uber は 2025 年 12 月に Claude Code を約 5,000 人のエンジニアに展開し、2026 年 4 月時点で 1 エンジニアあたり月 $500-$2,000 (約 7.5 万円〜30 万円) の API コストが発生。Goal Mode のような自律実行モードを多用すると、同じ問題が Codex でも起きえます。

対策は「導入と同時に上限を仕込む」ことです。具体的には、(1) ユーザー単位の月次コスト上限、(2) Goal Mode の 1 セッションあたりの最大経過時間、(3) 1 セッションあたりの最大ターン数、(4) プロジェクト単位の予算上限、を最初から ON にして導入してください。

権限渡しすぎ — 自律実行の暴走

Locked Computer Use を有効にすると、「AI が画面ロック中にデスクトップアプリを操作する」状態になります。これは便利ですが、権限を渡しすぎると、AI が想定外の操作をするリスクが同時に増えます。たとえば「Codex に Slack で社内に進捗報告させる」設定にしたつもりが、誤って「Slack で取引先にメッセージを送信する」になっていた、という事故は十分起こりえます。

対策は Permission profile を「読み取りのみ」「サンドボックス内のみ」から始めること。書き込み権限・外部送信権限は段階的に追加し、最初の 1〜2 週間は人間が必ず成果物をレビューしてから外部送信する運用にしてください。

法務 — 営業・サポート業務に使う場合

Codex を営業フォーム送信・カスタマーサポート返信のような外部接触業務に使う場合、日本では以下の法令への適合確認が必要です。

特定電子メール法: 送信者情報 4 要件 (氏名・住所・受信拒否方法・問い合わせ先) を本文に必ず含める
個人情報保護法: 取得した個人情報の利用目的明示・第三者提供の制限・本人開示請求への対応
特定商取引法: 通信販売・電子メール広告の場合は誇大表現禁止・オプトアウト導線必須

【著者見解】 Codex は道具なので、これらの法令適合は使う側の責任です。Sales Claw は「ポリシー制御付き自律運用」の思想で、送信前自動検査・営業 NG 検出・CAPTCHA 検出時停止・送信頻度制限・監査ログ保存・特商法フッター自動補完を全部組み込んだ OSS として提供しています。Codex の Goal Mode を自社で組む場合は、これらの機能を自前で実装する必要があります。

Codex Goal Mode の自律実行とコスト構造を示すグラフ。横軸は実行時間 (1h, 4h, 8h, 24h)、縦軸は API コスト ($)。Goal Mode を上限なしで走らせた場合と、ターン上限・経過時間上限を入れた場合の累積コスト推移を 2 本の折れ線で比較 — 図: Goal Mode を「上限なし」で走らせるとコストが直線的に膨らむ。ターン上限・経過時間上限を入れた場合との対比 (試算)

8. Sales Claw 視点 — "夜中走る同僚" を業務に組み込むには

ここから先は、Sales Claw 開発者として「Codex の Goal Mode を実際に業務に組み込むなら、何が必要か」を実装目線で書きます。一般読者にも「Codex を業務に入れる前に何を確認すべきか」の参考になるはずです。

DATA— 社内検証メモ — Sales Claw v0.5 の Goal Mode 風自律実行データ (一般読者向け開示)

検証条件: Windows 11 / Node.js 22 / Playwright 1.49 / Sales Claw v0.5 / Claude Opus 4.7 + Sonnet 4.6 のハイブリッド
期間: 過去 90 日 (2026-02-26〜2026-05-26)
サンプル数: フォーム送信 3,247 件 / CAPTCHA 遭遇 412 件 / 営業 NG 検出 47 パターン
観察結果 (定性 + 定量):
1. 夜間 (23:00-7:00 JST) の自律実行で 1 セッションあたり平均 4.2 時間、上限ターン数 800 で安定動作
2. API コスト: 1 セッションあたり平均 ¥138、月次合計約 ¥12,500 (ハイブリッドモデルで Sonnet 比 8 倍効率)
3. CAPTCHA 遭遇率 12.7% (412 / 3,247)、検出時は awaiting_approval で監査ログ保存・自動停止
4. 営業 NG 検出: 「営業目的お断り」「個人事業主の方は…」など 47 パターンの語彙を内部 LLM で判定、誤検出 8 件
5. 事故ゼロを担保しているのは「送信前自動検査」「自動停止条件」「監査ログ保存」の 3 点セット
再現性の限界: サンプル数 3,247 件は小規模、業種・対象企業規模が偏っているため、業界差・季節差は別途検証必要

Codex の Goal Mode を業務に組み込む場合、Sales Claw 開発で 90 日かけて辿り着いた以下の「3 つの定位置」を最初から仕込むことを強くお勧めします。

DATA— 自社失敗ログ — 90 日で踏んだ 3 つの落とし穴 (恥ずかしながら公開)

失敗 1 (Day 14): 初回テスト送信で 取引先 1 社に AI 生成文面が出てしまい即停止。原因は対象リストフィルタの除外設定漏れ。対策: 「テスト送信は別ドメイン専用 sandbox を強制」をハード制約化
失敗 2 (Day 41): 夜間バッチが 日曜朝 8 時に止まっていたのを月曜午前に気付いた。原因は自動停止条件が「件数 1000」「経過時間 5 時間」の OR だったため。対策: AND 条件 + Slack 通知で即気付ける状態に
失敗 3 (Day 73): Windows の昇格 sandbox で codex.exe が死亡し画像生成が 4 並列でこけた。原因は ~/.codex/auth.json のセッションロック奪い合い。対策: wrapper script で lockfile を取って順次実行に

いずれも Sales Claw 設計を 3 回書き直す原因になった事故。「便利機能」より「失敗ログ」のほうが業務運用には実用的という確信が、3 ヶ月で得た一番の学びです。

1. 自動停止条件 (件数 × 時間 × ターン上限の AND)

自律ループには必ず複数の終了条件を AND でかけます。Sales Claw では「最大件数 100 件」「最大経過時間 5 時間」「最大ターン数 200」のいずれかに当たったら自動停止、を全セッションでデフォルト ON にしています。【personal_metric】 私 (中澤) は Sales Claw の設計を 3 ヶ月で 3 回書き直しました。1 回目は終了条件なしで暴走、2 回目は件数だけで時間超過、3 回目で AND 条件にしてようやく安定。

2. 監査ログの保存 (JSONL ローカル)

AI が自律実行した結果は、必ず監査ログ (action-log.json) に時系列で記録します。Sales Claw では「いつ・どの企業に・どの文面で・どんな経路で送信したか・CAPTCHA で止まったか」を全て JSONL 形式で残し、運用者が後追いできるようにしています。Codex の Permission profile だけでは「いつ何をしたか」の時系列は追跡できないので、業務利用なら別途ログ機構が必須です。

3. 送信前自動検査 (送信ごとの個別承認に依存しない)

「送信ごとに個別確認が間に合わないが、誤送信は絶対避けたい」というジレンマを解決するのが、送信前自動検査です。Sales Claw では 送信前自動検査・営業 NG 検出・CAPTCHA 検出時停止・送信頻度制限・特商法フッター自動補完 を全部 ON で送信前に通過させてから初めて実行します。「送信ごとに個別確認する」設計と違って業務をスケールしやすく、かつ自動検査の組合せでリスクを下げる設計です。これは Codex の Goal Mode 単体では提供されない、業務特化の追加レイヤーです。

2026-05-20 から 2026-05-26 までの 1 週間に起きた Codex 連続アップデートのタイムライン図。CLI v0.132.0 (5/20)、App 26.519 + CLI v0.133.0 (5/21 Codex Thursday)、CLI v0.134.0 (5/26) を時系列で配置し、各バージョンの主要機能を吹き出しで補足 — 図: Codex 連続アップデートのタイムライン (UTC 基準)。5/21 Codex Thursday が中核

Codex / Claude Code / Sales Claw の自律実行機能比較棒グラフ。Goal Mode 相当機能・Computer Use 相当機能・監査ログ機能・営業特化機能の 4 軸で 3 製品を比較 — 図: Codex / Claude Code / Sales Claw の自律実行 4 軸比較。Codex はコーディング寄り、Sales Claw は営業特化

9. まとめ — 「夜中走る同僚」をどう日々の判断に活かすか

2026 年 5 月 20 日から 26 日の 1 週間で起きた Codex の連続アップデートは、「AI が "1 問 1 答" から "目標達成型自律" に変わる節目」でした。Goal Mode が GA に昇格し、Locked Computer Use で画面ロック中も走れるようになり、Appshots で画面を見せながら相談する摩擦が消え、Plugin Marketplace で社内配布の道が開き、コマンドライン版 0.132〜0.134 で足回りも整いました。

一方で「夜通し走る AI」は便利と引き換えに新しいリスクを持ち込みます。Uber が 4 ヶ月で 2026 年 AI 予算を使い切った事例は、業界全体への警鐘です。コスト上限・権限プロファイル・監査ログ・自動停止条件の 4 点セットを最初から仕込まないと、便利さの代償が想定以上に大きくなります。

実運用前チェックリスト

Codex Goal Mode を業務に入れる前に

ChatGPT Plus / Business / Enterprise のいずれかを契約済み
Codex App / CLI / IDE 拡張のいずれかをインストール済み
Goal Mode 試運転を 5〜10 分で終わる小タスクから開始した
API 使用量上限 (ユーザー単位 / セッション単位) を設定した
Goal Mode の最大ターン数・最大経過時間・最大コストを設定した
Permission profile を業務段階別に分けた (読み取り / テスト / 本番)
Locked Computer Use を使う場合、画面カバー表示を確認した
監査ログ保存先を決めた (ローカル JSONL / 既存 SIEM 連携)
営業・サポート用途なら特商法・個人情報保護法の適合確認をした
事故時の停止手順を文書化した (誰が・どう止めるか)
夜間自律実行の成果物を翌朝レビューする運用フローを決めた
12 ヶ月以内に契約見直し条項を入れた (業界変化への備え)

次のアクション: まず 5 分、ChatGPT Plus 契約者なら Codex App で Goal Mode を小タスクから試してください。中小事業者の経営者なら、社員にいきなり展開する前に IT 担当と Permission profile・コスト上限を相談してください。営業・サポート業務に AI を入れたい方は、Sales Claw のような業務特化 OSS のクイックスタートガイドから始められます。

本記事の続編として、Anthropic が OpenAI を初めて逆転した業界トレンド整理もあわせてどうぞ。

読んだら、Goal Mode を 5 分だけ触ってみよう。それが業務に AI を入れる最短ルートです。

無料・MIT ライセンス。インストールせずにライブデモも試せます。

無料でダウンロードライブデモを試す GitHub

よくある質問

Codex の Goal Mode が "GA になった" って一言で言うと何?

【公式発表】 2026 年 5 月 21 日付の OpenAI Codex Changelog によると、Goal Mode (目標達成型自律実行モード) は「実験的機能ではなくなり、Codex アプリ・IDE 拡張・コマンドライン版で利用可能になりました」と明記されました。GA (General Availability) は「実験版・ベータから、正式に "お客様にお使いいただいて大丈夫" と公式が宣言した状態」のことで、新薬の臨床試験フェーズが終わって保険適用になった瞬間に近い節目です。具体的な使い方は <code>/goal</code> コマンドを Codex で実行し、目標を 1 行で書く欄に「Sales Claw のリポジトリで Python の依存関係を 3.12 から 3.13 にアップグレードして、テストが全部通る状態まで持っていく」のような依頼書を渡すと、Codex が自分でタスクに分解して、何時間でも何日でも、達成するまで自律的に走り続けます。実験版から大きく変わったのは、(A) セッション切れ・トークン上限リセット・ネットワーク切断で止まっても状態復元できる、(B) 進捗が常時可視化される、(C) 失敗時に自動で立て直す、の 3 点です。

Locked Computer Use って何がすごい? 普通の Computer Use と何が違うの?

【公式発表】 Codex App 26.519 (2026-05-21) で投入された Locked Computer Use は、Mac の画面がロックされた状態でも Codex がデスクトップアプリを操作できる機能です。従来の Computer Use は「人間が画面の前にいて、AI の動きを見守っている」前提でしたが、Locked Computer Use は 3 つの安全装置で「人が画面前にいなくても AI に画面を任せて良い」状態を実現しました。安全装置は (1) 短命の認可 = 1 セッションごとに「操作してよい時間」が短時間に区切られ、期限切れで自動停止、(2) 画面カバー = 物理ディスプレイには「Codex 作業中」のカバー画面が表示され、肩越しの覗き見をブロック、(3) ローカル入力時の自動リロック = 物理キーボード・マウスに入力が入った瞬間に Codex の操作を停止して画面再ロック、の 3 点セットです。これにより「人が会議に出ている間に Codex が作業を進める」「外出先からスマホで起動して自宅 Mac で資料作成を依頼する」が現実的になりました。【未確認】 Windows 版の予定は公式に明言されておらず、Mac の OS レベルロック挙動に依存する設計のため、Windows 側は別途実装が必要と推測されます。

Appshots は MacBook ユーザー限定? Windows でも使える?

【公式発表】 OpenAI Codex Changelog (2026-05-21) によると、Appshots は「macOS で Cmd キー 2 回押しで前面アプリのスクリーンショットを Codex スレッドに添付する機能」として macOS 限定で投入されました (Appshots lands on macOS, letting you inject the frontmost window into any Codex thread with a double Command key press)。Windows 版・Linux 版の予定は本記事執筆時点 (2026-05-27) では公式に明言されていません。Windows ユーザーは従来通り、Win + Shift + S で取ったスクリーンショットをチャット欄にドラッグする方法を使う必要があります。Appshots の便利さは「画面を見せながら相談する」流れの摩擦を消すことで、エラー画面・Figma デザイン・Slack スレッドのような「画面のものを AI と一緒に見たい」シーンで圧倒的に行動コストが下がります。【著者見解】 Windows 版の対応は半年以内に出てくる可能性が高いですが、Mac の Cmd ダブルタップに相当するキー組合せ (Win キー 2 回? Ctrl + Shift + S?) の選定が必要なため、設計には時間がかかるかもしれません。

Plugin Marketplace は個人プランでも使える? ChatGPT Plus でも触れる?

【公式発表】 Plugin Marketplace は 2026 年 5 月 21 日付で「ChatGPT Business 向けに提供開始、エンタープライズ対応準備中」と明記されており、個人向けの ChatGPT Plus / ChatGPT Free プランは現時点で対象外です。Plugin Marketplace の中身は「skills / app integrations / MCP servers / lifecycle hooks を 1 つにまとめた再利用可能なバンドル」で、企業 IT 部門が「社内 Wiki 検索」「営業案件管理」「自社 API 連携」のような共通拡張を社員全員に集中配布する仕組みです。個人で使う場合は、自分で MCP サーバを書いて Codex 側に設定するか、コミュニティで公開されている MCP サーバを 1 つずつ自分のマシンにインストールする方法になります。【著者見解】 Plugin Marketplace の個人プラン開放は技術的には可能ですが、配布されるプラグインの品質保証・セキュリティ審査の体制が整うまで企業向け限定が続くと推測します。2026 年後半に Plus 向けに広がる可能性は中程度です。

Codex CLI 0.132 から 0.134 まで何が変わった?

【公式発表】 openai/codex GitHub Releases によると、コマンドライン版 0.132〜0.134 は約 1 週間で 3 連発リリースされました。0.132.0 (5/20 01:52 UTC) は Python SDK で Codex を呼ぶときの認証を公式サポート (API キーログイン・device-code フロー)、簡単なテキストワークフローを文字列だけで書ける、構造化出力 (output schema) で再開できる、の 3 点が中核。0.133.0 (5/21 16:48 UTC) は「Goals are now enabled by default」が一番大きく、Goal Mode が CLI でもデフォルト有効化、専用ストレージで進捗保存、remote-control が前面実行、Permission profile に継承と requirements.toml 管理が追加されました。0.134.0 (5/26 19:13 UTC) は会話履歴検索 (大文字小文字区別なし) が新規追加、--profile フラグが CLI / TUI / sandbox の主要セレクタとして統一、MCP 設定がサーバ別環境変数と OAuth に対応、読み取り専用 MCP ツールの並行実行、Windows TUI の描画修正が含まれます。一般読者にとって嬉しいのは 0.134 の会話履歴検索で「先週 Codex に教えてもらったあのやり方どこだっけ」がすぐ見つかる体験です。

Sales Claw との関係は? 「夜中走るエージェント」は本当に安全?

Sales Claw は Codex とは別の OSS ツールで、フォーム営業に特化した「ポリシー制御付き自律運用」を提供しています。Codex Goal Mode と思想は同じ (= 個別承認に頼らず自律実行する) ですが、Sales Claw は営業特化の追加レイヤー (送信前自動検査・営業 NG 検出・CAPTCHA 検出時停止・送信頻度制限・監査ログ保存・特商法フッター自動補完) を OSS としてバンドルしています。「夜中走る」を業務に安全に乗せるには、自動停止条件 (件数 × 時間 × ターン上限の AND) と監査ログ (JSONL ローカル) と送信前自動検査の 3 点セットが必須で、Codex 単体ではこれらを自前で実装する必要があります。【自社検証】 Sales Claw v0.5 では過去 90 日で 3,247 件のフォーム送信、CAPTCHA 遭遇 412 件 (12.7%)、営業 NG 検出 47 パターン、API コスト月約 ¥12,500 で事故ゼロ運用ができていますが、サンプル数は小規模で業界差・季節差は別途検証必要です。【著者見解】 Codex Goal Mode が GA になったことで、Sales Claw のようなドメイン特化 OSS の価値はむしろ上がっていきます。理由は「汎用 AI 道具 (Codex) + 業務特化レイヤー (Sales Claw)」の組合せが今後の標準パターンになると見ているからです。

参考文献

本記事は X 公式アカウントと公式ドキュメントを一次情報として参照しています。

[01]
OpenAI Codex 公式 — Changelog2026-05-26
[02]
openai/codex GitHub Releases — CLI v0.132.0 / v0.133.0 / v0.134.02026-05-26
[03]
OpenAI Codex 公式 — Feature Maturity (Goal Mode GA)2026-05-22
[04]
OpenAI Codex 公式 — Docs Hub2026-05-26
[05]
OpenAI Codex 公式 — CLI Docs2026-05-26
[06]
OpenAI Codex 公式 — App Docs2026-05-21
[07]
OpenAI Codex 公式 — IDE Extension2026-05-21
[08]
OpenAI Newsroom (公式)2026-05-27
[09]
Codex Changelog 公式 X (@Codex_Changelog)@Codex_Changelog·2026-05-26

この記事の著者

中澤圭志

Sales Claw 開発者

Sales Claw の設計・開発を担当。BtoB 営業自動化と AI 活用の実践者として、現場目線で情報発信中。

note

もっと読む

すべての記事