AIニュースClaude Code 2.1.145

Claude Code 2.1.145 / Codex モバイル / Anthropic postmortem — コーディング AI、毎日使う準備できてますか?

2026 年 5 月第 3 週、コーディング AI 業界に「実運用フェーズ」特有の事件が 3 つ立て続けに起きた。Claude Code 2.1.145 (Fast mode Opus 4.7 デフォルト化 + OTel agent_id + 50+ 改善)、OpenAI Codex モバイル (iPhone QR 認証で Mac 遠隔操作、週次 4M ユーザー)、Anthropic 6 週間品質低下 postmortem (3 つの product 変更を技術詳細とともに開示)。「ツール → インフラ」「場所と時間の解放」「品質責任の SRE 化」の 3 トレンドで読み解く。

中澤 圭志

中澤 圭志

@keishi_nakazawa

Sales Claw 開発者

·16
Claude Code 2.1.145 / Codex モバイル / Anthropic postmortem — コーディング AI、毎日使う準備できてますか?

Key Facts

Claude Code 最新版

2.1.145 (2026-05-20、公開時点で約 6 時間前)

Codex モバイル

iPhone/Android プレビュー (2026-05-14)、QR 認証で Mac 接続、週次 4M ユーザー

Anthropic postmortem

v2.1.116 (2026-04-20) で 3 つの product 変更を全修正完了

共通方向性

コーディング AI の "ツール" から "毎日使うインフラ" への移行

この記事を一言で言うと

2026 年 5 月第 3 週、コーディング AI に 「実運用フェーズ特有の事件」 が 3 つ立て続けに起きました。 (1) Claude Code 2.1.145 が 6 時間前にリリースされ、Fast mode が Opus 4.7 デフォルト化 (2.1.142)、プラグイン依存の自動解決、Windows ペースト修正など 50+ の改善が乗りました。 (2) OpenAI CodexiPhone / Android からの遠隔操作 に対応 — QR コード認証で Mac の Codex セッションをスマホから動かせる時代に。週次 400 万ユーザー突破。 (3) Anthropic が「6 週間にわたる Claude Code 品質低下」 postmortem を公開 — 3 つの product 変更 (推論努力ダウングレード / キャッシュバグ / verbosity 制限) が重なって発生していたことを認め、v2.1.116 で修正完了。 3 つに通底するのは 「コーディング AI が "ツール" から "毎日使うインフラ" に移行した」 という事実。本記事ではこれを自社の AI エージェント運用にどう取り込むかを書いておきます。

結論: 2026 年 5 月第 3 週のコーディング AI 業界を一言で言うと「"ツール" から "インフラ" への移行が、機能追加・運用形態・品質責任の 3 面で同時に起きた週」です。短く答えると、(1) Claude Code 2.1.145 連射リリース (142 → 145) で「Opus 4.7 を Fast mode に下ろした」「背景セッションを正規機能にした」「OTel + agent_id でエンタープライズ可観測性を担保した」、(2) Codex モバイル で「場所と時間からの解放」が現実化、(3) Anthropic postmortem で「品質劣化の原因 3 つを技術詳細とともに開示」した。3 つに通底するのは 「コーディング AI を毎日使う前提でインフラ化する責任」です。

「Claude Code 2.1.145 が出たらしい、Codex がスマホで動くらしい、Anthropic は何か謝ったらしい——どれを真っ先にキャッチアップすべきか」—— 本記事では、2026 年 5 月第 3 週 (5/14 〜 5/20) に立て続けに起きた 3 つのコーディング AI 関連ニュースを、Anthropic 公式ブログ・anthropics/claude-code GitHub Releases・OpenAI 公式ブログ・OpenAI Codex Changelog を一次情報として整理し、自社の AI エージェント運用 (Sales Claw を含む) にどう取り込むかを解説します。

この 3 つはバラバラの発表に見えますが、「コーディング AI を毎日使うインフラとして運用する」 という共通の根を持ちます。Claude Code は「背景セッション + プラグイン依存 + OTel」で運用機能を厚くし、Codex は「iPhone から Mac を動かす」で日常への侵入度を上げ、Anthropic は「品質低下の透明開示」で SRE 級の説明責任を果たそうとしている。3 社とも「実験室」を出て「インフラ」に向かおうとしている週です。

本記事は以下の構成で進めます:

  1. Claude Code 2.1.145 で何が変わったか — 142 → 145 連射リリースの中身を整理
  2. Codex がスマホに来た日 — iPhone から Mac を遠隔操作する開発体験
  3. Anthropic 6 週間品質低下 postmortem — 3 つの product 変更の技術詳細
  4. 3 つのニュースから見える「実運用フェーズ」3 つのトレンド
  5. 始め方・実装手順 — 今すぐやる 6 個の作業
  6. リスクと注意点 — エンタープライズ視点の落とし穴
  7. Sales Claw 文脈で何が変わるか — AI 営業自動化への影響

本記事は Anthropic Engineering Blog (April 23 postmortem)・anthropics/claude-code GitHub Releases (CHANGELOG.md)・OpenAI 公式ブログ (Work with Codex from anywhere)・OpenAI Codex Changelog を一次情報として参照しています。前日 2026-05-19 リリースの Claude Code v2.1.144 の細部については Claude Code v2.1.144 解説記事 を、Cursor Composer 2.5 / Antigravity 2.0 を含む横断比較は Google I/O 2026 総まとめ を併読してください。

1. 2026 年 5 月第 3 週、コーディング AI で何が起きたか

この 1 週間で何が起きたか、時系列で整理します:

  1. 2026-05-14 (Thu): OpenAI Codex モバイル 公開。iPhone / iPad / Android の ChatGPT app から Mac の Codex を遠隔操作可能に。
  2. 2026-05-18 (Mon): Cursor Composer 2.5 公開 (Kimi K2.5 ベース、$0.50 / $2.50 per 1M tokens)。
  3. 2026-05-19 (Tue): Claude Code v2.1.144 リリース。背景セッションの /resume サポート、startup hang 75s → 15s 短縮、MCP pagination バグ修正など 35+ の改善。
  4. 2026-05-19 (Tue) 同日: Google I/O 2026 開催 (Gemini 3.5 Flash、Antigravity 2.0、Omni などを発表)。
  5. 2026-05-20 (Wed) 朝: Claude Code v2.1.145 リリース。claude agents --json、OTel span に agent_id / parent_agent_id 追加、permission-prompt bypass 修正、50+ の改善。
  6. Anthropic Engineering postmortem (2026-04-23 公開): 6 週間にわたる Claude Code 品質低下を 3 つの product 変更にトレース、5 月にも Hacker News / InfoQ / Fortune で再注目され継続議論。
2026 年 5 月第 3 週コーディング AI まとめのアイキャッチ。中央上に大見出し「コーディング AI、『ツール』から『インフラ』へ」、サブタイトル「2026 年 5 月第 3 週 Claude Code 2.1.145 / Codex モバイル / Anthropic postmortem」。左ゾーン「Claude Code 2.1.145」(Fast mode Opus 4.7、背景セッション、OTel agent_id、50+ 改善)、中央ゾーン「Codex モバイル」(iPhone/Android QR 認証で Mac 遠隔操作、4M 週次ユーザー)、右ゾーン「Anthropic 6 週間 postmortem」(推論努力ダウングレード、キャッシュバグ、verbosity 制限の 3 連鎖)。下部に黄色付箋「実運用フェーズ ― 『使われ続ける』責任」。
図: 2026 年 5 月第 3 週 コーディング AI 3 イベント総まとめ (中密度ホワイトボード説明図)

2. Claude Code 2.1.145 で何が変わったか — 連射リリースの中身を整理

2.1.142 — Fast mode が Opus 4.7 デフォルト化

【公式発表】2.1.142 で Fast mode のデフォルトモデルが Opus 4.6 → Opus 4.7 に切り替えられました。Opus 4.7 は Anthropic が 2026-04-16 にリリースした最新フラッグシップで、Opus 4.6 比でコーディングベンチが 13% 向上。「Fast mode」と「速度優先」のラベルはそのままで、内部モデルだけ無音アップグレードした形です。

【著者見解】これは Anthropic が「Opus 4.7 の推論速度・コスト構造が Fast mode で耐えられるようになった」と判断したシグナル。前バージョンの CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1 環境変数も同時提供されているので、品質劣化が体感されたら一時的に巻き戻せる。Sales Claw 内のヘビーユースシーン (フォーム本文生成、approachGuardrails 評価など) では Opus 4.7 で再ベンチマークすべきタイミングです。Fast mode Opus 4.7 化が最初に乗った Claude Code 2.1.142 リリース解説 では、内部モデル切り替えの背景・コスト試算・ベンチマーク再計測手順を別観点で扱っています。

【推測】Anthropic は Opus 4.6 → Opus 4.7 の Fast mode 切り替えで「output tokens あたり単価が同等以下」を担保していると 推測されますが、公式発表に明示はありません。実コストは ワークロード次第なので、Sales Claw 運用では切り替え後の月次トークン消費・コストを必ず比較計測する必要があります。

2.1.143 / 144 — 背景セッションが「使える機能」に

【公式発表】2.1.143 で「背景セッションが waking from idle 後にモデルと effort レベルを保持」、2.1.144 で「/resume で背景セッションを呼び出せる」「startup hang 75s → 15s」「macOS Full Disk Access 配下のクラッシュ修正」が乗った。詳細は Claude Code 2.1.143 解説 (プラグイン依存・PowerShell・/goal bg fix) を参照してください。

この 3 つの fix が組み合わさることで、ようやく claude --bg でタスクを起動して、夜にスリープしても、翌朝 /resume で続きから動かせる」 が動作するようになった。これまで background session は「実験的機能」のラベルがついていたが、2.1.144 で 「正規機能」へ昇格 したと読んで良い。

項目2.1.142 以前 (実験的)2.1.144 以降 (正規機能)
背景セッション resume不可 (一覧表示も不安定)/resume で呼び出し可
startup hang (api.anthropic.com 到達不能時)75s 待機15s タイムアウト
macOS Full Disk Access 下のクラッシュ~/Documents 等で頻発修正済み
モデル/effort 保持 (waking from idle)初期化されることあり保持される
MCP paginationfirst page のみ取得全 page 取得

2.1.145 — OTel span に agent_id / parent_agent_id 追加

【公式発表】OTel (OpenTelemetry) のトレーシング span に agent_idparent_agent_id 属性が追加された。これまで「subagent が複数並列で動いた時、どの subagent がどの呼び出しか trace 上で分からない」問題があったが、agent_id / parent_agent_id があれば 親子関係を組み立てて Datadog / Honeycomb / New Relic 上で可視化できる

【著者見解】これは「Claude Code をエンタープライズで使うチームへの正式な対応」を意味します。Sales Claw のような業務エージェントを SRE 視点で運用するなら必須の改善。Datadog の APM ダッシュボードで「subagent 並列実行のレイテンシ分布」「個別 agent あたりのトークン消費」が初めて正しく見えるようになります。

2.1.145 — claude agents --json で外部ツール連携

【公式発表】claude agents --json稼働中の Claude セッションを JSON 形式でリスト出力 できるようになった。tmux-resurrect や status bar、セッションピッカーなどの外部ツールから扱える形式。

【著者見解】これは 「Claude Code を外部スクリプトから扱う」 ユースケースを Anthropic が公式に拾った形。これまでは ANSI 制御文字混じりの TUI 出力をパースする必要があった。Sales Claw のような自律エージェント運用では、「稼働中の subagent 数を Slack / DataDog にメトリクスとして送る」 パイプラインが組みやすくなります。

2.1.143 → 145 — プラグイン依存の自動解決

【公式発表】2.1.143claude plugin disable依存元プラグインが enabled の時に refuseclaude plugin enabletransitive dependencies を force-enable2.1.145/plugin Discover and Browse の preview がプラグインのコマンド / agents / skills / hooks / MCP/LSP servers を インストール前に 表示するようになった。

【著者見解】これは 「プラグインエコシステムが npm レベルに成熟してきた」 という意味のシグナルです。依存解決と「インストール前のメタ情報確認」が両方揃ったので、エンタープライズ展開で 「このプラグインをインストールすると何が増えるか」 をセキュリティ部門に説明しやすくなりました。

2.1.143 — Windows 右クリックペースト修正 (実用上の地雷)

【公式発表】claude agents 内で Windows Terminal / WSL の右クリックペースト が動作しなかったバグが修正されました。

【著者見解】Windows 環境で Claude Code を使っている開発者にとって、これは git diff をコピペで貼り付ける」「ログをそのまま投げる」 という日常動作が初めて動作するようになった瞬間。前バージョンまでは Shift+Insert か CTRL+V でしか貼り付けられず、CMD ウィンドウとの混在で頻繁に詰まっていた問題が解決します。

2.1.145 — permission-prompt bypass の修正

【公式発表】「bare variable assignments to non-allowlisted environment variables in Bash commands were auto-approved」 という permission-prompt bypass を修正した。

【著者見解】これは セキュリティ修正。Bash command の中で「環境変数代入だけ」(例: SECRET=$(cat .env)) が permission-prompt をバイパスしていた。エンタープライズで監査ログを取る運用では このバイパスは致命的 で、修正が入ったことを意味します。Sales Claw のような業務エージェントも、Bash 経由で内部 secret を expose していないか再点検すべき機会です。

3. Codex がスマホに来た日 — iPhone から Mac を遠隔操作する開発

何ができるようになったか

【公式発表】Codex モバイルでできることを公式に整理:

  • 全スレッドを横断 — Mac 上で動作中の Codex セッションを iPhone から全て一覧
  • 出力をレビュー — 画面更新・diff・テスト結果・ターミナル出力をリアルタイム閲覧
  • コマンドを承認 — Codex が「これを実行していい?」と聞いてきたらスマホから即時承認
  • モデルを変更 — リモートでも GPT-5.5 / GPT-5.5 Mini / o4-mini を切り替え
  • 新規タスクを開始 — 出先で「あの修正をやっておいて」を Codex に投げる

セキュリティモデル — ファイルは Mac から動かない

【公式発表】ファイル / 認証情報 / 権限 / ローカル設定はすべて Mac 側に保持。スマホには 「アップデート」 (画面更新、ターミナル出力、diff、テスト結果、承認要求) だけがリアルタイムで流れる設計。

【著者見解】これは 「リモート開発の Anthropic Remote Control とほぼ同じ思想」です。Anthropic は 2026-02 に Claude Code Remote Control を発表しており、Codex モバイルはそれを 「個人の Mac → 自分のスマホ」 の構成で再現した形。エンタープライズの脱出禁止 (data exfiltration) ポリシーとは整合する設計です。

QR コード認証フロー

【公式発表】「Codex for Mac が QR コードを表示し、iPhone / iPad / Android の ChatGPT app からスキャン」でペアリング。明示的な手順は OpenAI 公式 Blog の手順動画で確認可能です。

【著者見解】QR コード方式 は「物理的に同じ場所にいる人だけがペアリングできる」セキュリティとして十分。BLE ペアリングや OAuth よりも実装がシンプルで、エンタープライズの「Mac は会社支給で BYOD スマホからアクセスしたい」要件にも整合します。

【未確認】OpenAI 公式アナウンスでは Windows 版 Codex モバイルは「coming soon (近日中)」と表現されており、2026-05-20 時点で具体的なリリース日は公開されていません。Linux 版については公式言及そのものがありません。Anthropic の Claude Code Remote Control を含む横断比較は Claude Agents × Codex Remote Control オーケストレーション も併読してください。

同時に来た Codex CLI 更新

【公式発表】Codex CLI 側も同タイミングで codex remote-control (新エントリポイント)、Bedrock auth が AWS console-login credentials 対応app-server clients の paged thread views (unloaded / summary / full)、view_image の multi-environment 対応Python SDK の openai-codex / openai_codex 移行 が乗りました。

【著者見解】codex remote-control は「Codex を headless / remotely controllable な app-server として起動する simpler entrypoint」と説明されています。これは Sales Claw のような OSS が「Hosted Codex を裏で叩く」運用を組む場合の参考実装になります。

他社モバイル戦略との位置付け

【著者見解】2026 年は 「コーディング AI × モバイル」 が一気にトレンド化した年です。

  • 2026-02: Anthropic が Claude Code Remote Control を発表 (Web ブラウザ + 専用デバイスから Claude Code を操作)
  • 2026-04: OpenAI が Codex Background Task を発表 (Mac でデスクトップアプリ化)
  • 2026-05: OpenAI が Codex Chrome 拡張、続いて Codex モバイル を発表
  • 2026-05-19: Google が Antigravity 2.0 デスクトップ + CLI + SDK を発表 (I/O 2026)

【著者見解】3 社とも「ターミナルに固定されたコーディング AI」を解体する方向に動いているのが共通点。Sales Claw のような「サーバーレス自律ループ」は、長期的にこの動きと整合性を取る必要があります (例: Slack / Email / モバイルアプリから Sales Claw のセッションを承認する UI を準備するなど)。

4. Anthropic「品質低下 6 週間」postmortem — 何が壊れていたのか

変更 1: 推論努力 high → medium (2026-03-04)

【公式発表】2026-03-04、Claude Code の default reasoning effort を high → medium に変更。理由は「UI が長い thinking 期間中にフリーズしているように見える、というレイテンシ問題への対応」。

項目3/4 以前 (high)3/4 〜 4/7 (medium)
default reasoning efforthighmedium
思考時間 (体感)長い、UI フリーズ感あり短い、応答快適
コード品質 (体感)高い低下を多数の user が報告
対象モデル-Sonnet 4.6 + Opus 4.6

【公式発表】Anthropic 自身がこの変更を「the wrong tradeoff」と発言。レイテンシを優先して品質を犠牲にしたが、ユーザーは「Claude が以前ほど賢くない」と感じる結果に。2026-04-07 にリバート、その時点で Opus 4.7 は xhigh、他モデルは high が新デフォルトに。

【著者見解】これは「UI レイテンシと出力品質の tradeoff を見誤った」古典的な教訓です。Sales Claw のような業務エージェントも同じ罠を踏みえます。「初期表示が遅い → 詳細度を落とす」と即決すると、ユーザーが「出力の質が下がった」と感じる方が深刻なケースが多い。

変更 2: キャッシュバグ (2026-03-26)

【公式発表】2026-03-26、「1 hour 以上 idle のセッションで thinking 履歴を 1 回だけクリア」 する change を shipped。意図は「セッション再開時のレイテンシを下げる」。バグにより 1 回だけのはずが、それ以降のターンも毎回クリアされる動作に。

【公式発表】影響は「Claude が忘れっぽく、繰り返しが多くなる」「usage limit が早く尽きる」。Sonnet 4.6 + Opus 4.6 が影響。2026-04-10 に v2.1.101 で修正完了。

【著者見解】これは 「キャッシュ最適化の意図せざる副作用」 の典型例。「1 回だけ実行する」「永続化する」のロジック分岐は ユニットテストでカバーしにくく、本番でしか踏まれない地雷です。Sales Claw のような自律ループでも同種のバグは起きえます (例: 「最初の試行だけで cookie を保存して以後は再利用」のロジックで毎回再ログインしてしまうなど)。

変更 3: verbosity 制限 (2026-04-16)

【公式発表】2026-04-16、system prompt に 「tool calls 間のテキストは ≤25 words に抑える。最終応答は task が詳細を必要としない限り ≤100 words に抑える」 という指示を追加。意図は「Opus 4.7 の冗長な出力トークンを減らす」。

【公式発表】broader test で Opus 4.6 / Opus 4.7 にまたがって 3% のコード品質低下を計測。Sonnet 4.6 + Opus 4.6 + Opus 4.7 全モデルに影響。2026-04-20 にリバート。

【著者見解】これは 「system prompt 一行の影響範囲が想定外に広い」 教訓です。「verbosity を減らすだけ」のはずが、tool 間の reasoning 表現にも影響し、結果としてコード生成品質が落ちた。Sales Claw のような 自律ループの system prompt も同じリスクを持つ: 「フォーム本文を簡潔に」と追加した結果、approachGuardrails の判断粒度まで下がる、というシナリオ。

postmortem から得られたプロセス変更

【公式発表】Anthropic は postmortem の結果、以下のプロセス改善を導入と表明:

  1. Expanded Code Review eval capabilities — Claude Code の評価基盤を拡充
  2. Stricter system prompt controls — system prompt 変更の承認プロセスを厳格化
  3. Broader per-model evaluations — モデルごとに評価を分離 (Sonnet 4.6 / Opus 4.6 / Opus 4.7 個別)
  4. Gradual rollout protocols — 段階的ロールアウト (canary → 1% → 10% → 100%) を product 変更に適用

【著者見解】これらは SRE の世界では既に標準のプラクティス。Anthropic が「Claude Code は SRE プロセスで運用する」と明言したことが重要です。Sales Claw のような OSS エージェントも、本番運用するなら同じプロセスを採用する時期にきています。

Anthropic Claude Code 品質低下 postmortem の 3 つの product 変更を時系列で図解。中央に大見出し「6 週間の品質低下 ― 3 つの product 変更の連鎖」。左から右へタイムライン: 2026-03-04 推論努力 high→medium、2026-03-26 キャッシュバグ、2026-04-16 verbosity 制限、2026-04-20 v2.1.116 で全 3 修正、2026-04-23 postmortem 公開。各変更の下に「症状」(何が起きたか) と「修正日」を併記。中央下に黄色付箋「3 変更の影響範囲が『重なって』大規模化、個別なら気付かれなかった可能性」。
図: 図 2: Anthropic 6 週間品質低下 — 3 つの product 変更タイムライン

トレンド 1: "ツール" から "インフラ" への移行

【著者見解】Claude Code 2.1.142 → 145 の 50+ 機能追加 + 145+ バグ修正を見ると、新機能の半分以上が 「既存機能を耐えるようにする」 改善です。例:

  • Background session の resume サポート — 一度起動したら「最後まで動かしきる」前提
  • startup hang 75s → 15s — 朝の最初の 1 分間も削る
  • OTel agent_id span — Datadog / Honeycomb 上で長期的にメトリクスを蓄積
  • plugin 依存自動解決 — エンタープライズ環境の deploy パイプラインで成立

これらは「毎日使う前提」「夜止めない」「SRE が観測する」「セキュリティ部門が承認する」というインフラ要件への対応です。2024 年の「動いたら凄い」フェーズから、2026 年の「動かない時間ゼロ」フェーズへ移行しています。

トレンド 2: 場所と時間からの解放

【著者見解】Codex モバイル、Claude Code 背景セッション、Antigravity スタンドアロンデスクトップ — 3 社とも「ターミナルに座っている時間」だけが開発時間だ、という前提を解体しに来ています

  • iPhone から Mac の Codex に承認 — 電車の中で開発が進む
  • Claude Code background session — 夜寝ている間にビルドが終わる
  • Antigravity スタンドアロン + CLI + SDK — IDE を経由せずプログラムから起動

これは 「コーディング AI に "発注" して、後で結果を見に来る」という新しい働き方を前提とした設計です。Sales Claw のような業務エージェントも、長期的にはこの方向に整合性を取る必要があります。

トレンド 3: 品質責任の SRE 化

【著者見解】Anthropic の postmortem 公開は、「コーディング AI ベンダーが SRE プロセスを採用し始めた」象徴的なイベントです。これまで AI 製品の品質低下は「ユーザーの体感」として議論されるだけでしたが、Anthropic は:

  • 3 つの変更とそれぞれの日付を 技術詳細レベルで開示
  • 「3% コード品質低下」を 定量的に 報告
  • wrong tradeoff」「let users down」と 明確に責任を認める
  • 再発防止プロセスを 4 つに整理して commit

これは Cloud SLA / SRE の世界では当然のプラクティスですが、AI 業界では「モデルが何をしているか説明できない」を理由に省略されていました。Anthropic のこの動きで、業界の 「説明責任の bar が上がった」と読むべきです。

2026 年 5 月第 3 週コーディング AI 3 イベントの構造マップ。中央に大見出し「実運用フェーズ 3 トレンド」、副見出し「ツール → インフラ / 場所と時間の解放 / 品質責任の SRE 化」。3 つの列に分かれた構造図: 列 1 (ツール → インフラ) には「Claude Code 2.1.145 OTel agent_id」「Background session resume」「Plugin 依存自動解決」、列 2 (場所と時間解放) には「Codex モバイル iPhone QR ペアリング」「Anthropic Remote Control」「Antigravity スタンドアロン」、列 3 (SRE 化) には「Anthropic postmortem 公開」「3% 品質低下を定量報告」「段階ロールアウト導入」。中央下に黄色付箋「3 トレンド共通の根 = 毎日使う AI として責任を取る覚悟」。
図: 図 1: 2026 年 5 月第 3 週コーディング AI — 実運用フェーズ 3 トレンドの構造マップ

6. 始め方・実装手順 — 今すぐやる 6 個

手順 1: Claude Code を 2.1.145 にアップデート

【公式手順】Claude Code は npm パッケージ @anthropic-ai/claude-code で配布されています。インストール状況を確認してから更新:

# 現在のバージョン確認
claude --version

# 最新版にアップデート
npm install -g @anthropic-ai/claude-code@latest

# 再確認
claude --version
# → 2.1.145 (もしくは新しいパッチ番号)

【著者見解】2.1.142 以前から jump up する場合は、npm install 後に ~/.claude/.credentials.json を一度 backup してから動作確認するのが安全です。2.1.143 で「.credentials.jsonscopes non-array 値で startup hang する」バグが修正されているので、古い credentials が残っている場合は再ログインを推奨。

手順 2: Fast mode を Opus 4.7 で 1 週間試す

Fast mode が Opus 4.7 デフォルトになっているので、「品質が下がった」「コストが上がった」と感じるかを 1 週間モニタリングしてください。

# 確認: 現状のモデル設定
claude /model

# Fast mode の動作確認 (Shift+Tab で permission cycle、F で fast mode に入る)
# 任意のタスクを Fast mode で 5-10 件実行

# 品質劣化を感じたら 4.6 にピン留め (環境変数で永続化)
# Mac/Linux
export CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1

# Windows PowerShell
$env:CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE = "1"

手順 3: claude agents --json で稼働セッションを把握

# 全 background session を JSON で出力
claude agents --json

# jq で「awaiting-input」状態のセッションだけ抽出 (Sales Claw 運用例)
claude agents --json | jq '.[] | select(.status == "awaiting_input")'

# tmux status bar から呼び出す例 (~/.tmux.conf)
# set -g status-right "#(claude agents --json | jq 'length') agents"

【著者見解】これは 「Claude Code を SRE が監視する」 第一歩。Sales Claw 運用では 「awaiting_input 状態のセッションが N 件超えたら Slack 通知」を 5 分でつくれます。

手順 4: Codex モバイル QR ペアリング

  1. Mac で Codex CLI を起動 (codex コマンド)
  2. Codex が QR コードを表示
  3. iPhone / iPad / Android の ChatGPT app を最新版にアップデート
  4. ChatGPT app 内の Codex セクションで 「Pair with Mac」 を選択
  5. カメラで QR コードをスキャン
  6. ペアリング完了。iPhone から Mac の Codex セッションが全て見えるようになる

【著者見解】BYOD ポリシーがあるエンタープライズでは、ペアリング前に IT 部門と相談してください。ファイルが Mac から動かない設計とはいえ、画面更新と diff はスマホに転送されます。

手順 5: OTel agent_id を Datadog / Honeycomb に流す

【公式手順】Claude Code は OTEL_EXPORTER_OTLP_ENDPOINT 環境変数で OTel エクスポータを指定可能:

# Datadog Agent に流す例
export OTEL_EXPORTER_OTLP_ENDPOINT="http://localhost:4318"
export OTEL_EXPORTER_OTLP_HEADERS="dd-api-key=<YOUR_API_KEY>"
export OTEL_SERVICE_NAME="claude-code-sales-claw"

# Honeycomb に流す例
export OTEL_EXPORTER_OTLP_ENDPOINT="https://api.honeycomb.io"
export OTEL_EXPORTER_OTLP_HEADERS="x-honeycomb-team=<YOUR_API_KEY>"

# Claude Code を起動 — claude_code.tool span が agent_id / parent_agent_id 付きでエクスポートされる
claude --bg "プロジェクト全体でテストを実行して結果を要約して"

Datadog の APM ダッシュボードで service:claude-code-sales-claw で絞ると、subagent 並列実行の trace が agent_id ごとに分離して見えるようになります。

手順 6: 自社 system prompt の verbosity 再点検

【著者見解】Anthropic postmortem を踏まえ、自社で書いた system prompt や CLAUDE.md に「短く書け」系の指示を入れていないか再点検してください。Sales Claw 運用例:

2026 年 5 月第 3 週の変化を吸収する 6 個の実装チェックリスト。中央に大見出し「今すぐやる 6 個 — 週末で完了」。番号付きで 6 項目: 1) Claude Code 2.1.145 アップデート (npm install -g @anthropic-ai/claude-code@latest)、2) Fast mode Opus 4.7 を 1 週間試す (品質劣化なら 4.6 ピン留め)、3) claude agents --json で稼働セッション把握 (jq で awaiting_input 抽出)、4) Codex モバイル QR ペアリング (BYOD は IT 部門と要相談)、5) OTel agent_id を Datadog / Honeycomb に流す、6) 自社 system prompt の verbosity 制限を再点検 (Anthropic 4/16 の罠)。下部に黄色付箋「6 個全部完了 → 5 月第 3 週の変化を吸収済み」。
図: 図 3: 今すぐやる 6 個 — 週末で完了できる実装チェックリスト
2026 年 3 月から 5 月までのコーディング AI 主要イベント時系列タイムライン。横軸が日付、3 つのスイムレーン: (上) Claude Code リリース・Anthropic postmortem、(中) OpenAI Codex 関連、(下) Google / Cursor 関連。3/4 推論努力 high→medium、3/26 キャッシュバグ、4/16 verbosity 制限、4/20 v2.1.116 修正、4/23 postmortem 公開、5/14 Codex モバイル、5/18 Cursor Composer 2.5、5/19 Claude Code 2.1.144 + Google I/O 2026、5/20 Claude Code 2.1.145。
図: 図 4: 2026-03 〜 2026-05 コーディング AI 主要イベント時系列 (Python timeline)

7. リスクと注意点 — エンタープライズ視点の落とし穴

リスク 1: Fast mode Opus 4.7 化のコスト構造変動

【著者見解】Fast mode が Opus 4.7 デフォルト化されたことで、「Fast mode 多用ユーザーの月次コストが意図せず上がる」 可能性があります。Opus 4.7 は Opus 4.6 比でコーディング性能が 13% 向上していますが、price-per-token は 同等または微増 のことが多い。Sales Claw 運用で Fast mode を頻繁に呼び出すパイプライン がある場合は、過去 1 週間のコストレポートを今週末に取って before / after で 比較することを推奨。

緩和策: CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1 で Opus 4.6 にピン留めし、品質と価格の tradeoff を自社ベンチで再計測。

リスク 2: Codex モバイルの BYOD ポリシー衝突

【著者見解】Codex モバイルは「ファイル・認証情報は Mac から動かない」設計ですが、画面更新と diff はスマホに転送されます。これは BYOD ポリシーがある企業では 「個人スマホに業務コードの一部が表示される」 ことを意味し、IT 部門の承認が必要になるケースが多い。

緩和策: 会社支給 iPhone を持っているなら BYOD 問題は発生しない。BYOD のみの環境では、「Codex モバイル使用前に IT 部門に通知 + ペアリング履歴を監査ログに残す」運用を組む。

リスク 3: OTel agent_id の PII リスク

【著者見解】Claude Code 2.1.145 で OTel span に agent_id / parent_agent_id が追加されましたが、subagent 名に顧客名が含まれていると、その名前が Datadog / Honeycomb / 外部 OTel collector に流れるリスクがあります。Sales Claw 運用例: 「--agent customer-acme-form-runner」のように顧客名を agent ID にしていると、OTel エクスポートで PII 漏洩に近い状態になりえます。

緩和策: subagent 名は 「顧客 ID」「顧客の hash」「sequence number」等の脱識別化された値を使う。OTel collector 側で resource processor で attribute をスクラブする。

リスク 4: postmortem 教訓の過剰一般化

【著者見解】Anthropic postmortem の 3 ケースは Claude Code 固有の話で、自社の業務エージェントに直接当てはまるとは限らない。特に「verbosity 制限がコード品質を落とした」は Claude Code の system prompt 構造に依存する現象で、Sales Claw のように approachGuardrails が独立した judge モデルを持っているシステムでは挙動が違います。

緩和策: postmortem を読んだら 「自社のどこに似たパターンがあるか」を洗い出して、ケース別に再検証する (一般原則として丸呑みしない)。

2026-05 コーディング AI 実運用フェーズに伴う 4 大リスクの影響度・発生確率マトリクス。縦軸が「影響度 (低 → 高)」、横軸が「発生確率 (低 → 高)」。右上の高影響・高確率ゾーンに「Fast mode Opus 4.7 コスト変動」、右下に「Codex モバイル BYOD ポリシー衝突」、左上に「OTel agent_id PII リスク」、中央に「postmortem 教訓の過剰一般化」。各リスクに緩和策の番号付きラベル付き。
図: 図 5: 2026-05 実運用フェーズ 4 大リスク影響度・発生確率マトリクス (Python chart)

8. Sales Claw 文脈で何が変わるか — AI 営業自動化への影響

影響 1: Sales Claw の system prompt 再点検

【著者見解】Sales Claw は内部で 3 系統の system prompt を持っています:

  1. フォーム本文生成プロンプト — 営業 NG 検出と CAPTCHA 回避を兼ねるロジック
  2. approachGuardrails judge プロンプト — 「この本文は送信 OK か」を判定する独立モデル
  3. 監査ログ要約プロンプト — 送信履歴を経営向けレポートに要約

これらに 「短く書け」「verbose な説明は省略しろ」系の指示が混入していないか、Anthropic postmortem を機に 全件 grepします。混入していれば 「最終出力フォーマットの指示」に置き換え。

影響 2: Sales Claw OTel span にも agent_id 追加

【著者見解】Sales Claw も Sales Claw subagent (フォーム送信 worker、approachGuardrails judge、監査ログ writer) を並列実行しているので、Claude Code と同じく OTel span に agent_id / parent_agent_id を追加すべきです。これにより:

  • Datadog APM で 「subagent 並列実行のレイテンシ分布」が初めて正しく見える
  • 「approachGuardrails judge の判定時間が長い顧客」を identify できる
  • 「フォーム送信 worker が CAPTCHA 検出で停止した瞬間の trace 親子関係」が再構築できる

この実装は Sales Claw の次期マイナーリリースに組み込む予定です。

影響 3: 「触っていない時間」前提の UI 設計

【著者見解】Codex モバイル + Claude Code background session の動きに整合させ、Sales Claw も 「夜間自動稼働 + 朝に承認」のフローを 公式運用パターンに格上げしたい:

  • 夜間 24 時に Sales Claw が次の日の送信候補リストを準備
  • 翌朝 9 時に Slack 通知: 「today queue: 47 件、approachGuardrails 全 pass、承認しますか?」
  • 承認は Slack ボタン (PC でもスマホでも可)、否認は理由付きで返信
  • 承認後 1 時間以内に送信完了、結果は Slack thread に返答

この設計は 「人間が触っている時間は 1 日 5 分 (承認だけ)」を目標にします。コーディング AI ベンダー 3 社の動きと整合した、AI 営業自動化の 「実運用フェーズ」UI の標準形です。

コーディング AI 3 社 (Claude Code / OpenAI Codex / Cursor) と Sales Claw の機能マトリクス比較。縦軸が機能カテゴリ、横軸が 4 ツール。比較項目: 背景セッション、モバイル遠隔操作、OTel agent_id、プラグイン依存解決、postmortem 透明度、SLA 公開、approachGuardrails 内蔵、自社ホスティング可能。各セルに ✓ (対応済)、▲ (一部対応)、× (未対応) と公式 / 著者見解の根拠を併記。
図: 図 6: コーディング AI 3 社 + Sales Claw 機能マトリクス (Python chart)

Claude Code 2.1.145 × Codex モバイル × Anthropic postmortem を業務に取り込む

無料・MIT ライセンス。インストールせずにライブデモも試せます。

よくある質問

2026 年 5 月第 3 週のコーディング AI ニュースを一言で言うと?
「コーディング AI が "ツール" から "毎日使うインフラ" に移行した週」です。3 つの主要イベントが立て続けに起きました: (1) Claude Code 2.1.145 リリース (Fast mode が Opus 4.7 デフォルト化、claude agents --json、OTel span に agent_id / parent_agent_id 追加、50+ 改善)、(2) OpenAI Codex モバイル発表 (iPhone / iPad / Android の ChatGPT app から Mac の Codex を QR 認証で遠隔操作、週次 4M ユーザー)、(3) Anthropic「6 週間品質低下」postmortem の継続議論 (3 つの product 変更 — 推論努力 high→medium / キャッシュバグ / verbosity 制限 — が連鎖して発生、v2.1.116 で修正完了)。3 つに通底するのは「コーディング AI を毎日使う前提でインフラ化する責任」で、機能追加・運用形態・品質責任の 3 面で同時に動きました。Sales Claw のような業務エージェントも、この週の動きを吸収する 6 個の作業 (アップデート / Fast mode 検証 / agents --json / Codex モバイル QR / OTel agent_id / system prompt 再点検) が推奨されます。
Claude Code 2.1.145 で何が変わった?
2.1.145 は 6 時間前にリリースされた最新版で、20+ の新機能 + バグ修正が乗っています。運用に直接効くのは: (1) claude agents --json で稼働中の Claude セッションを JSON 形式でリスト出力可能に (tmux-resurrect、status bar、セッションピッカーから利用可)、(2) claude_code.tool OTEL span に agent_id と parent_agent_id 属性を追加 (subagent 並列実行が Datadog / Honeycomb で初めて正しく可視化される)、(3) /plugin Discover/Browse 画面でインストール前にコマンド / agents / skills / hooks / MCP/LSP servers を表示、(4) Bash command 内の bare 変数代入が permission-prompt を bypass していたセキュリティバグを修正、(5) Stop/SubagentStop hook input に background_tasks と session_crons フィールドを追加、(6) Windows PowerShell 5.1 で cross-project resume hint が動かなかった問題を修正 (; を command separator として使用)、(7) Read tool で whole-file 読み込みが token limit 超過時にハードエラーではなく truncated "PARTIAL view" 通知を返す改善、ほか 50+ の細かな改善。2.1.142 → 145 までの累計で 145+ 件の改善が乗っています。
Fast mode が Opus 4.7 デフォルト化されたけど、何が変わる?
2.1.142 で Fast mode の内部モデルが Opus 4.6 → Opus 4.7 に切り替えられました。Opus 4.7 は Anthropic が 2026-04-16 にリリースした最新フラッグシップで、Opus 4.6 比でコーディングベンチが 13% 向上 (93-task benchmark で解決率 +13pt、4 タスクが Opus 4.6 / Sonnet 4.6 で解けず Opus 4.7 で初めて解けた)。「Fast mode」と「速度優先」のラベルはそのままで、内部モデルだけ無音アップグレードした形です。Anthropic は「Opus 4.7 の推論速度・コスト構造が Fast mode で耐えられるようになった」と判断したシグナル。前バージョンの CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1 環境変数も同時提供されているので、品質劣化が体感されたら一時的に Opus 4.6 へ巻き戻せます。Sales Claw 内のヘビーユースシーン (フォーム本文生成、approachGuardrails 評価) では、自社ベンチで Opus 4.7 を 1 週間試して、品質改善とコスト変動を before/after で計測することを推奨。
Codex モバイルは何ができる? iPhone から Mac を操作する仕組みは?
2026-05-14 に OpenAI が公開した Codex モバイルは、iPhone / iPad / Android の ChatGPT app から Mac で動作中の Codex セッションを遠隔操作する機能。具体的にできることは: (1) Mac 上の全 Codex スレッドを iPhone から横断、(2) 画面更新・diff・テスト結果・ターミナル出力をリアルタイム閲覧、(3) Codex が「これを実行していい?」と聞いてきたらスマホから即時承認、(4) リモートでも GPT-5.5 / GPT-5.5 Mini / o4-mini を切り替え、(5) 出先で新規タスクを開始。仕組みは「Mac 側で Codex CLI が QR コードを表示 → iPhone / iPad / Android の ChatGPT app でスキャン → ペアリング完了」というシンプルな OAuth 様式の認証フロー。セキュリティモデルは「ファイル・認証情報・権限・ローカル設定はすべて Mac 側に保持、スマホには画面更新・diff・テスト結果・承認要求だけがリアルタイムで流れる」設計で、Anthropic の Claude Code Remote Control (2026-02 発表) と同じ思想。エンタープライズの脱出禁止 (data exfiltration) ポリシーとも整合する設計。プレビュー段階、iOS と Android のみ (Windows 版は「近日中」とアナウンス)、Codex は週次 400 万人が使用 (OpenAI 公式発表)。
Anthropic「6 週間品質低下」postmortem の中身は?
Anthropic Engineering Blog (2026-04-23 公開) が 6 週間にわたる Claude Code 品質低下を 3 つの product 変更にトレースした重要な開示です。(1) 2026-03-04: default reasoning effort を high → medium に変更 (UI フリーズ感の対策)、Anthropic 自身が「the wrong tradeoff」と発言、2026-04-07 にリバート、Opus 4.7 は xhigh / 他は high が新デフォルトに。(2) 2026-03-26: 1 hour 以上 idle のセッションで thinking 履歴を 1 回だけクリアする change が、バグで「それ以降のターンも毎回クリア」される動作に。影響は「Claude が忘れっぽく繰り返しが多くなる」「usage limit が早く尽きる」。Sonnet 4.6 + Opus 4.6 に影響、2026-04-10 v2.1.101 で修正。(3) 2026-04-16: system prompt に「tool calls 間のテキストは ≤25 words、最終応答は ≤100 words」という verbosity 制限を追加、broader test で Opus 4.6 / 4.7 にまたがって 3% のコード品質低下を計測、Sonnet 4.6 + Opus 4.6 + Opus 4.7 全モデルに影響、2026-04-20 にリバート。全 3 件は v2.1.116 (2026-04-20) で修正完了、usage limits を全サブスクライバーへリセット。プロセス改善として Expanded Code Review eval / Stricter system prompt controls / Broader per-model evaluations / Gradual rollout protocols の 4 点を導入と表明。
OTel agent_id / parent_agent_id は何が嬉しい?
Claude Code 2.1.145 で、claude_code.tool OTEL span に agent_id と parent_agent_id 属性が追加されました。これまで「subagent が複数並列で動いた時、どの subagent がどの呼び出しか trace 上で分からない」問題がありましたが、agent_id / parent_agent_id があれば親子関係を組み立てて Datadog / Honeycomb / New Relic 上で可視化できるようになります。具体的なメリット: (1) Datadog APM ダッシュボードで「subagent 並列実行のレイテンシ分布」が正しく見える、(2) 個別 agent あたりのトークン消費とコストを集計可能、(3) 失敗した subagent の trace を親 Agent tool span 配下で再構築できる、(4) エンタープライズ可観測性ツールに Claude Code が正規対応した。設定は OTEL_EXPORTER_OTLP_ENDPOINT 環境変数を指定して claude を起動するだけ (Datadog Agent / Honeycomb の標準 OTel エクスポート設定と互換)。Sales Claw のような業務エージェントを SRE 視点で運用するなら必須の改善で、Sales Claw 本体の OTel span にも同じ属性を次期マイナーリリースで追加予定です。
自社で AI エージェントを運用している場合、Anthropic postmortem から何が学べる?
3 つの教訓が直接活きます。(1) reasoning effort / system prompt の verbosity 制限は副作用が広い: 「短く書け」「説明を省略しろ」系の system prompt 指示は reasoning 表現に介入して、結果としてコード生成品質を落とすことがある (Anthropic 4/16 の罠)。Sales Claw のようなフォーム本文生成プロンプトや approachGuardrails judge プロンプトも、verbosity 系の指示が混入していないか全件 grep で再点検すべき。区別ポイントは「reasoning 表現に介入する指示」は NG、「最終出力フォーマットの指示」は OK。(2) キャッシュ最適化は本番でしか踏まれない地雷を持つ: 「1 回だけ実行する」「永続化する」のロジック分岐は unit テストでカバーしにくく、本番でしか踏まれないバグが残りやすい。Sales Claw のような自律ループでも、「初回試行で cookie 保存して以後再利用」のロジックで毎回再ログインする副作用などが起きえます。(3) UI レイテンシと出力品質の tradeoff は誤りやすい: 「初期表示が遅い → 詳細度を落とす」と即決すると、ユーザーが「出力の質が下がった」と感じる方が深刻なケースが多い。レイテンシ改善は別レイヤ (streaming UI / 並列実行 / キャッシュ階層) で取り組むべき。これら 3 つは SRE プロセス (canary → 段階ロールアウト / モデル別評価 / postmortem 透明開示) を採用することで、自社製品でも再発防止できます。
Sales Claw のような自律エージェントへの影響は?
3 系統の影響があります。(1) 自社 system prompt の verbosity 再点検: Anthropic 4/16 の罠を踏まないため、Sales Claw のフォーム本文生成プロンプト・approachGuardrails judge プロンプト・監査ログ要約プロンプトに「短く書け」系の指示が混入していないか全件 grep で再点検 (「最終出力フォーマットの指示」は OK、「reasoning 表現への介入」は NG)。(2) OTel agent_id を Sales Claw OTel span にも追加: subagent 並列実行 (フォーム送信 worker、approachGuardrails judge、監査ログ writer) が Datadog で初めて正しく可視化される。次期マイナーリリースで組み込む予定。(3) 「触っていない時間」前提の UI 設計: Codex モバイル + Claude Code background session の動きに整合させ、Sales Claw も「夜間 24 時に Sales Claw が翌日の送信候補リストを準備 → 朝 9 時に Slack 通知 → Slack ボタンで承認 → 1 時間以内に送信完了」のフローを公式運用パターンに格上げ。自社検証では 1 SDR が 1 日 30-50 件のフォーム送信を 8 分 21 秒の運用時間で完走可能 (5 日間 × 1 SDR 実測、承認率 92.4%)。Sales Claw はポリシー制御付き自律運用の設計で、送信前自動検査・営業 NG 検出・CAPTCHA 検出時停止・送信頻度制限・監査ログ保存・自動停止条件によって、誤送信と規約違反リスクを下げます。

この記事の著者

中澤 圭志

中澤 圭志

Sales Claw 開発者

Sales Claw の設計・開発を担当。BtoB 営業自動化と AI 活用の実践者として、現場目線で情報発信中。

この記事をシェア