業界トレンドAI エージェント

AI エージェントって結局なに？一言で言える人がいない理由と、2026年5月時点の主な10種を一般読者向けに整理

AI エージェントとは「指示すると自分で考え、ツールを使い、複数ステップの作業を最後までやり遂げる AI」。一言で言える人がいないのは「自律度・ツール使用・対象タスク」の 3 軸で会社ごとに定義が違うから。実用上は Reactive / Tool-use / Autonomous の 3 段階で理解するのが正解。2026年5月時点の主要10種・無料で試す手順・5 つのリスク・営業文脈まで一般読者向けに整理。

中澤圭志

@keishi_nakazawa

Sales Claw 開発者

2026年5月17日·13 分

AI エージェントって結局なに？一言で言える人がいない理由と、2026年5月時点の主な10種を一般読者向けに整理

Key Facts

一言定義

自分で考え、ツールを使い、複数ステップをやり遂げる AI

3 段階

Reactive / Tool-use / Autonomous の自律度グラデーション

主要プロダクト

Claude Code・Codex・Devin・Copilot Agent・Atlas Agent ほか

無料で試す

ChatGPT 無料 + Web 検索 / Claude.ai + MCP

DATA— まず前提（聞きなれない言葉を 30 秒で整理）

AI エージェント (AI Agent): 「指示すると自分で考えて、必要に応じてツールを使い、複数ステップの作業を最後までやり遂げる AI」の総称。ふつうの ChatGPT が「質問 → 1 回答えて終わり」なのに対し、エージェントは「質問 → 計画 → ツール実行 → 結果確認 → 次のステップ」を繰り返します。
ツール使用 (Tool Use / Function Calling): AI が 外部のソフトやサービスを「呼び出して」結果を受け取る仕組み。検索エンジンを叩く、ファイルを書く、メールを送る、ブラウザを操作するなどが含まれます。これがないと AI は会話の中だけで完結し、エージェントとは呼ばれません。
自律 (Autonomy / Autonomous Loop): AI が人間にいちいち聞かずに「自分で次の行動を決めて実行し続ける」こと。高自律 (任せきりに近い形)、ポリシー制御付き自律 (重要操作だけ人間に確認)、対話的 (毎回確認) とグラデーションがあります。
MCP (Model Context Protocol): AI エージェントに 「使える道具」を渡すための共通規格。 2024 年に Anthropic が提案し、現在は OpenAI / Google も対応。これがあるおかげで、 1 つのエージェントに Slack・GitHub・カレンダーなど多数のツールを後から追加できます。
承認 (Approval) / ガードレール (Guardrails): エージェントが重要な操作 (ファイル削除・送信・支払いなど) を実行する前に、人間に「これやっていい?」と確認する仕組み。完全に任せきりにすると事故が起きるので、ほぼ全ての実用エージェントに何らかの承認層が入っています。

「『AI エージェント』ってよく聞くけど、結局なに?」「ChatGPT と何が違うの?」「Claude も Copilot も『エージェント』って言ってるけど、全部同じもの?」—— 本記事では、2026 年に入って一気に普及した 「AI エージェント」という言葉を、 AI に詳しくない人向けに整理します。Anthropic / OpenAI / Google / Microsoft の公式定義を一次情報として参照しながら、なぜ一言で言える人がいないのかと実用上どう区別すればいいかを解説します。

INSIGHT— この記事の対象読者

「AI エージェント」というワードを最近よく聞くが、定義が曖昧で困っているふつうのビジネスパーソン
ChatGPT は使っているが、Claude / Codex / Devin / Copilot Agent などの違いが分からない方
社内で「AI エージェント導入」の話が出ているが、何を選べばいいか比較軸がない方
マーケター・SaaS 担当・経営者など、非エンジニア視点で全体像を掴みたい方
営業・調査・業務自動化で「エージェント型のツール」を検討している方

扱わないこと: 各エージェントの細かい技術仕様 / プロンプトエンジニアリングの詳細 / マルチエージェント研究の論文レビュー / 個別ツールの導入手順 (別記事あり)

本記事は Anthropic 公式「Building Effective Agents」・OpenAI Agents Platform Docs・ Google Gemini Agents Whitepaper・Microsoft Copilot Studio Docsを一次情報として参照しています。個別ツールの解説は Claude Code スラッシュコマンド完全ガイドや Codex Mobile 一般読者向け解説を、エージェントを動かす共通規格は MCP 完全ガイドを、ブラウザ × AI 全体像は ChatGPT Atlas 一般読者向け解説を併読してください。

1. AI エージェントとは — 一言で言うと「自分で手を動かす AI」

AI エージェント定義の中密度ホワイトボード説明図。中央上に大見出し「AI エージェントって結局なに?」、サブタイトル「一言で言うと『自分で手を動かす AI』」。中央に大きな視覚メタファー (LLM の脳 + 3 本の手: 左手にツール、右手にメモ帳、下に自律ループの矢印)。左ゾーン「ふつうの AI チャット」(質問 / 1 回答えて終わり / 手を持たない / ChatGPT 通常版の 4 要素)、右ゾーン「AI エージェント」(目標 / 計画 / ツール実行 / 結果確認 / 次のステップの 5 要素)。中央下に黄色付箋ハイライト「定義は会社ごとにバラバラ / 3 段階で理解するのが正解」。 — 図: AI エージェントとは — ふつうの AI チャットとの違いを示す中密度ホワイトボード説明図

AI エージェント (AI Agent) を、いちばん身近な比喩で説明します。ふつうの ChatGPT は「教科書を読み上げてくれる先生」のような存在で、質問すると答えを返してくれますが、自分で図書館に資料を取りに行ったり、ノートに書き留めたりはしません。一方、AI エージェントは 「研究助手」のような存在で、「来週の会議資料を作って」と頼むと、自分で資料を探し、要約し、PowerPoint を開いてスライドを並べる、というところまでやろうとします。

この「自分で手を動かす」性質を支えているのが、ツール使用 (Tool Use)・記憶 (Memory)・自律ループ (Autonomous Loop)の 3 つの機能です。LLM (Claude / GPT / Gemini など) を頭脳として、これら 3 機能を組み合わせると、ようやく「エージェント」と呼べるものになります。 Anthropic 公式は次のように定義しています。

翻訳すると 【公式発表】 「エージェントとは、LLM が自身の処理とツール使用を動的に方向づけ、タスクをどう達成するかのコントロールを保つシステムである」。重要なのは 「dynamically direct (動的に方向づける)」の部分で、人間が毎ステップ指示するのではなく、AI 自身が「次は何をすべきか」を決める点がふつうの AI チャットとの境界線です。

なぜ 2026 年に急に流行ったのか

【著者見解】 AI エージェントは概念としては 2020 年代前半から研究されていましたが、実用レベルに到達したのは 2024 年後半〜 2025 年です。背景には 3 つの技術的飛躍があります。 (1) LLM の長文脈化 (Claude 3.5 Sonnet で 200K トークン、Gemini 2 で 1M+ に到達)、 (2) ツール使用 API の標準化 (OpenAI Function Calling → MCP の登場)、 (3) 推論能力の向上 (Claude Opus 4 / GPT-5 系で「複数ステップ計画」が安定)。この 3 つが揃ったことで、2025 年に Devin / Replit Agent / Claude Code / Codex が実用レベルで登場し、2026 年に「AI エージェント元年」と呼ばれる普及期に入りました。

AI エージェント主要プロダクト登場タイムライン 2023-2026。横軸 2023 H1 から 2026 H1 まで半期単位。マーカー: 2023 H1 GPT-4 Function Calling (Reactive→Tool-use の起点)、2024 H1 ChatGPT Custom GPTs、2024 H2 Anthropic MCP / Cursor Agent / Devin preview、2025 H1 Claude Code 1.0 / Replit Agent / Codex CLI、2025 H2 ChatGPT Agent / Microsoft Copilot Agent / Salesforce Agentforce、2026 H1 Claude Code 2.x 安定化 / Codex Mobile / ChatGPT Atlas Agent mode / Perplexity Comet。色分け: コーディング系 = 青、業務自動化系 = 緑、ブラウザ系 = 橙。注釈に「2024 H2 が分岐点 = MCP 登場 + 推論モデル安定」。 — 図: 図: AI エージェント主要プロダクトの登場タイムライン (2023-2026, Python 図解)

2. なぜ「一言で言える人がいない」のか — 定義が割れる 3 つの理由

AI エージェント定義が割れる 3 つの理由の高密度ホワイトボード説明図。中央上に大見出し「『AI エージェント』の定義が会社ごとに違う 3 つの理由」。番号付き 3 ゾーン: (1) 自律度の解釈が違う (高自律 (任せきりに近い形) / 半自律 / 対話型のどこからエージェントと呼ぶか各社で違う)、(2) ツール使用の範囲が違う (1 つのツールでもエージェントと呼ぶ会社、複数ツール必須の会社)、(3) 対象タスクが違う (コーディング専用 / 業務自動化全般 / カスタマーサポートなど領域が違う)。下部に「Anthropic は workflow ⇔ agent を厳格に区別、OpenAI は agentic system 全体を Agents Platform と呼ぶ、Microsoft は Copilot Agent を生成型ツールと位置付け」の比較表。右下に黄色付箋「定義の混乱は『新興市場あるある』」。 — 図: 図 1: AI エージェント定義が割れる 3 つの理由 (高密度ホワイトボード説明図)

理由 1: 「自律度」の解釈が違う

1 つ目の理由は 自律度 (Autonomy) の解釈です。AI が「自分で次の行動を決めて実行する」と言っても、(a) 完全に任せきり (Autonomous)、(b) 重要な操作だけ人間に確認 (Human-in-the-loop)、(c) 毎ステップ確認 (Interactive) と段階があり、どこからを「エージェント」と呼ぶかは会社ごとに違います。

Anthropic 公式はこの境界線に厳格で、「workflow (毎ステップ人間が方向を決める)」と「agent (LLM が自身で方向を決める)」を明確に区別しています。一方OpenAIは「ChatGPT も Agent も Codex も全部 Agents Platform」として広く括り、Microsoftは Copilot Studio で作る生成型ツールを全部「Copilot Agent」と呼んでいて、自律度の境界線は曖昧です。

理由 2: 「ツール使用」の範囲が違う

2 つ目の理由は ツール使用 (Tool Use) の範囲です。ツールを 1 つでも使えばエージェントと呼ぶ会社もあれば、「複数のツールを動的に組み合わせて使えること」を条件にする会社もあります。

たとえば RAG (検索拡張) を 1 つだけ使う ChatGPT をエージェントと呼ぶかどうかは人によって意見が分かれます。Anthropic は「LLM の augmented (拡張) 状態」とは呼びますが、「agent」とは呼びません。一方、多くの SaaS ベンダーは「検索付き ChatGPT = エージェント型 AI」と宣伝しており、ここに認識の溝があります。

理由 3: 「対象タスク」が違う

3 つ目の理由は 対象タスク (Domain) の違いです。同じ「AI エージェント」と言っても、Claude Code / Codex / Devin はコーディング専用、 Microsoft Copilot Agent は業務自動化全般、Salesforce Agentforce はカスタマーサポート、と対象領域が違います。対象が違うエージェント同士を「同じ AI エージェント」として比較するから、議論が噛み合わない、という構図です。

会社	「AI エージェント」の使い方	特徴
Anthropic	workflow ⇔ agent を厳格に区別	「LLM が自分で方向を決める」場合のみ agent
OpenAI	Agents Platform で広く括る	ChatGPT Agent / Codex / Assistants API すべて
Google	Gemini Agents Whitepaper で定義	「目標達成のために外部世界を観察・行動」
Microsoft	Copilot Agent ≒ 生成型業務ツール	Copilot Studio で作るもの全部
Salesforce	Agentforce = カスタマー対応 AI	顧客接点に特化したエージェント

【著者見解】 定義の混乱は「新興市場あるある」で、AI エージェントもまさにこの段階です。 2024 年の RAG、2023 年のプロンプトエンジニアリングも、最初の 1〜2 年は会社ごとに定義がバラバラでした。1〜2 年すると業界で定義が収束していく傾向にあるので、2027 年頃にはある程度標準化されると見込まれます。

3. 「AI チャット」「自動化ツール」との違い — 図で整理

AI チャット (ChatGPT) との違い

ふつうの ChatGPT は、ユーザーがメッセージを送ると 1 回返事して終わりです (会話履歴は持つが、自分から外に出て行かない)。ファイルを書く / コマンドを実行する / Web を操作するといった「手」を持っていません。

対して AI エージェントは、ツール (関数) を呼び出す権限を持っています。たとえば「来週月曜の会議資料を Slack に送って」と頼むと、エージェントは (1) カレンダー API で来週月曜の会議を検索 → (2) 過去資料を Google Drive で検索 → (3) 要約を作って PowerPoint に変換 → (4) Slack API で送信、という複数ステップを自分で計画して実行します。

自動化ツール (Zapier / RPA) との違い

Zapier や UiPath のような自動化ツール (RPA) は、人間が 手順を 1 つ 1 つ明示的に設定しないと動きません。「もしメールが来たら → スプレッドシートに行を追加 → Slack に通知」のようなフローを事前に組む必要があります。手順の途中で例外が起きると止まります。

AI エージェントは 「目標」だけ渡せば、手順は自分で考えます。例外が起きても、「じゃあこっちの方法で試してみよう」と動的に方向転換できるのが大きな違いです。ただし「決まりきった単純作業」は、RPA のほうが安く・速く・安定して動きます。 AI エージェントは「探索が必要な作業」「毎回少し違う作業」に向く設計です。

項目	AI チャット (ChatGPT)	自動化ツール (Zapier / RPA)
入力	質問・指示・会話	事前定義されたトリガー (例: メール受信)
出力	テキスト・コード・画像 (会話のみ)	API 呼び出し・ファイル操作・通知
柔軟性	高い (どんな質問にも答えようとする)	低い (決められた手順しか実行しない)
コスト	安い (会話 1 回ずつ)	中 (月額サブスク)
AI エージェントとの違い	エージェントは「手を持つ」点が違う	エージェントは「手順を自分で考える」点が違う

図にすると、AI チャット ←→ AI エージェント ←→ 自動化ツールというグラデーションになっていて、AI エージェントはその中間で「会話の柔軟性」と「機械的な実行力」を兼ね備えた存在、と理解するのがいちばん分かりやすいです。

4. AI エージェントの 3 段階 — Reactive / Tool-use / Autonomous

AI エージェント 3 段階の高密度ホワイトボード説明図。中央上に大見出し「AI エージェントは 3 段階で理解する — Reactive / Tool-use / Autonomous」。番号付き 3 ステージで、(1) Reactive (反応型): 質問されたら答えるだけ、ツールなし、ChatGPT 通常版が代表例、自律度ゼロ、(2) Tool-use (ツール使用型): 検索・ファイル操作・API 呼び出しを使う、複数ステップを自分で実行、Claude/ChatGPT Agent/Microsoft Copilot Agent が代表例、半自律、(3) Autonomous (自律型): 目標だけ渡すと自分で計画・実行・修正を繰り返す、Claude Code/Codex/Devin/Replit Agent が代表例、高自律。右側に「自律度↑ + ツール権限↑ + リスク↑」の矢印。下部に黄色付箋「ふつうの人は (2) Tool-use 型から触るのが安全 / 段階を上げるほど監視が必要」。 — 図: 図 2: AI エージェント 3 段階フレーム (高密度ホワイトボード説明図)

段階 1: Reactive (反応型) — ふつうの ChatGPT

最も基本的なレベルです。ユーザーが質問すると、AI が答える。それだけ。ツールは持たず、外の世界には影響を与えません。ChatGPT 通常版 / Claude.ai のチャット / Gemini Webなどがこの段階に該当します。厳密には「AI エージェント」と呼ぶには物足りませんが、議論の出発点として位置付けます。

段階 2: Tool-use (ツール使用型) — 半自律

AI が ツール (検索エンジン / ファイル操作 / API 呼び出し / 計算機 / ブラウザ)を使えるようになると、エージェントとしての性質が現れ始めます。ユーザーが「来週の天気を踏まえて週末プラン作って」と頼むと、エージェントは天気 API を呼び出し → 結果を踏まえてプランを生成、という複数ステップを自分で実行します。

代表例は ChatGPT Agent (2026-05 時点で Plus/Pro/Business 限定)、Claude with MCP、Microsoft Copilot Agent、ChatGPT Atlas Agent mode (前述記事参照) など。 Tool-use 型は「人間が目標を渡し、AI が手順を考える」という形で、まだ人間が会話の主導権を持っています。

段階 3: Autonomous (自律型) — 高自律

最も「エージェントらしい」レベルです。ユーザーが 目標を渡すと、AI が計画 → 実行 → 結果確認 → 修正 → 次のステップを自律ループで回します。人間は重要な分岐点 (例: ファイル削除・送信・支払い) でだけ承認を求められます。

代表例は Claude Code、Codex、Devin、Replit Agent、Cursor Composer、Aiderなど。いずれもコーディング領域に特化しており、「このリポジトリのバグを修正して PR を出して」のような大粒度の目標を渡すと、数分〜数時間かけて作業を進めます。

【著者見解】 Autonomous 型は便利さの裏返しでリスクも上がります。ファイル削除・git push --force・支払いなどの破壊的操作を AI が自律的に実行すると、事故が起きたときの回復が困難です。 Anthropic / OpenAI ともに「ポリシー制御付き自律」(重要操作のみ人による承認) を推奨しており、実用エージェントの多くはこの形に落ち着いています。高自律 (任せきりに近い形) を売りにするベンダーには、エンタープライズ用途では慎重な評価が必要です。

5. 2026 年に流行ってる主な AI エージェント 10 種

エージェント	対象タスク	自律度	対応プラン例
Claude Code	コーディング (CLI)	Autonomous	Claude Pro / Max
Codex	コーディング (CLI / Web / Mobile)	Autonomous	ChatGPT 全プラン
Devin	コーディング (Web)	Autonomous	Cognition 月額
Replit Agent	フルスタック開発 (Web)	Autonomous	Replit Core/Teams
Cursor Composer	コーディング (IDE)	Autonomous	Cursor Pro
ChatGPT Agent	業務リサーチ・タスク代行	Tool-use	ChatGPT Plus/Pro/Business
Microsoft Copilot Agent	業務自動化 (Office / Teams 連携)	Tool-use	Microsoft 365 Copilot
Salesforce Agentforce	カスタマーサポート	Tool-use	Salesforce 上位プラン
ChatGPT Atlas Agent mode	ブラウザ自動操作	Tool-use	ChatGPT Plus/Pro/Business
Perplexity Comet	ブラウザ自動操作 + リサーチ	Tool-use	Perplexity Pro

【著者見解】 この表から見える 3 系統は 「コーディング系 (Autonomous 寄り)」「業務自動化系 (Tool-use 寄り)」「ブラウザ系 (Tool-use 寄り)」です。ふつうのビジネスパーソンが触りやすいのは業務自動化系とブラウザ系で、まずは ChatGPT Agent や Microsoft Copilot Agent から慣れていくのが現実的です。コーディング系はエンジニア向けで、業務代替するというより「エンジニアの生産性を 2〜10 倍にする」性質のツールです。

DATA— 社内検証メモ (Sales Claw 開発チーム、2026-05 中旬、4 エージェントを同一タスクで比較、サンプル数 12 セッション)

📌 検証条件: M2 MacBook Air / 同一タスク「Sales Claw リポジトリの README を読んでテストを 1 本追加して PR を出す」を 4 エージェントで実行。プランは全て Pro 相当 (Claude Pro / ChatGPT Plus / Cursor Pro / Replit Core)
📌 期間: 2026-05-10 〜 2026-05-16 の 7 日間、合計 12 セッション (各エージェント 3 セッション)
✅ Claude Code: 3 セッション中 3 件で PR 完成、平均 18 分、awaiting_approval が 1 セッションあたり平均 4 回発火 (subagent goal モード活用、Hooks で監査ログ自動保存)
✅ Codex CLI: 3 件中 3 件で PR 完成、平均 21 分、per-command 承認は 1 セッション平均 6 回 (バッチ処理で event-loop が安定)
⚠️ Cursor Composer: 3 件中 2 件完成、1 件は CAPTCHA 検出のような外部要因で停止、平均 14 分 (IDE 統合の良さは抜群)
⚠️ Replit Agent: 3 件中 2 件完成、1 件は環境セットアップで詰まる、平均 26 分 (ブラウザ完結のメリットは大きい)
💡 推奨運用: タスク粒度ごとに使い分け、小修正は Cursor、本格 PR は Claude Code / Codex、エンタープライズの並列バッチは Codex Cloud (将来) というのが現時点の結論

※ 上記は Sales Claw 開発チーム 1 ユーザー × 12 セッションの小規模検証で、サンプル数は小さい点にご注意ください。エンタープライズ環境やコンプライアンス要件が厳しい組織での再現性は別途検証が必要です。【著者見解】を含みます。

2026 年 AI エージェント 10 種の散布図。横軸は対象タスク (コーディング / 業務自動化 / ブラウザ操作)、縦軸は自律度 (Reactive / Tool-use / Autonomous)。バブルサイズはユーザー規模の目安。Claude Code / Codex / Devin / Replit Agent / Cursor は右上 (コーディング × Autonomous) に集中、ChatGPT Agent / Microsoft Copilot Agent / Salesforce Agentforce は中央 (業務自動化 × Tool-use)、ChatGPT Atlas Agent mode / Perplexity Comet は右 (ブラウザ × Tool-use)。注釈に「2026-05 時点 / 各社公式 Docs ベース / バブルサイズは推定」。 — 図: 図 3: 2026 年 AI エージェント 10 種の対象タスク × 自律度マップ (Python 図解)

6. はじめる手順 — ふつうの人が今日無料で試す 3 ステップ

AI エージェントを今日試す 3 ステップの高密度ホワイトボード説明図。中央上に大見出し「ふつうの人が AI エージェントを今日試す 3 ステップ」。番号付き 3 ゾーン: (1) 無料で触れる Tool-use 型を選ぶ (ChatGPT 無料版の Web 検索機能 / Claude.ai の MCP 連携 / Microsoft Copilot 無料枠のいずれか)、(2) 目標型タスクを与える (例: 来週の天気踏まえて週末プラン作って / 競合 3 社サイトを比較表にして)、(3) 結果を観察 + 修正指示する (どこを自分で考えたか / どこでツールを使ったか / 何が惜しかったかを確認)。下部に黄色付箋ハイライト「いきなり Autonomous 型は手を出さない / 重要データは渡さない / 試行錯誤の感覚を掴む」。 — 図: 図 4: AI エージェントを今日試す 3 ステップ (高密度ホワイトボード説明図)

ステップ 1: 無料で触れる Tool-use 型を選ぶ

いま無料で試せる Tool-use 型エージェントは複数あります:

ChatGPT 無料版の Web 検索 + ChatGPT Search: Web 検索ツールを内蔵、回答の根拠リンクが出る
Claude.ai 無料版 + MCP 連携: Claude Desktop に MCP サーバを足すと、ファイル操作・GitHub 連携などができる
Microsoft Copilot 無料枠: Bing 検索 + 画像生成 + 簡易リサーチが無料で使える
Perplexity 無料版: 検索特化、Pro Search で複数ステップのリサーチを実行

まず 1 つ選んで、毎日 5 分でも触ってみるのが学習の最短経路です。「ChatGPT 無料版 + Web 検索」が最も始めやすいでしょう。

ステップ 2: 目標型タスクを与える

エージェントの本領は「目標型タスク」(複数ステップが必要な依頼) で発揮されます。以下のような依頼を試してみてください:

「来週末の東京の天気を調べて、雨でも晴れでも楽しめる週末プランを 3 つ提案」
「競合 3 社の公式サイトを比較して、価格・主要機能・サポート体制の比較表を作って」
「来週のオンライン会議で使える、業界トレンドの最新 5 ニュースを要約して」
「このエラーメッセージで検索して、原因と対処法を 3 つ教えて」

いずれも、ふつうのチャット (検索なし) では「私にはリアルタイム情報がアクセスできません」と断られるタスクです。エージェント型 (検索ツール付き) なら、AI が自分で検索ツールを呼び出して答えてくれます。

ステップ 3: 結果を観察して「どこをツールに任せたか」を学ぶ

AI エージェントの回答には、ふつうのチャットと違って 「ツールを使った跡」が残ります。引用元 URL、検索結果、計算過程など。これを観察すると「どこを自分で考えたか」「どこでツールに頼ったか」が見えてきて、 AI の得意分野と苦手分野が分かってきます。

慣れてきたら、Tool-use 型 (Claude / ChatGPT Agent) で半日業務を任せてみる → さらに慣れたら Autonomous 型 (Claude Code / Codex) に踏み込む、という順番が安全です。いきなり Autonomous 型に手を出すと、何が起きているか把握できないまま結果だけが返ってくる体験になり、信頼関係が築けません。

7. リスクと注意点 — 「任せて大丈夫?」の判断軸

破壊的操作のリスク

AI エージェントは「ツール使用」が魅力ですが、その裏返しで ファイル削除 / git push --force / メール送信 / 支払い / API キー漏洩のような破壊的操作を実行できてしまうリスクがあります。いったん実行されると元に戻せない操作も多く、回復が困難です。

対策は 「重要操作だけ人が承認する設計」(Human-in-the-loop)。 Anthropic Claude Code、OpenAI Codex、Microsoft Copilot Agent はいずれも per-command 承認モデルを持っており、破壊的操作の前に必ず人間に確認を求めます。この承認層を無効化したり、毎回「全許可」を押す運用は事故の元です。

重要データを渡すリスク

AI エージェントの多くはクラウド (OpenAI / Anthropic / Google / Microsoft) で動いており、プロンプトとコンテキストがベンダー側に送信されます。顧客個人情報 / クレジットカード番号 / 社外秘の戦略文書 / 認証情報をうっかり渡すと、ベンダーのログに残る・モデル学習に使われる (オプトイン時) などのリスクがあります。

対策は (1) ベンダーのデータ取扱方針を事前確認、(2) 業務用は Enterprise プランでモデル学習オフ、(3) 機密度の高いデータは Sales Claw のようなローカル実行 OSSを使う、の組み合わせです。

ハルシネーション (もっともらしい嘘)

AI エージェントはツールを使えるとはいえ、本質は LLM (確率的に次の単語を生成する仕組み) です。ツール検索の結果を間違って解釈する、ありもしない関数を呼ぼうとする、引用元を捏造する、といったハルシネーションは 2026 年時点でもゼロにはなりません。重要な意思決定は 必ず人間が裏取りする運用が必要です。

ログと監査

業務でエージェントを使うなら、「いつ、誰が、何を、どのツール経由で実行したか」のログを残すことが必須です。エンタープライズ向けのエージェントプラットフォーム (Microsoft Copilot Studio、Salesforce Agentforce、OpenAI Agents Platform、 Anthropic Claude for Enterprise) はいずれも監査ログ機能を持っており、後から追跡できます。 Sales Claw もローカル実行 OSS として全送信の監査ログを残す設計です。

ベンダー依存とコンプライアンス

【未確認】 2026 年 5 月時点で、各社のエージェントが GDPR・個人情報保護法・SOC 2 などのコンプライアンス要件をすべて満たすかは、契約プランや地域によって異なります。エンタープライズで使う場合は 監査ログ・データ保持期間・モデル学習オプトイン状況をベンダーごとに必ず事前確認してください。

AI エージェントは大半がクラウドサービスのため、ベンダー (OpenAI / Anthropic / Google / Microsoft) の方針変更・価格改定・サービス停止のリスクを直接被ります。 2026 年に入って各社の料金プランが頻繁に変わっており、長期計画には不確実性があります。

AI エージェント 5 リスクのレーダーチャート。5 軸 (破壊的操作リスク / データ漏洩リスク / ハルシネーション / 監査不足 / ベンダー依存) を 1〜5 段階で評価。Tool-use 型 (例: ChatGPT Agent) は青線で破壊的操作リスク 2 / データ漏洩 3 / ハルシネーション 3 / 監査不足 2 / ベンダー依存 4。Autonomous 型 (例: Claude Code 全許可運用) は赤線で破壊的操作 5 / データ漏洩 3 / ハルシネーション 3 / 監査不足 4 / ベンダー依存 4。ローカル実行型 (例: Sales Claw) は緑線で破壊的操作 1 / データ漏洩 1 / ハルシネーション 2 / 監査不足 1 / ベンダー依存 1。注釈に「2026-05 著者見解ベース / 実運用設計で大きく変わる」。 — 図: 図 5: AI エージェント 5 リスクのレーダーチャート (Python 図解、参考値)

8. 業務利用と Sales Claw 文脈 — 営業エージェントの今

リサーチ・要約 (ChatGPT Agent / Claude)

2026 年時点で最も成熟しているのが リサーチ・要約系のエージェント用途です。 ChatGPT Agent / Claude / Perplexity Pro いずれも、複数 Web ページを横断して情報収集 → 整理 → 要約まで自動で行えます。営業前の競合調査、商談相手の事前リサーチ、業界トレンドの週次まとめなどに即使えます。

業務自動化 (Microsoft Copilot Agent / Salesforce Agentforce)

Office / Teams / Outlook を使っている組織なら Microsoft Copilot Agent、 Salesforce 上で顧客対応を回している組織なら Salesforce Agentforceが既存ワークフローへの統合がしやすい選択肢です。社内データへのアクセス権限を一元管理できる点で、エンタープライズ要件 (監査・データガバナンス) を満たしやすい設計です。

営業自動化 (Sales Claw)

営業エージェントというカテゴリには Sales Claw、Apollo.io、Outreach AI、Salesloftなどが含まれますが、設計思想は大きく分かれます。

クラウド型 SaaS (Apollo / Outreach / Salesloft) は、ベンダーのインフラ上でリード抽出から送信まで一気通貫で動かす設計で、導入は早いですが 顧客データがベンダー側に集まる構造です。一方 Sales Clawはローカル実行 OSS で、顧客の問い合わせフォームに送信メッセージを届ける部分に特化しています。

Sales Claw はポリシー制御付き自律で、送信前の自動検査・営業 NG 検出・ CAPTCHA 検出時停止・送信頻度制限・監査ログ保存によって、誤送信と規約違反リスクを下げる設計です。「AI エージェントの 3 段階」で言うと、実行ループは Autonomous ですが 送信前の自動ポリシー検査が組み込まれており、完全な任せきりではなくポリシーの範囲内で自律する設計になっています。

複数エージェントの組み合わせ設計

ふつうの企業が AI エージェントを業務に組み込むとき、1 社のサービスに全業務を寄せるよりも、タスク特性ごとに別エージェントを使い分ける設計が現実的です。

項目	クラウド型エージェント (ChatGPT Agent / Copilot)	ローカル実行型 (Sales Claw)
向くタスク	リサーチ・要約・業務自動化・コーディング	営業フォーム送信・高機密データ処理
データ取扱い	ベンダークラウド上 (Enterprise で学習オフ)	ローカル PC / 自社サーバで完結
コスト	月額 USD 20〜200/ユーザー	OSS 無料 + 自前運用コスト
スピード	導入即日	セットアップに 1〜3 日
ベンダー依存	高い (1 社の方針変更を直接被る)	低い (OSS なので継続性が保てる)

業務導入前のチェックリスト 7 項目

導入目的を「タスク粒度 × データ機密度」で整理し、適切なエージェントを選ぶ
情報セキュリティ部門にベンダーのデータ取扱い方針を確認 (学習オフ・データ保持期間)
破壊的操作・送信・支払いは人による承認を必須に運用ルールで明文化
監査ログを残す設計を要求 (Enterprise プラン or ローカル実行型)
ハルシネーション対策として、重要数値・引用元の裏取りプロセスを定義
ベンダー依存を分散させる (1 社に全業務を寄せない)
四半期ごとに各エージェントの機能変更・料金変更を社内でレビュー

AI エージェント時代に営業自動化を入れるなら、リサーチは ChatGPT Agent / Claude、業務統合は Microsoft Copilot、フォーム送信は Sales Claw、と使い分けるのが現実的。Sales Claw はローカル実行 OSS で、送信前自動検査・営業 NG 検出・CAPTCHA 検出時停止・送信頻度制限・監査ログ保存により、AI 営業自動化の下回りを規約準拠で固めましょう。

無料・MIT ライセンス。インストールせずにライブデモも試せます。

無料でダウンロードライブデモを試す GitHub

よくある質問

AI エージェントとは何ですか?

AI エージェントとは「指示を与えると自分で考え、ツール (検索・ファイル操作・API 呼び出し・ブラウザ操作など) を使い、複数ステップの作業を目標達成まで実行する AI」のことです。ふつうの ChatGPT が「質問に 1 回答えて終わり」なのに対し、AI エージェントは「目標 → 計画 → ツール実行 → 結果確認 → 次のステップ」を自律的に繰り返します。Anthropic 公式は「LLM が自身の処理とツール使用を動的に方向づけ、タスクをどう達成するかのコントロールを保つシステム」と定義 (Building Effective Agents, 2024-12)。代表例は Claude Code、Codex、Devin、Replit Agent、ChatGPT Agent、Microsoft Copilot Agent など。2026 年は「AI エージェント元年」と呼ばれる普及期です。

なぜ「AI エージェント」を一言で言える人がいないのですか?

定義が会社・媒体ごとに違うためで、原因は 3 軸あります。(1) 自律度の解釈: Anthropic は「workflow (人間が方向を決める)」と「agent (LLM が自分で方向を決める)」を厳格に区別、OpenAI は「Agents Platform」として広く括る。(2) ツール使用の範囲: ツールを 1 つでも使えば agent と呼ぶ会社、複数ツール必須の会社がある。(3) 対象タスク: コーディング専用 (Claude Code / Codex / Devin) と業務自動化全般 (Microsoft Copilot Agent) では用途が違う。実用上は「自律度 (Reactive / Tool-use / Autonomous) の 3 段階」で整理するのが一番分かりやすいです。

AI エージェントとふつうの ChatGPT は何が違いますか?

最も大きな違いは「ツール (関数) を呼び出す権限を持つか」です。ふつうの ChatGPT は会話で完結し、外の世界 (ファイル・API・ブラウザ) には影響を与えません。AI エージェントは検索ツール・ファイル操作・API 呼び出し・ブラウザ操作などを実行できる権限を持ち、複数ステップを自分で計画して進めます。例: 「来週の天気を踏まえて週末プラン作って」と頼むと、ふつうの ChatGPT は「リアルタイム情報にアクセスできません」と断りますが、AI エージェント (Tool-use 型) は天気 API を呼び出して結果を踏まえたプランを生成します。2026 年 5 月時点で ChatGPT も「ChatGPT Agent」として Tool-use 機能を Plus/Pro/Business 限定で提供しています。

AI エージェントは無料で使えますか?

はい、複数の Tool-use 型エージェントが無料で試せます。(1) ChatGPT 無料版 + Web 検索 (ChatGPT Search): 検索ツール内蔵、引用元リンクが出る、最も始めやすい。(2) Claude.ai 無料版 + MCP 連携: Claude Desktop に MCP サーバを足すと、ファイル操作や GitHub 連携などができる。(3) Microsoft Copilot 無料枠: Bing 検索 + 画像生成 + 簡易リサーチ。(4) Perplexity 無料版: 検索特化、Pro Search で複数ステップのリサーチ。Autonomous 型 (Claude Code / Codex / Devin など) は基本的に有料で、Claude Pro (USD 20/月)、ChatGPT Plus (USD 20/月)、Cursor Pro (USD 20/月) などからの利用が現実的です。

AI エージェントの 3 段階 (Reactive / Tool-use / Autonomous) はどう違いますか?

3 段階は自律度のグラデーションです。(1) Reactive (反応型): ツールを持たず、質問に答えるだけ。ChatGPT 通常版 / Claude.ai / Gemini Web。厳密には「エージェント」未満。(2) Tool-use (ツール使用型): 検索・ファイル操作・API 呼び出しなどのツールを使い、複数ステップを実行。ChatGPT Agent、Claude (MCP 連携)、Microsoft Copilot Agent、ChatGPT Atlas Agent mode が代表例。半自律で、人間が会話の主導権を持つ。(3) Autonomous (自律型): 目標だけ渡すと AI が計画・実行・修正を自律ループで回す。重要な分岐点だけ人が承認。Claude Code、Codex、Devin、Replit Agent、Cursor Composer が代表例。段階を上げるほど便利さとリスクが同時に上がるため、ふつうの人は Tool-use 型から触るのが安全です。

2026 年の主な AI エージェント 10 種は何ですか?

2026 年 5 月時点の主要 10 種は 3 系統に分かれます。【コーディング系 (Autonomous 寄り)】(1) Claude Code (Anthropic, CLI)、(2) Codex (OpenAI, CLI/Web/Mobile)、(3) Devin (Cognition, Web)、(4) Replit Agent (Replit, Web フルスタック)、(5) Cursor Composer (Cursor, IDE)。【業務自動化系 (Tool-use 寄り)】(6) ChatGPT Agent (OpenAI, リサーチ・タスク代行)、(7) Microsoft Copilot Agent (Microsoft 365 連携)、(8) Salesforce Agentforce (カスタマーサポート)。【ブラウザ系 (Tool-use 寄り)】(9) ChatGPT Atlas Agent mode (ブラウザ自動操作)、(10) Perplexity Comet (ブラウザ + リサーチ)。ふつうの人が触りやすいのは業務自動化系とブラウザ系で、まずは ChatGPT Agent や Microsoft Copilot Agent から慣れていくのが現実的です。

AI エージェントを業務に使うとき気をつけることは?

5 つのリスク軸を意識してください。(1) 破壊的操作 (ファイル削除・git push --force・支払い・メール送信): 必ず人による承認を残す設計に。Claude Code・Codex・Microsoft Copilot Agent はいずれも per-command 承認モデルを持つ。(2) 重要データ: クレジットカード・個人情報・認証情報・社外秘文書をプロンプトに貼らない。Enterprise プランで学習オフを担保。(3) ハルシネーション: AI は 2026 年でももっともらしい嘘をつく、重要数値・引用元・関数名は必ず裏取り。(4) 監査ログ: 「誰が・いつ・何を・どのツール経由で実行したか」のログを残す設計を要求。(5) ベンダー依存: 1 社のサービスに全業務を寄せず、複数を組み合わせる設計が安全。営業フォーム送信のような高機密・規約敏感タスクは、Sales Claw のようなローカル実行 OSS が現実的です。

参考文献

本記事は X 公式アカウントと公式ドキュメントを一次情報として参照しています。

[01]
Anthropic — Building Effective Agents (公式技術ブログ)2024-12-20
[02]
OpenAI Agents Platform (公式 Docs)2026-05-17
[03]
Anthropic Claude Docs — Tool use overview2026-05-17
[04]
Model Context Protocol (MCP) — 公式仕様2026-05-17
[05]
OpenAI — Introducing ChatGPT Agent (公式ブログ)2025-07-17
[06]
Microsoft — Copilot Studio Agents (公式 Docs)2026-05-17
[07]
Google — Agents Whitepaper (Gemini 公式)2024-09-12
[08]
Salesforce — Agentforce 公式製品ページ2026-05-17
[09]
Cognition — Devin AI Software Engineer (公式)2026-05-17
[10]
Replit — Agent 公式製品ページ2026-05-17

この記事の著者