
AI エージェントって結局なに?一言で言える人がいない理由と、2026年5月時点の主な10種を一般読者向けに整理
AI エージェントとは「指示すると自分で考え、ツールを使い、複数ステップの作業を最後までやり遂げる AI」。一言で言える人がいないのは「自律度・ツール使用・対象タスク」の 3 軸で会社ごとに定義が違うから。実用上は Reactive / Tool-use / Autonomous の 3 段階で理解するのが正解。2026年5月時点の主要10種・無料で試す手順・5 つのリスク・営業文脈まで一般読者向けに整理。

中澤 圭志
@keishi_nakazawaSales Claw 開発者

Key Facts
一言定義
自分で考え、ツールを使い、複数ステップをやり遂げる AI
3 段階
Reactive / Tool-use / Autonomous の自律度グラデーション
主要プロダクト
Claude Code・Codex・Devin・Copilot Agent・Atlas Agent ほか
無料で試す
ChatGPT 無料 + Web 検索 / Claude.ai + MCP
「『AI エージェント』ってよく聞くけど、結局なに?」「ChatGPT と何が違うの?」 「Claude も Copilot も『エージェント』って言ってるけど、全部同じもの?」—— 本記事では、2026 年に入って一気に普及した 「AI エージェント」という言葉を、 AI に詳しくない人向けに整理します。Anthropic / OpenAI / Google / Microsoft の 公式定義を一次情報として参照しながら、なぜ一言で言える人がいないのかと実用上どう区別すればいいかを解説します。
本記事は Anthropic 公式「Building Effective Agents」・OpenAI Agents Platform Docs・ Google Gemini Agents Whitepaper・Microsoft Copilot Studio Docsを一次情報として 参照しています。個別ツールの解説は Claude Code スラッシュコマンド完全ガイド や Codex Mobile 一般読者向け解説を、エージェントを動かす共通規格は MCP 完全ガイドを、ブラウザ × AI 全体像は ChatGPT Atlas 一般読者向け解説を併読してください。
1. AI エージェントとは — 一言で言うと「自分で手を動かす AI」

AI エージェント (AI Agent) を、いちばん身近な比喩で説明します。ふつうの ChatGPT は「教科書を読み上げてくれる先生」のような存在で、質問すると答えを返してくれますが、 自分で図書館に資料を取りに行ったり、ノートに書き留めたりはしません。 一方、AI エージェントは 「研究助手」のような存在で、 「来週の会議資料を作って」と頼むと、自分で資料を探し、要約し、PowerPoint を開いてスライドを 並べる、というところまでやろうとします。
この「自分で手を動かす」性質を支えているのが、ツール使用 (Tool Use)・記憶 (Memory)・ 自律ループ (Autonomous Loop)の 3 つの機能です。LLM (Claude / GPT / Gemini など) を 頭脳として、これら 3 機能を組み合わせると、ようやく「エージェント」と呼べるものになります。 Anthropic 公式は次のように定義しています。
翻訳すると 【公式発表】 「エージェントとは、LLM が自身の処理とツール使用を動的に方向づけ、タスクをどう達成するかの コントロールを保つシステムである」。重要なのは 「dynamically direct (動的に方向づける)」の部分で、人間が毎ステップ指示するのではなく、AI 自身が「次は何をすべきか」を決める点が ふつうの AI チャットとの境界線です。
なぜ 2026 年に急に流行ったのか
【著者見解】 AI エージェントは概念としては 2020 年代前半から研究されていましたが、実用レベルに到達したのは 2024 年後半〜 2025 年です。背景には 3 つの技術的飛躍があります。 (1) LLM の長文脈化 (Claude 3.5 Sonnet で 200K トークン、Gemini 2 で 1M+ に到達)、 (2) ツール使用 API の標準化 (OpenAI Function Calling → MCP の登場)、 (3) 推論能力の向上 (Claude Opus 4 / GPT-5 系で「複数ステップ計画」が安定)。 この 3 つが揃ったことで、2025 年に Devin / Replit Agent / Claude Code / Codex が 実用レベルで登場し、2026 年に「AI エージェント元年」と呼ばれる普及期に入りました。

2. なぜ「一言で言える人がいない」のか — 定義が割れる 3 つの理由

理由 1: 「自律度」の解釈が違う
1 つ目の理由は 自律度 (Autonomy) の解釈です。AI が「自分で次の行動を決めて 実行する」と言っても、(a) 完全に任せきり (Autonomous)、(b) 重要な操作だけ人間に確認 (Human-in-the-loop)、(c) 毎ステップ確認 (Interactive) と段階があり、 どこからを「エージェント」と呼ぶかは会社ごとに違います。
Anthropic 公式はこの境界線に厳格で、「workflow (毎ステップ人間が方向を決める)」 と「agent (LLM が自身で方向を決める)」を明確に区別しています。一方OpenAIは「ChatGPT も Agent も Codex も全部 Agents Platform」として広く括り、Microsoftは Copilot Studio で作る生成型ツールを全部「Copilot Agent」と 呼んでいて、自律度の境界線は曖昧です。
理由 2: 「ツール使用」の範囲が違う
2 つ目の理由は ツール使用 (Tool Use) の範囲です。ツールを 1 つでも使えば エージェントと呼ぶ会社もあれば、「複数のツールを動的に組み合わせて使えること」を 条件にする会社もあります。
たとえば RAG (検索拡張) を 1 つだけ使う ChatGPT をエージェントと呼ぶかどうかは 人によって意見が分かれます。Anthropic は「LLM の augmented (拡張) 状態」とは呼びますが、 「agent」とは呼びません。一方、多くの SaaS ベンダーは「検索付き ChatGPT = エージェント型 AI」 と宣伝しており、ここに認識の溝があります。
理由 3: 「対象タスク」が違う
3 つ目の理由は 対象タスク (Domain) の違いです。同じ「AI エージェント」と 言っても、Claude Code / Codex / Devin はコーディング専用、 Microsoft Copilot Agent は業務自動化全般、Salesforce Agentforce はカスタマーサポート、と対象領域が違います。 対象が違うエージェント同士を「同じ AI エージェント」として比較するから、議論が噛み合わない、 という構図です。
| 会社 | 「AI エージェント」の使い方 | 特徴 |
|---|---|---|
| Anthropic | workflow ⇔ agent を厳格に区別 | 「LLM が自分で方向を決める」場合のみ agent |
| OpenAI | Agents Platform で広く括る | ChatGPT Agent / Codex / Assistants API すべて |
| Gemini Agents Whitepaper で定義 | 「目標達成のために外部世界を観察・行動」 | |
| Microsoft | Copilot Agent ≒ 生成型業務ツール | Copilot Studio で作るもの全部 |
| Salesforce | Agentforce = カスタマー対応 AI | 顧客接点に特化したエージェント |
【著者見解】 定義の混乱は「新興市場あるある」で、AI エージェントもまさにこの段階です。 2024 年の RAG、2023 年のプロンプトエンジニアリングも、最初の 1〜2 年は会社ごとに定義が バラバラでした。1〜2 年すると業界で定義が収束していく傾向にあるので、2027 年頃には ある程度標準化されると見込まれます。
3. 「AI チャット」「自動化ツール」との違い — 図で整理
AI チャット (ChatGPT) との違い
ふつうの ChatGPT は、ユーザーがメッセージを送ると 1 回返事して終わりです (会話履歴は持つが、自分から外に出て行かない)。ファイルを書く / コマンドを実行する / Web を操作するといった「手」を持っていません。
対して AI エージェントは、ツール (関数) を呼び出す権限を持っています。 たとえば「来週月曜の会議資料を Slack に送って」と頼むと、エージェントは (1) カレンダー API で来週月曜の会議を検索 → (2) 過去資料を Google Drive で検索 → (3) 要約を作って PowerPoint に変換 → (4) Slack API で送信、という複数ステップを 自分で計画して実行します。
自動化ツール (Zapier / RPA) との違い
Zapier や UiPath のような自動化ツール (RPA) は、人間が 手順を 1 つ 1 つ明示的に設定しないと動きません。「もしメールが来たら → スプレッドシートに行を追加 → Slack に通知」のような フローを事前に組む必要があります。手順の途中で例外が起きると止まります。
AI エージェントは 「目標」だけ渡せば、手順は自分で考えます。例外が起きても、 「じゃあこっちの方法で試してみよう」と動的に方向転換できるのが大きな違いです。 ただし「決まりきった単純作業」は、RPA のほうが安く・速く・安定して動きます。 AI エージェントは「探索が必要な作業」「毎回少し違う作業」に向く設計です。
| 項目 | AI チャット (ChatGPT) | 自動化ツール (Zapier / RPA) |
|---|---|---|
| 入力 | 質問・指示・会話 | 事前定義されたトリガー (例: メール受信) |
| 出力 | テキスト・コード・画像 (会話のみ) | API 呼び出し・ファイル操作・通知 |
| 柔軟性 | 高い (どんな質問にも答えようとする) | 低い (決められた手順しか実行しない) |
| コスト | 安い (会話 1 回ずつ) | 中 (月額サブスク) |
| AI エージェントとの違い | エージェントは「手を持つ」点が違う | エージェントは「手順を自分で考える」点が違う |
図にすると、AI チャット ←→ AI エージェント ←→ 自動化ツールという グラデーションになっていて、AI エージェントはその中間で「会話の柔軟性」と 「機械的な実行力」を兼ね備えた存在、と理解するのがいちばん分かりやすいです。
4. AI エージェントの 3 段階 — Reactive / Tool-use / Autonomous

段階 1: Reactive (反応型) — ふつうの ChatGPT
最も基本的なレベルです。ユーザーが質問すると、AI が答える。それだけ。 ツールは持たず、外の世界には影響を与えません。ChatGPT 通常版 / Claude.ai のチャット / Gemini Webなどがこの段階に該当します。 厳密には「AI エージェント」と呼ぶには物足りませんが、議論の出発点として位置付けます。
段階 2: Tool-use (ツール使用型) — 半自律
AI が ツール (検索エンジン / ファイル操作 / API 呼び出し / 計算機 / ブラウザ)を使えるようになると、エージェントとしての性質が現れ始めます。 ユーザーが「来週の天気を踏まえて週末プラン作って」と頼むと、エージェントは 天気 API を呼び出し → 結果を踏まえてプランを生成、という複数ステップを 自分で実行します。
代表例は ChatGPT Agent (2026-05 時点で Plus/Pro/Business 限定)、Claude with MCP、Microsoft Copilot Agent、ChatGPT Atlas Agent mode (前述記事参照) など。 Tool-use 型は「人間が目標を渡し、AI が手順を考える」という形で、まだ人間が会話の主導権を 持っています。
段階 3: Autonomous (自律型) — 高自律
最も「エージェントらしい」レベルです。ユーザーが 目標を渡すと、AI が 計画 → 実行 → 結果確認 → 修正 → 次のステップを自律ループで回します。 人間は重要な分岐点 (例: ファイル削除・送信・支払い) でだけ承認を求められます。
代表例は Claude Code、Codex、Devin、Replit Agent、Cursor Composer、Aiderなど。 いずれもコーディング領域に特化しており、「このリポジトリのバグを修正して PR を出して」 のような大粒度の目標を渡すと、数分〜数時間かけて作業を進めます。
【著者見解】 Autonomous 型は便利さの裏返しでリスクも上がります。ファイル削除・git push --force・支払い などの破壊的操作を AI が自律的に実行すると、事故が起きたときの回復が困難です。 Anthropic / OpenAI ともに「ポリシー制御付き自律」(重要操作のみ人による承認) を推奨しており、 実用エージェントの多くはこの形に落ち着いています。高自律 (任せきりに近い形) を売りにする ベンダーには、エンタープライズ用途では慎重な評価が必要です。
5. 2026 年に流行ってる主な AI エージェント 10 種
| エージェント | 対象タスク | 自律度 | 対応プラン例 |
|---|---|---|---|
| Claude Code | コーディング (CLI) | Autonomous | Claude Pro / Max |
| Codex | コーディング (CLI / Web / Mobile) | Autonomous | ChatGPT 全プラン |
| Devin | コーディング (Web) | Autonomous | Cognition 月額 |
| Replit Agent | フルスタック開発 (Web) | Autonomous | Replit Core/Teams |
| Cursor Composer | コーディング (IDE) | Autonomous | Cursor Pro |
| ChatGPT Agent | 業務リサーチ・タスク代行 | Tool-use | ChatGPT Plus/Pro/Business |
| Microsoft Copilot Agent | 業務自動化 (Office / Teams 連携) | Tool-use | Microsoft 365 Copilot |
| Salesforce Agentforce | カスタマーサポート | Tool-use | Salesforce 上位プラン |
| ChatGPT Atlas Agent mode | ブラウザ自動操作 | Tool-use | ChatGPT Plus/Pro/Business |
| Perplexity Comet | ブラウザ自動操作 + リサーチ | Tool-use | Perplexity Pro |
【著者見解】 この表から見える 3 系統は 「コーディング系 (Autonomous 寄り)」「業務自動化系 (Tool-use 寄り)」 「ブラウザ系 (Tool-use 寄り)」です。ふつうのビジネスパーソンが触りやすいのは 業務自動化系とブラウザ系で、まずは ChatGPT Agent や Microsoft Copilot Agent から 慣れていくのが現実的です。コーディング系はエンジニア向けで、業務代替するというより 「エンジニアの生産性を 2〜10 倍にする」性質のツールです。

6. はじめる手順 — ふつうの人が今日無料で試す 3 ステップ

ステップ 1: 無料で触れる Tool-use 型を選ぶ
いま無料で試せる Tool-use 型エージェントは複数あります:
- ChatGPT 無料版の Web 検索 + ChatGPT Search: Web 検索ツールを内蔵、回答の根拠リンクが出る
- Claude.ai 無料版 + MCP 連携: Claude Desktop に MCP サーバを足すと、ファイル操作・GitHub 連携などができる
- Microsoft Copilot 無料枠: Bing 検索 + 画像生成 + 簡易リサーチが無料で使える
- Perplexity 無料版: 検索特化、Pro Search で複数ステップのリサーチを実行
まず 1 つ選んで、毎日 5 分でも触ってみるのが学習の最短経路です。 「ChatGPT 無料版 + Web 検索」が最も始めやすいでしょう。
ステップ 2: 目標型タスクを与える
エージェントの本領は「目標型タスク」(複数ステップが必要な依頼) で発揮されます。 以下のような依頼を試してみてください:
- 「来週末の東京の天気を調べて、雨でも晴れでも楽しめる週末プランを 3 つ提案」
- 「競合 3 社の公式サイトを比較して、価格・主要機能・サポート体制の比較表を作って」
- 「来週のオンライン会議で使える、業界トレンドの最新 5 ニュースを要約して」
- 「このエラーメッセージで検索して、原因と対処法を 3 つ教えて」
いずれも、ふつうのチャット (検索なし) では「私にはリアルタイム情報がアクセスできません」と 断られるタスクです。エージェント型 (検索ツール付き) なら、AI が自分で検索ツールを呼び出して 答えてくれます。
ステップ 3: 結果を観察して「どこをツールに任せたか」を学ぶ
AI エージェントの回答には、ふつうのチャットと違って 「ツールを使った跡」が 残ります。引用元 URL、検索結果、計算過程など。これを観察すると「どこを自分で考えたか」「どこでツールに頼ったか」が見えてきて、 AI の得意分野と苦手分野が分かってきます。
慣れてきたら、Tool-use 型 (Claude / ChatGPT Agent) で半日業務を任せてみる → さらに慣れたら Autonomous 型 (Claude Code / Codex) に踏み込む、という順番が安全です。 いきなり Autonomous 型に手を出すと、何が起きているか把握できないまま結果だけが 返ってくる体験になり、信頼関係が築けません。
7. リスクと注意点 — 「任せて大丈夫?」の判断軸
破壊的操作のリスク
AI エージェントは「ツール使用」が魅力ですが、その裏返しで ファイル削除 / git push --force / メール送信 / 支払い / API キー漏洩のような破壊的操作を実行できてしまうリスクがあります。 いったん実行されると元に戻せない操作も多く、回復が困難です。
対策は 「重要操作だけ人が承認する設計」(Human-in-the-loop)。 Anthropic Claude Code、OpenAI Codex、Microsoft Copilot Agent はいずれも per-command 承認モデルを持っており、破壊的操作の前に必ず人間に確認を求めます。 この承認層を無効化したり、毎回「全許可」を押す運用は事故の元です。
重要データを渡すリスク
AI エージェントの多くはクラウド (OpenAI / Anthropic / Google / Microsoft) で動いており、 プロンプトとコンテキストがベンダー側に送信されます。顧客個人情報 / クレジットカード番号 / 社外秘の戦略文書 / 認証情報を うっかり渡すと、ベンダーのログに残る・モデル学習に使われる (オプトイン時) などの リスクがあります。
対策は (1) ベンダーのデータ取扱方針を事前確認、(2) 業務用は Enterprise プランで モデル学習オフ、(3) 機密度の高いデータは Sales Claw のようなローカル実行 OSSを 使う、の組み合わせです。
ハルシネーション (もっともらしい嘘)
AI エージェントはツールを使えるとはいえ、本質は LLM (確率的に次の単語を生成する仕組み) です。ツール検索の結果を間違って解釈する、ありもしない関数を呼ぼうとする、 引用元を捏造する、といったハルシネーションは 2026 年時点でもゼロにはなりません。 重要な意思決定は 必ず人間が裏取りする運用が必要です。
ログと監査
業務でエージェントを使うなら、「いつ、誰が、何を、どのツール経由で実行したか」の ログを残すことが必須です。エンタープライズ向けのエージェントプラットフォーム (Microsoft Copilot Studio、Salesforce Agentforce、OpenAI Agents Platform、 Anthropic Claude for Enterprise) はいずれも監査ログ機能を持っており、後から追跡できます。 Sales Claw もローカル実行 OSS として全送信の監査ログを残す設計です。
ベンダー依存とコンプライアンス
【未確認】 2026 年 5 月時点で、各社のエージェントが GDPR・個人情報保護法・SOC 2 などの コンプライアンス要件をすべて満たすかは、契約プランや地域によって異なります。 エンタープライズで使う場合は 監査ログ・データ保持期間・モデル学習オプトイン状況を ベンダーごとに必ず事前確認してください。
AI エージェントは大半がクラウドサービスのため、ベンダー (OpenAI / Anthropic / Google / Microsoft) の方針変更・価格改定・サービス停止のリスクを直接被ります。 2026 年に入って各社の料金プランが頻繁に変わっており、長期計画には不確実性があります。

8. 業務利用と Sales Claw 文脈 — 営業エージェントの今
リサーチ・要約 (ChatGPT Agent / Claude)
2026 年時点で最も成熟しているのが リサーチ・要約系のエージェント用途です。 ChatGPT Agent / Claude / Perplexity Pro いずれも、複数 Web ページを横断して情報収集 → 整理 → 要約まで自動で行えます。営業前の競合調査、商談相手の事前リサーチ、業界トレンドの 週次まとめなどに即使えます。
業務自動化 (Microsoft Copilot Agent / Salesforce Agentforce)
Office / Teams / Outlook を使っている組織なら Microsoft Copilot Agent、 Salesforce 上で顧客対応を回している組織なら Salesforce Agentforceが 既存ワークフローへの統合がしやすい選択肢です。社内データへのアクセス権限を一元管理できる点で、 エンタープライズ要件 (監査・データガバナンス) を満たしやすい設計です。
営業自動化 (Sales Claw)
営業エージェントというカテゴリには Sales Claw、Apollo.io、Outreach AI、Salesloftなどが含まれますが、設計思想は 大きく分かれます。
クラウド型 SaaS (Apollo / Outreach / Salesloft) は、ベンダーのインフラ上でリード抽出から 送信まで一気通貫で動かす設計で、導入は早いですが 顧客データがベンダー側に集まる構造です。一方 Sales Clawはローカル実行 OSS で、顧客の問い合わせフォームに 送信メッセージを届ける部分に特化しています。
Sales Claw はポリシー制御付き自律で、送信前の自動検査・営業 NG 検出・ CAPTCHA 検出時停止・送信頻度制限・監査ログ保存によって、 誤送信と規約違反リスクを下げる設計です。「AI エージェントの 3 段階」で言うと、 実行ループは Autonomous ですが 送信前の自動ポリシー検査が組み込まれており、 完全な任せきりではなくポリシーの範囲内で自律する設計になっています。
複数エージェントの組み合わせ設計
ふつうの企業が AI エージェントを業務に組み込むとき、1 社のサービスに全業務を寄せるよりも、タスク特性ごとに別エージェントを使い分ける設計が現実的です。
| 項目 | クラウド型エージェント (ChatGPT Agent / Copilot) | ローカル実行型 (Sales Claw) |
|---|---|---|
| 向くタスク | リサーチ・要約・業務自動化・コーディング | 営業フォーム送信・高機密データ処理 |
| データ取扱い | ベンダークラウド上 (Enterprise で学習オフ) | ローカル PC / 自社サーバで完結 |
| コスト | 月額 USD 20〜200/ユーザー | OSS 無料 + 自前運用コスト |
| スピード | 導入即日 | セットアップに 1〜3 日 |
| ベンダー依存 | 高い (1 社の方針変更を直接被る) | 低い (OSS なので継続性が保てる) |
業務導入前のチェックリスト 7 項目
- 導入目的を「タスク粒度 × データ機密度」で整理し、適切なエージェントを選ぶ
- 情報セキュリティ部門にベンダーのデータ取扱い方針を確認 (学習オフ・データ保持期間)
- 破壊的操作・送信・支払いは人による承認を必須に運用ルールで明文化
- 監査ログを残す設計を要求 (Enterprise プラン or ローカル実行型)
- ハルシネーション対策として、重要数値・引用元の裏取りプロセスを定義
- ベンダー依存を分散させる (1 社に全業務を寄せない)
- 四半期ごとに各エージェントの機能変更・料金変更を社内でレビュー
よくある質問
AI エージェントとは何ですか?
なぜ「AI エージェント」を一言で言える人がいないのですか?
AI エージェントとふつうの ChatGPT は何が違いますか?
AI エージェントは無料で使えますか?
AI エージェントの 3 段階 (Reactive / Tool-use / Autonomous) はどう違いますか?
2026 年の主な AI エージェント 10 種は何ですか?
AI エージェントを業務に使うとき気をつけることは?
参考文献
本記事は X 公式アカウントと公式ドキュメントを一次情報として参照しています。
- [01]
- [02]OpenAI Agents Platform (公式 Docs)2026-05-17
- [03]
- [04]Model Context Protocol (MCP) — 公式仕様2026-05-17
- [05]
- [06]
- [07]Google — Agents Whitepaper (Gemini 公式)2024-09-12
- [08]Salesforce — Agentforce 公式製品ページ2026-05-17
- [09]
- [10]Replit — Agent 公式製品ページ2026-05-17


