diff --git a/docs/ai-terms-model-vs-agent-platform/index.md b/docs/ai-terms-model-vs-agent-platform/index.md index 79e17c0..a4c364c 100644 --- a/docs/ai-terms-model-vs-agent-platform/index.md +++ b/docs/ai-terms-model-vs-agent-platform/index.md @@ -10,138 +10,176 @@ image: /img/ai-terms-model-vs-agent-platform-banner.png ## はじめに -「AntigravityとClaude、どっちが賢いの?」みたいな会話が噛み合わないのは、**層の違うものを比較している**ことが多いからです。 +「AntigravityとClaude、どっちが賢いの?」——この手の会話が噛み合わないのは、**層の違うものを比較している**ことが多いからです。 -この記事では、いま混線しやすい用語を次の3層で整理します。 +Antigravityは「IDEに統合されたコーディング体験」、Claudeは「推論を行うモデル」。そもそも比較軸が違います。 -- **モデル層**(推論エンジン) -- **実行基盤層**(モデルに手足を与えるランタイム / ハーネス) -- **UI/ブリッジ層**(人間や外部チャネルとの接点) +この記事では、いま混線しやすい用語を次の3層に分けて整理します。 -> 重要: 実際のプロダクトは1層にきれいに分かれず、2層以上をまたぐことがあります(例: Antigravity、Cursor)。 +| 層 | 一言で | 例 | +|---|---|---| +| **モデル層** | 推論・生成を行う頭脳 | Claude / GPT / Gemini | +| **実行基盤層**(Runtime / Harness) | モデルにツール呼び出し・計画・実行・検証の「手足」を与える | Claude Code / Codex CLI / Antigravity Core | +| **UI/ブリッジ層** | 人間や外部チャネルとの接点 | IDE, Web UI, Discord Bot, CDPブリッジ | + +> **注意:** 実際のプロダクトは1層にきれいに収まらず、2層以上をまたぐことがあります(例: Antigravity = 実行基盤 + UI、ChatGPT = UI + モデル)。本記事ではあえて「主層」と「副層」に分けて整理します。 --- -## 先に結論(2026-03時点) - -- **MCP** は「接続の標準化」 -- **Skill** は「運用知識の遅延ロード」 -- 実務では **MCP(接続) + Skill(再現性)** の併用が強い - ---- - -## 3層モデル(改訂版) +## 3層モデル図 ```mermaid graph LR - subgraph UI層["UI / ブリッジ層"] + subgraph UI["UI / ブリッジ層"] direction TB - CLI["CLI"] ~~~ IDE["IDE"] + CLI["CLI"] ~~~ IDE["IDE(Antigravity等)"] IDE ~~~ Web["Web / App UI"] - Web ~~~ Bot["Discord/Telegram Bot"] - Bot ~~~ CDP["CDP Bridge"] + Web ~~~ Bot["Discord Bot"] + Bot ~~~ CDP["CDPブリッジ"] end - subgraph Runtime層["実行基盤層(Harness / Runtime)"] + subgraph Runtime["実行基盤層(Runtime / Harness)"] direction TB CC["Claude Code"] ~~~ CodexCLI["Codex CLI"] CodexCLI ~~~ AGCore["Antigravity Core"] - AGCore ~~~ OC["OpenClaw Orchestration"] + AGCore ~~~ OC["OpenClaw Gateway"] end - subgraph Model層["モデル層"] + subgraph Model["モデル層"] direction TB Claude["Claude"] ~~~ GPT["GPT"] GPT ~~~ Gemini["Gemini"] end - UI層 --> Runtime層 - Runtime層 --> Model層 + UI --> Runtime + Runtime --> Model ``` -### 層の役割 - -| 層 | 役割 | 例 | -|---|---|---| -| モデル層 | 推論・生成を行う頭脳 | Claude / GPT / Gemini | -| 実行基盤層 | ツール呼び出し・計画・実行・検証を回す | Claude Code / Codex CLI / Antigravity Core / OpenClaw | -| UI/ブリッジ層 | 人間入力・可視化・外部チャネル接続 | IDE, Web UI, Discord Bot, CDPブリッジ | - --- -## 主要ツールを「単層でなく」分類する +## 主要ツールを層で分類する -| ツール | 主層 | 副層 | モデル可用性(断定レベル) | コメント | +| ツール | 主層 | 副層 | バックエンドモデル | コメント | |---|---|---|---|---| -| Antigravity | 実行基盤 + UI | - | 構成依存(時期/地域/アカウント差あり) | IDEとしての体験が強く、モデル抽象化が起きやすい | -| Claude Code | 実行基盤 | UI(CLI) | Claude(公式) | 純正CLI。拡張はMCP/Skills/Subagents | -| Codex CLI | 実行基盤 | UI(CLI) | GPT系(公式) | OpenAI側のCLI運用文脈 | -| Cursor | 実行基盤 + UI | - | マルチモデル(公式Docs参照) | IDE一体型で層混線しやすい | -| ChatGPT | UI + モデル | 一部実行機能 | GPT系 | 「モデル名=体験名」になりやすい | -| Gemini(チャット) | UI + モデル | 一部実行機能 | Gemini系 | 同上 | -| OpenClaw | オーケストレーション基盤 | UIブリッジ連携 | 接続先依存 | 複数基盤/チャネルを統合する“運用レイヤー” | +| Antigravity | 実行基盤 + UI | — | 構成・時期により異なる(公式Docs参照) | IDE体験が強く「モデル=ブランド」と混同されやすい | +| Claude Code | 実行基盤 | UI(CLI) | Claude(Anthropic公式) | MCP / Skills / Subagents で拡張 | +| Codex CLI | 実行基盤 | UI(CLI) | GPT系(OpenAI公式) | OpenAI側のCLIエージェント | +| Cursor | 実行基盤 + UI | — | マルチモデル(公式Docs参照) | IDE一体型で層が混線しやすい | +| ChatGPT | UI + モデル | 一部実行機能 | GPT系 | 「モデル名=体験名」になりやすい | +| Gemini(チャット) | UI + モデル | 一部実行機能 | Gemini系 | 同上 | +| OpenClaw | オーケストレーション基盤 | UIブリッジ連携 | 接続先の基盤に依存 | 複数エージェント・チャネルを束ねる運用レイヤー | -> ポイント: 「どちらが賢いか」より、**どの層で比較しているか**を固定しないと議論が崩れます。 +> **ポイント:** 「どちらが賢いか」を議論するなら、まず**どの層で比較しているか**を固定する。モデル性能の話なのか、ツール連携の話なのか、IDE体験の話なのかで答えが変わります。 --- -## Antigravityまわりで混線しやすい点(今回の議論ベース) +## MCP と Skill——実行基盤層を拡張する2つの軸 -### 1) Antigravityはモデルか? -いいえ。基本は**基盤 + UI**です。モデルそのものではありません。 +3層モデルの中でも、実行基盤層の拡張方法としてよく名前が出る2つを整理します。 -### 2) なぜモデル扱いされる? -- ユーザーは「Antigravityを開いて使う」体験で認知する -- 内部モデルを毎回意識しない -- ブランド名が体験全体を代表する +| | MCP(Model Context Protocol) | Skill | +|---|---|---| +| 何を解決するか | ツール・データソースへの**接続の標準化** | 運用ノウハウ・手順の**再現性と遅延ロード** | +| 粒度 | 1つの外部サービスとの接続定義 | 1つのタスク遂行に必要な手順・プロンプトの塊 | +| 実行基盤との関係 | 基盤がMCPサーバーを呼び出す | 基盤がSkill定義を読み込んで実行する | +| 具体例 | Gitea API接続、SearXNG検索 | コードレビューループ、記事生成手順 | -### 3) Discord連携(bot化)は同じ層か? -違います。多くは **UI/ブリッジ層(CDP操作)** の話です。 +実務では **MCP(接続)+ Skill(再現性)** を併用するのが強い構成です。MCPで外部ツールに繋ぎ、Skillでその使い方を定型化する、という役割分担になります。 --- -## 用語の言い換え(議論が噛み合う形) +## Antigravityまわりで混線しやすい点 + +### Q1. Antigravityはモデルか? + +いいえ。**実行基盤 + UI** です。モデルそのものではありません。 + +### Q2. なぜモデル扱いされるのか? + +- ユーザーは「Antigravityを開いて使う」という体験単位で認知する +- バックエンドモデルを意識する場面が少ない +- ブランド名が体験全体を代表してしまう + +これはChatGPTでも同じ現象が起きています。「ChatGPTが賢くなった」は多くの場合「バックエンドがGPT-4oに切り替わった」という意味です。 + +### Q3. AntigravityのDiscord連携はどの層の話か? + +多くの場合 **UI/ブリッジ層** の話です。非公式CDPブリッジでAntigravityのWeb UIを外部から操作する構成は、モデル性能とは無関係のブリッジ実装の議論になります。 + +--- + +## 用語の言い換え——議論を噛み合わせるために | 混線しやすい言い方 | 層を揃えた言い方 | |---|---| -| AntigravityとClaude Codeどっちが賢い? | Antigravity基盤とClaude Code基盤、運用面でどっちが合う? | -| Antigravityのモデルは? | いまAntigravityのどのバックエンドモデルを使ってる? | -| CursorとAntigravityどっちが強い? | IDE体験(UI)と実行基盤の観点で何が違う? | +| 「AntigravityとClaude Codeどっちが賢い?」 | 「Antigravity基盤とClaude Code基盤、運用面でどっちが自分の用途に合う?」 | +| 「Antigravityのモデルは?」 | 「いまAntigravityが使っているバックエンドモデルはどれ?」 | +| 「CursorとAntigravityどっちが強い?」 | 「IDE体験(UI層)と実行基盤の観点でそれぞれ何が違う?」 | --- -## リスク整理(CDPブリッジ運用) +## 実務的な使い分け——この文脈での判断基準 -antigravity-discord-botのような非公式CDPブリッジは、**技術的には有効**ですが次を分けて考えるべきです。 +### 公式APIベース(本番運用向き) -1. **技術リスク**: 権限奪取 = リモート操作リスク -2. **運用リスク**: 自動承認設定による破壊的操作 -3. **規約リスク**: UI自動化が規約上どう扱われるか +- **構成例:** Claude Code + MCP + Skills、Codex CLI + Gitea連携 +- **利点:** 可観測性が高い、契約・利用規約が明確、レート制限やエラーハンドリングが公式サポート +- **適用場面:** 本番サービス、継続的に動かす自動化 -> 「ただのリモコンだから安全」ではなく、\ -> **提供側に自動代行運用と見なされるか** が実務上の判定軸です。 +### オーケストレーション基盤(複数エージェント統合) + +- **構成例:** OpenClaw Gateway + 複数エージェント + Discord/Webhook連携 +- **利点:** 異なる基盤のエージェントを1箇所で管理、チャネル横断の通知・応答が可能 +- **注意点:** オーケストレーター自体の可用性が単一障害点になりうる。Gateway障害時のフォールバック設計が必要 + +### UI/CDPブリッジ(検証・PoC向き) + +- **構成例:** CDP経由でAntigravity Web UIを操作、Discord DOM監視 +- **利点:** 公式APIが存在しないサービスにもアクセス可能 +- **制約:** 後述のリスクを理解した上で、隔離環境・最小権限で運用すべき --- -## 今回の文脈での実務的な使い分け +## CDPブリッジ運用のリスク整理 -- **本番運用**: 公式APIベース(可観測性・契約明確) -- **検証/PoC**: UI/CDPブリッジ(隔離環境・最小権限) -- **日常開発**: 基盤(Claude Code等) + スキル + 必要に応じMCP +非公式CDPブリッジ(antigravity-discord-botのようなUI自動化ツール)は技術的には動作しますが、3つの異なるリスクを分けて評価する必要があります。 + +### 1. 技術リスク:リモート操作の攻撃面 + +CDPポートが開いている=ブラウザの全操作権限が外部に露出しています。 + +- CDP接続元を `127.0.0.1` に限定し、SSHトンネル経由でアクセスする +- VM上で隔離されたブラウザプロファイルを使う +- 本番の認証情報が入ったブラウザセッションでCDP操作しない + +### 2. 運用リスク:自動承認による破壊的操作 + +CDPブリッジ経由の操作を「自動承認」にすると、意図しない破壊的操作が実行されうる。 + +- ファイル削除、設定変更、外部送信など不可逆な操作は人間承認を挟む +- 操作ログを残し、事後検証できるようにする + +### 3. 規約リスク:UI自動化の利用規約上の扱い + +「ただのリモコンだから安全」ではありません。判断軸は—— + +> **提供側がその操作を「自動代行」と見なすかどうか** + +- 多くのサービスはUI自動化(スクレイピング・ボット操作)を利用規約で制限している +- 公式APIが提供されている場合、そちらを使うほうが規約上安全 +- 公式APIがない場合でも、利用規約を確認した上で判断する --- -## 参考(確認に使った一次情報) +## 参考情報 -- Google Codelab: Getting Started with Google Antigravity - https://codelabs.developers.google.com/getting-started-google-antigravity -- Claude Code Docs (features overview / extensions) - https://code.claude.com/docs/en/features-overview -- Cursor Docs (models and pricing) - https://cursor.com/docs/models-and-pricing -- 非公式CDPブリッジ例(antigravity-discord-bot) - https://github.com/harunamitrader/antigravity-discord-bot +以下は執筆時点で参照した情報源です。URL・内容は変更される可能性があるため、利用時に最新版を確認してください。 + +- Antigravity公式ドキュメント(Google) +- Claude Code公式ドキュメント(Anthropic) +- Cursor公式ドキュメント(Models and Pricing) +- 非公式CDPブリッジの実装例(GitHub上に複数存在) --- -*この記事は2026年3月時点の情報です。モデル提供範囲・料金・規約は短期間で更新されるため、導入前に必ず公式ドキュメントと利用規約を確認してください。* +*この記事は2026年3月時点の情報です。モデル提供範囲・料金・規約は短期間で変わるため、導入前に必ず各サービスの公式ドキュメントと利用規約を確認してください。*