From 6897eedf388db8326f56110bbf5cbe0665e54362 Mon Sep 17 00:00:00 2001 From: koide Date: Sat, 7 Mar 2026 01:55:53 +0000 Subject: [PATCH] Refine AI terms article with verified layering, risk model, and source-backed corrections --- .../ai-terms-model-vs-agent-platform/index.md | 278 +++++++----------- 1 file changed, 114 insertions(+), 164 deletions(-) diff --git a/docs/ai-terms-model-vs-agent-platform/index.md b/docs/ai-terms-model-vs-agent-platform/index.md index a2f7157..79e17c0 100644 --- a/docs/ai-terms-model-vs-agent-platform/index.md +++ b/docs/ai-terms-model-vs-agent-platform/index.md @@ -1,197 +1,147 @@ --- sidebar_position: 2 -title: "いま混線しがちなAI用語をほどく:モデル/エージェント基盤/UIの関係" -description: "モデル、エージェント基盤、UIの3層でAIツールの関係を整理する" +title: "いま混線しがちなAI用語をほどく:モデル/実行基盤/UIの関係" +description: "モデル、実行基盤、UI/ブリッジの3層でAIツールの関係を整理する(2026年3月検証版)" displayed_sidebar: null image: /img/ai-terms-model-vs-agent-platform-banner.png --- -# いま混線しがちなAI用語をほどく:モデル/エージェント基盤/UIの関係 +# いま混線しがちなAI用語をほどく:モデル/実行基盤/UIの関係 -## はじめに:なぜ用語が混線するのか +## はじめに -「AntigravityってClaudeより賢いんですか?」——こうした質問をSNSやコミュニティで見かける機会が増えました。 +「AntigravityとClaude、どっちが賢いの?」みたいな会話が噛み合わないのは、**層の違うものを比較している**ことが多いからです。 -一見すると自然な疑問ですが、実はこの問いには構造的な問題があります。**AntigravityとClaudeは同じカテゴリに属するものではない**からです。片方は「エンジン」、もう片方は「車体」に相当するもので、そもそも比較の軸が違います。 +この記事では、いま混線しやすい用語を次の3層で整理します。 -本記事では、こうした混乱を解消するために、AIツールを**3つの層**に分けて整理します。 +- **モデル層**(推論エンジン) +- **実行基盤層**(モデルに手足を与えるランタイム / ハーネス) +- **UI/ブリッジ層**(人間や外部チャネルとの接点) -## 3層モデル:モデル/エージェント基盤/UI +> 重要: 実際のプロダクトは1層にきれいに分かれず、2層以上をまたぐことがあります(例: Antigravity、Cursor)。 -AIツールの構造を理解するうえで、以下の3層に分けて考えると見通しがよくなります。 +--- + +## 先に結論(2026-03時点) + +- **MCP** は「接続の標準化」 +- **Skill** は「運用知識の遅延ロード」 +- 実務では **MCP(接続) + Skill(再現性)** の併用が強い + +--- + +## 3層モデル(改訂版) ```mermaid graph LR - subgraph UI層["UI/インターフェース層"] + subgraph UI層["UI / ブリッジ層"] direction TB CLI["CLI"] ~~~ IDE["IDE"] - IDE ~~~ WebChat["Web Chat"] - WebChat ~~~ Bot["Discord Bot"] + IDE ~~~ Web["Web / App UI"] + Web ~~~ Bot["Discord/Telegram Bot"] + Bot ~~~ CDP["CDP Bridge"] end - subgraph Agent層["エージェント基盤層"] + subgraph Runtime層["実行基盤層(Harness / Runtime)"] direction TB - AG["Antigravity"] ~~~ CC["Claude Code"] - CC ~~~ CUR["Cursor"] - CUR ~~~ CDX["Codex CLI"] + CC["Claude Code"] ~~~ CodexCLI["Codex CLI"] + CodexCLI ~~~ AGCore["Antigravity Core"] + AGCore ~~~ OC["OpenClaw Orchestration"] end subgraph Model層["モデル層"] direction TB - GPT["GPT"] ~~~ Claude["Claude"] - Claude ~~~ Gemini["Gemini"] + Claude["Claude"] ~~~ GPT["GPT"] + GPT ~~~ Gemini["Gemini"] end - UI層 -->|操作・表示| Agent層 - Agent層 -->|推論を依頼| Model層 - - style UI層 fill:#4a9eff,stroke:#2d7cd4,color:#fff - style Agent層 fill:#ff8c42,stroke:#d4712d,color:#fff - style Model層 fill:#51cf66,stroke:#3da54e,color:#fff + UI層 --> Runtime層 + Runtime層 --> Model層 ``` -各層の役割を整理します。 +### 層の役割 -| 層 | 役割 | 具体例 | +| 層 | 役割 | 例 | |---|---|---| -| **モデル層** | テキストの生成・推論を行う「頭脳」 | GPT、Claude、Gemini | -| **エージェント基盤層** | モデルに「手足」を与え、タスクを実行する環境 | Claude Code、Codex CLI、(Antigravityの実行エンジン部分) | -| **UI/インターフェース層** | ユーザーとの接点となる画面・操作手段 | CLI、IDE統合、Webチャット、Discord Bot、(AntigravityのIDE画面) | - -重要なのは、**同じモデルであっても、エージェント基盤が異なれば体験と成果は大きく変わる**という点です。Claude OpusをAntigravity経由で使う場合とClaude Code経由で使う場合とでは、利用できる機能も操作感もまったく異なります。 - -## なぜAntigravityはモデルと混同されるのか - -Antigravityが「モデル」として語られやすい背景には、いくつかの構造的な理由があります。 - -```mermaid -graph LR - User["ユーザー"] -->|"Antigravityを開く"| AG["Antigravity
(基盤 + IDE UI)"] - AG -->|切り替え可能| Gemini["Gemini 3 Pro"] - AG -->|切り替え可能| Claude["Claude Opus 4.5/4.6"] - AG -->|切り替え可能| GPT["GPT 5.3"] - - style AG fill:#ff8c42,stroke:#d4712d,color:#fff - style Gemini fill:#51cf66,stroke:#3da54e,color:#fff - style Claude fill:#51cf66,stroke:#3da54e,color:#fff - style GPT fill:#51cf66,stroke:#3da54e,color:#fff - style User fill:#4a9eff,stroke:#2d7cd4,color:#fff -``` - -**マルチモデル対応による抽象化** - -AntigravityはIDEとしての体験を提供し、バックエンドのモデル選択を抽象化します。 - -※ 利用可能モデル・料金・提供形態は時期/地域/アカウントで変動します。特にClaude/GPT系の利用は、公式機能か外部ブリッジかを区別して確認してください。ユーザーの視点では「Antigravityを開いてAIと対話する」という一貫した体験になるため、内部でどのモデルが動いているかは意識されにくい構造です。 - -**体験の一体感** - -モデルセレクターは用意されているものの、多くのユーザーはデフォルト設定のまま利用しています。その結果、出力は「Antigravityの回答」として認識され、モデル固有の特性は基盤の体験に溶け込んでしまいます。 - -**名前が体験を代表する** - -「Antigravity使ってますか?」という一言で会話が成立します。わざわざ「AntigravityでClaude Opus 4.6モデルを使ってコーディングしています」とは言いません。ブランド名が体験全体を代表する現象は、テクノロジー分野では珍しくありません。 - -## 主要ツールの3層分類 - -主要なAIツールが3層のどこに位置するかを整理します。 - -```mermaid -graph LR - subgraph ツール分類 - direction TB - - subgraph エージェント基盤 - AG2["Antigravity
層: 基盤 + UI"] - CC2["Claude Code
モデル: Claude"] - CDX2["Codex CLI
モデル: GPT"] - end - - subgraph "エージェント基盤 + UI" - CUR2["Cursor
モデル: Claude/GPT等
UI: IDE (VSCodeフォーク)"] - end - - subgraph "UI + モデル" - ChatGPT["ChatGPT
モデル: GPT
UI: Web/アプリ"] - GemChat["Gemini チャット版
モデル: Gemini
UI: Web/アプリ"] - end - - subgraph オーケストレーション - OC["OpenClaw
エージェント基盤を統合操作"] - end - end - - style AG2 fill:#ff8c42,stroke:#d4712d,color:#fff - style CC2 fill:#ff8c42,stroke:#d4712d,color:#fff - style CDX2 fill:#ff8c42,stroke:#d4712d,color:#fff - style CUR2 fill:#e67e22,stroke:#c0651a,color:#fff - style ChatGPT fill:#3498db,stroke:#2980b9,color:#fff - style GemChat fill:#3498db,stroke:#2980b9,color:#fff - style OC fill:#9b59b6,stroke:#8e44ad,color:#fff -``` - -| ツール | 層 | 利用可能なモデル | 備考 | -|---|---|---|---| -| **Antigravity** | エージェント基盤 + UI | 要確認(主にGemini、他モデル連携は構成依存) | VS CodeフォークIDE。モデル提供範囲は時期/地域/構成で変動 | -| **Claude Code** | エージェント基盤 | Claude | Anthropic純正のコーディングエージェント | -| **Codex CLI** | エージェント基盤 | GPT | OpenAI純正のCLIエージェント | -| **Cursor** | エージェント基盤 + UI | Claude / GPT 等 | VSCodeフォークのIDE形式 | -| **ChatGPT** | UI + モデル | GPT | OpenAIモデルへの直接インターフェース | -| **Gemini(チャット版)** | UI + モデル | Gemini | Googleモデルへの直接インターフェース | -| **OpenClaw** | オーケストレーション基盤 | — | エージェント基盤をDiscord等から統合操作 | - -この表を見ると、「AntigravityとClaude Codeどちらが賢いか?」という問いがなぜ噛み合わないかが明確になります。Claude Codeは主にエージェント基盤、Antigravityは基盤とUIを一体で提供するため、比較軸を揃える必要があります。比較するのであれば、「基盤としてどちらが使いやすいか」「UIとしてどちらが運用しやすいか」を分けて問うのが適切です。 - -なお、[antigravity-discord-bot(非公式)](https://github.com/harunamitrader/antigravity-discord-bot) というプロジェクトがあります。DiscordからAntigravityをCDP経由で遠隔操作するBotです。 - -これは「公式連携」ではなく、リモート操作ブリッジ(PoC)に近い構成で、リポジトリ側でも強いセキュリティ注意喚起があります。検証用途では有用ですが、本番運用では権限分離・隔離環境・規約確認を前提に扱う必要があります。 - -## 正確な比較のための言い換え - -層を意識した表現に置き換えることで、議論の精度が上がります。 - -| よくある表現 | より正確な表現 | -|---|---| -| ❌ AntigravityとClaude Code、どっちが賢い? | ✅ AntigravityとClaude Code、基盤としてどちらが使いやすい? | -| ❌ Antigravityのモデルは何? | ✅ Antigravityで今どのモデルを使っている? | -| ❌ CursorとAntigravityどっちが強い? | ✅ CursorとAntigravity、開発体験としてどう違う? | - -文脈に応じた用語の使い分けも整理しておきます。 - -| 場面 | 推奨表現 | -|---|---| -| カジュアルな会話 | 「エージェント基盤」「AI実行環境」 | -| 技術ドキュメント | 「runtime」「harness」 | -| 一般向けの説明 | 「AIを動かす土台」「AIの手足」 | - -## 「ギガ」現象:名前が意味を飲み込む - -「ギガが足りない」という表現に違和感を覚える人は、もうほとんどいないでしょう。 - -本来「ギガ」はギガバイト(GB)という単位の接頭辞であり、「通信量」そのものを意味する言葉ではありません。しかし、日常会話では「ギガ=モバイルデータ通信量」として完全に定着しています。 - -```mermaid -graph LR - subgraph 通信の世界 - GB["ギガバイト(単位)"] -.->|"意味の拡張"| Giga["「ギガ」= 通信量"] - end - - subgraph AIの世界 - Model["モデル名・基盤名"] -.->|"意味の拡張"| AI["「○○」= AI体験そのもの"] - end - - style GB fill:#95a5a6,stroke:#7f8c8d,color:#fff - style Giga fill:#3498db,stroke:#2980b9,color:#fff - style Model fill:#95a5a6,stroke:#7f8c8d,color:#fff - style AI fill:#e74c3c,stroke:#c0392b,color:#fff -``` - -同じ現象がAI分野でも進行しています。「Antigravityで書いた」「ChatGPTに聞いた」といった表現は、技術的に正確に言えば「Antigravity基盤でClaude Opusモデルを使ってコードを生成した」「ChatGPT UIでGPT-5.3モデルに質問した」となりますが、日常会話でそこまで分解する必要はありません。 - -**体験が名前を飲み込んでいくのは、言葉の自然な進化です。** それ自体は問題ではありません。 - -ただし、**ツールを比較・評価する場面では、どの層について話しているのかを意識すると、議論の質が大きく向上します。**「Antigravityすごいですよね」はそのままで構いません。しかし「AntigravityとClaudeどちらが優れていますか?」と聞かれたとき、「それは車体とエンジンのどちらが優れているかを問うのと同じ構造です」と整理できれば、より実りある議論につながるはずです。 +| モデル層 | 推論・生成を行う頭脳 | Claude / GPT / Gemini | +| 実行基盤層 | ツール呼び出し・計画・実行・検証を回す | Claude Code / Codex CLI / Antigravity Core / OpenClaw | +| UI/ブリッジ層 | 人間入力・可視化・外部チャネル接続 | IDE, Web UI, Discord Bot, CDPブリッジ | --- -*この記事は2026年3月時点の情報です。AIツールの名称・機能・料金体系は頻繁に変わるため、最新情報は各サービスの公式サイトをご確認ください。特にサブスクUIの自動操作は、規約上の扱いを必ず事前確認してください。* +## 主要ツールを「単層でなく」分類する + +| ツール | 主層 | 副層 | モデル可用性(断定レベル) | コメント | +|---|---|---|---|---| +| Antigravity | 実行基盤 + UI | - | 構成依存(時期/地域/アカウント差あり) | IDEとしての体験が強く、モデル抽象化が起きやすい | +| Claude Code | 実行基盤 | UI(CLI) | Claude(公式) | 純正CLI。拡張はMCP/Skills/Subagents | +| Codex CLI | 実行基盤 | UI(CLI) | GPT系(公式) | OpenAI側のCLI運用文脈 | +| Cursor | 実行基盤 + UI | - | マルチモデル(公式Docs参照) | IDE一体型で層混線しやすい | +| ChatGPT | UI + モデル | 一部実行機能 | GPT系 | 「モデル名=体験名」になりやすい | +| Gemini(チャット) | UI + モデル | 一部実行機能 | Gemini系 | 同上 | +| OpenClaw | オーケストレーション基盤 | UIブリッジ連携 | 接続先依存 | 複数基盤/チャネルを統合する“運用レイヤー” | + +> ポイント: 「どちらが賢いか」より、**どの層で比較しているか**を固定しないと議論が崩れます。 + +--- + +## Antigravityまわりで混線しやすい点(今回の議論ベース) + +### 1) Antigravityはモデルか? +いいえ。基本は**基盤 + UI**です。モデルそのものではありません。 + +### 2) なぜモデル扱いされる? +- ユーザーは「Antigravityを開いて使う」体験で認知する +- 内部モデルを毎回意識しない +- ブランド名が体験全体を代表する + +### 3) Discord連携(bot化)は同じ層か? +違います。多くは **UI/ブリッジ層(CDP操作)** の話です。 + +--- + +## 用語の言い換え(議論が噛み合う形) + +| 混線しやすい言い方 | 層を揃えた言い方 | +|---|---| +| AntigravityとClaude Codeどっちが賢い? | Antigravity基盤とClaude Code基盤、運用面でどっちが合う? | +| Antigravityのモデルは? | いまAntigravityのどのバックエンドモデルを使ってる? | +| CursorとAntigravityどっちが強い? | IDE体験(UI)と実行基盤の観点で何が違う? | + +--- + +## リスク整理(CDPブリッジ運用) + +antigravity-discord-botのような非公式CDPブリッジは、**技術的には有効**ですが次を分けて考えるべきです。 + +1. **技術リスク**: 権限奪取 = リモート操作リスク +2. **運用リスク**: 自動承認設定による破壊的操作 +3. **規約リスク**: UI自動化が規約上どう扱われるか + +> 「ただのリモコンだから安全」ではなく、\ +> **提供側に自動代行運用と見なされるか** が実務上の判定軸です。 + +--- + +## 今回の文脈での実務的な使い分け + +- **本番運用**: 公式APIベース(可観測性・契約明確) +- **検証/PoC**: UI/CDPブリッジ(隔離環境・最小権限) +- **日常開発**: 基盤(Claude Code等) + スキル + 必要に応じMCP + +--- + +## 参考(確認に使った一次情報) + +- Google Codelab: Getting Started with Google Antigravity + https://codelabs.developers.google.com/getting-started-google-antigravity +- Claude Code Docs (features overview / extensions) + https://code.claude.com/docs/en/features-overview +- Cursor Docs (models and pricing) + https://cursor.com/docs/models-and-pricing +- 非公式CDPブリッジ例(antigravity-discord-bot) + https://github.com/harunamitrader/antigravity-discord-bot + +--- + +*この記事は2026年3月時点の情報です。モデル提供範囲・料金・規約は短期間で更新されるため、導入前に必ず公式ドキュメントと利用規約を確認してください。*