AIは使い放題から原価管理へ: Token Economyが経営に与える影響
AIは「月額料金を払えば使い放題のソフトウェア」ではなくなりつつあります。
Microsoft 365ではAI creditsが導入され、Salesforce AgentforceはFlex Creditsや会話単位の課金を用意し、GitHub Copilotも2026年6月1日からAI Creditsによるusage-based billingへ移行します。
一見ばらばらに見えるこれらの価格変更は、同じ構造を示しています。
AIは使われるほど原価が発生する。そして、その原価を測る代表的な単位がtokenです。
この記事では、エンジニア向けの細かい技術論ではなく、経営・コンサルティングの視点からToken Economyを整理します。
いま何が起きているのか
まず、最近の動きを3つ見ておきます。
| 企業・サービス | 何が起きているか | 経営上の意味 |
|---|---|---|
| Microsoft 365 | Copilotや画像生成などのAI機能にAI creditsを導入 | 日常業務AIも、裏側では利用量を管理する方向へ進んでいる |
| Salesforce Agentforce | Flex Credits、Conversations、per-user licensingなど複数の課金方式を提示 | AIエージェントを「席数」だけでなく、業務量や成果に近い単位で売ろうとしている |
| GitHub Copilot | 2026年6月1日からAI Creditsへ移行し、input / output / cached tokensに基づいて利用量を計算 | 短い質問と長時間の自律エージェント作業を同じ料金では扱えなくなった |
GitHubは開発者向けの例ですが、ここで起きていることは開発部門だけの話ではありません。
同じ構造は、営業、カスタマーサポート、バックオフィス、法務、調達、経営企画にも広がります。
AIが「人の作業を補助する機能」から「業務を実行するエージェント」へ進むほど、利用量の差が大きくなります。
短い要約を1回作るのと、AIエージェントが複数の資料を読み、外部ツールを使い、何度も考え直し、最終成果物を出すのとでは、裏側の原価がまったく違います。
Token Economyとは何か
Tokenとは、AIモデルが文章やコードを処理するための小さな単位です。
日本語の文字、英単語、記号、空白、コードの断片などが、モデル内部ではtokenに分解されます。
ただし、経営の視点では、tokenを細かく理解する必要はありません。
重要なのは次の点です。
Tokenは、AIサービスの利用量と原価を測るための会計単位である。
たとえばAIモデルのAPIでは、多くの場合、次のような単位で料金が決まります。
| 種類 | 意味 | 経営上の見方 |
|---|---|---|
| Input tokens | AIに読ませる文章、指示、資料、会話履歴 | 何をどれだけ読ませるかが原価になる |
| Output tokens | AIが生成する回答、文章、コード | 長く書かせるほど原価と待ち時間が増える |
| Cached input tokens | 以前読ませた内容を再利用する入力 | 設計次第で原価を大きく下げられる |
| Reasoning / thinking tokens | AIが内部で考えるために使う処理量 | 複雑な問題やエージェント作業で増えやすい |
| Tool-related tokens | 検索、コード実行、外部システム連携の結果 | AIが業務システムを使うほど増える |
つまりToken Economyとは、単に「AIの料金表」の話ではありません。
AIが業務を実行するとき、その仕事1件あたりにどれだけの計算資源を使い、誰がその原価リスクを持つのか、という経済設計の話です。
なぜ固定サブスクだけでは難しいのか
従来のSaaSは、seat課金と相性がよいビジネスでした。
1人あたり月額いくら、という形です。
もちろんサーバー費用はかかりますが、ユーザーが少し多く使ったからといって、売上に比例して大きな原価が発生するわけではありませんでした。
AI SaaSでは、この前提が崩れます。
AI機能は、使われるほど推論コストが発生します。
しかも、その使われ方には大きな差があります。
| 利用パターン | 例 | 原価の特徴 |
|---|---|---|
| 軽い利用 | メール文面の修正、短い要約、翻訳 | 比較的安定して低い |
| 中程度の利用 | 提案書ドラフト、議事録整理、FAQ回答 | 入力資料と出力量で差が出る |
| 重い利用 | コード修正、契約書レビュー、調査エージェント、CS自動対応 | 複数回の推論、ツール利用、長文コンテキストで原価が膨らむ |
同じ月額料金の中に、この3種類の利用をすべて入れると、ベンダー側の粗利が読みにくくなります。
軽いユーザーでは利益が出ても、重いユーザーでは赤字になる可能性があります。
これが、AI SaaSがcredits、usage-based billing、outcome pricingに向かう理由です。
経営にとっての本当の論点
Token Economyの本質は、技術ではなく経営管理です。
特に重要なのは、次の4つです。
1. 粗利構造が変わる
従来SaaSでは、ソフトウェアの限界費用は小さいという前提がありました。
AI SaaSでは、利用が増えるほど推論コストも増えます。
AIエージェントが長時間働くほど、モデル呼び出し、入出力token、キャッシュ、ツール実行、場合によっては人間の確認コストも増えます。
つまりAI SaaSは、ソフトウェアでありながら、BPOやクラウドインフラに近い原価感覚を持ち始めています。
2. 価格設計が複雑になる
AIサービスの価格は、単純なseat課金から次のような組み合わせに移っています。
| 価格モデル | 内容 | 向いている用途 |
|---|---|---|
| Seat pricing | ユーザー数に応じて課金 | 軽い日常利用、社内展開 |
| Credit-based pricing | 月額に一定の利用枠を含め、超過分を追加課金 | 幅広い利用量を管理したい場合 |
| Usage-based pricing | 実際の利用量に応じて課金 | 重いエージェント利用、API利用 |
| BYOK | 顧客が自分のAPI keyを持ち込む | 大企業、セキュリティ重視、原価を顧客側で管理したい場合 |
| Outcome pricing | 解決1件、会話1件、処理1件など成果単位で課金 | カスタマーサポート、営業、業務代行型AI |
外から見ると、AI価格は複雑に見えます。
しかし内側では、ほぼ同じ問いに答えようとしています。
推論コストの変動リスクを、ベンダー、顧客、クレジットプール、成果単位のどこに置くのか。
3. 予算統制が必要になる
AIツールは、導入時には小さく見えます。
しかし本番利用が進むと、利用量は急に増えます。
特にエージェント型AIでは、1回の依頼が裏側で何十回ものモデル呼び出しになることがあります。
そのため企業側には、次のような管理が必要になります。
- 部門別のAI利用量
- ユーザー別のheavy usage
- モデル別のコスト
- 1業務あたりのAIコスト
- 月次予算と超過アラート
- どの業務に高性能モデルを使うべきかのルール
AI予算は、単なるライセンス管理ではなく、usage governanceの問題になります。
4. ベンダー選定の基準が変わる
これからのAIベンダー選定では、機能比較だけでは足りません。
次の質問が重要になります。
| 確認すべき質問 | なぜ重要か |
|---|---|
| 料金はseat、credit、usage、outcomeのどれか | 予算の読みやすさが変わる |
| 超過利用はどう課金されるか | 本番展開後の想定外コストを避ける |
| 利用量を部門別・ユーザー別に見られるか | コスト配賦と統制に必要 |
| 高性能モデルと低価格モデルを使い分けられるか | 品質と原価のバランスを取る |
| BYOKは可能か | セキュリティ、調達、原価管理に関わる |
| キャッシュやBatch処理を活用できるか | 同じ業務を安く処理できる |
| 成果単位の料金なら、成果の定義は何か | ベンダーと顧客の責任分界に関わる |
Tokenは表から消え、裏側に残る
ここで注意すべきことがあります。
将来、ユーザーがtoken単位でAIを買い続けるとは限りません。
むしろ、経営層や業務部門にとって、tokenはわかりにくい単位です。
カスタマーサポート部門が知りたいのは、「100万tokenでいくらか」ではありません。
知りたいのは、次のような数字です。
- 問い合わせ1件をいくらで解決できるか
- 営業提案書1本をいくらで作れるか
- 契約書レビュー1件をいくらで処理できるか
- 月間のAI利用料が予算内に収まるか
- 人間が対応した場合と比べて、品質とコストはどうか
そのため、Token Economyの未来は「すべてがtoken課金になる」という話ではありません。
むしろ逆です。
Tokenは、表の価格単位から、裏側の原価会計単位へ移っていく。
ユーザーにはseat、credit、conversation、resolution、workflow、outcomeとして見える。
しかしベンダーの内部では、token、GPU時間、キャッシュ率、モデル単価、ツール実行時間が厳密に管理される。
この二重構造が、AI時代の価格設計になります。
企業がいま持つべき視点
AI活用を考える企業は、「どのAIツールを入れるか」だけではなく、「AI利用をどう管理するか」を考える必要があります。
見るべき指標は、単なる利用者数ではありません。
| 指標 | 意味 |
|---|---|
| Cost per task | 1件の業務をAIで処理する原価 |
| Cost per resolution | 問い合わせ1件を解決するコスト |
| Cost per employee assisted | AIで支援される従業員1人あたりのコスト |
| Token / credit consumption by team | 部門別の利用量 |
| Cache hit rate | 同じ情報を再利用できているか |
| Human review rate | AIの成果物に人間確認がどれだけ必要か |
| Business outcome per AI spend | AI支出がどの成果に結びついたか |
経営陣が見るべきなのは、AI利用量そのものではありません。
AI支出が、どの業務成果に変換されているかです。
まとめ
Token Economyは、AI業界の専門用語に見えます。
しかし本質は、経営の話です。
AIは、従来のSaaSのような「ほぼ固定費のソフトウェア」ではなく、使われるほど原価が発生する業務インフラになりつつあります。
その原価をどう測るか。
誰が変動リスクを持つのか。
どの単位で顧客に価格を見せるのか。
どの業務に高価なAIを使い、どの業務は安価なモデルやBatch処理で済ませるのか。
これらは、CIOやIT部門だけでなく、経営企画、CFO、事業責任者、コンサルティングプロフェッショナルが考えるべきテーマです。
AIの価格は、これからますます「使った分だけ」に近づきます。
ただし、顧客が直接tokenを見るとは限りません。
表ではcredit、conversation、resolution、workflowとして売られ、裏側ではtokenで原価管理される。
それが、AI時代のToken Economyです。
参考リンク
- Microsoft 365 AI credits and limits
- Salesforce Agentforce Pricing
- Intercom Fin pricing
- GitHub Copilot usage-based billing
- OpenAI API Pricing
- Anthropic Claude Pricing
- Google Gemini API Pricing
- Epoch AI inference price trends
ツゥ 2026 Keith Chen. All rights reserved.