Cursor の Max Mode と Claude モデル:課金と性能差について詳しく調べてみた(2025 年 5 月版)
分かりにくい「Cursor + Claude Max」の課金・性能差・使い所・費用対効果を整理してみました。自分なりの解釈を元に、Deep Research でブラッシュアップした内容をまとめてみました。
Cursor の Max Mode と Claude モデルの関係について、特に課金体系と性能差に焦点を当てています。
参考文献ソース
- Pricing | Cursor - The AI Code Editor
- A Complete Guide to Cursor's New Pricing: Subscriptions and Request Quotas
- How to Use Claude 3.7 Sonnet Max Mode in Cursor AI IDE
- Introducing Claude 4 - Anthropic
- Claude 4 Sonnet & Opus now in Cursor - Cursor Forum
- Confusion About New Cursor Pricing - Cursor Forum
- Using Claude Code with your Max Plan | Anthropic Help Center
- Max models and requests vs pricing : r/cursor
- Best AI Models for Cursor - SourceForge
- Pricing - Anthropic API
- Pricing - Anthropic
- Max Plan - Anthropic
- Cursor – Max Mode
- Cursor – Custom API Keys
分かったこと
課金について: Cursor の Max Mode は、通常の固定リクエスト制と違って、トークンベースの従量課金になってます。
Anthropic の Max プランに入っていても、Cursor の Max Mode を使う時は Cursor 経由(API 代に 20%上乗せ)かカスタム API キー使って Anthropic 直接払いのどちらかです。
Anthropic の Max プランって基本的に Claude.ai 向けのサブスクで、Cursor みたいなサードパーティアプリでの API 利用には直接適用されません。
性能について: Max Mode って、Claude Sonnet の出力品質そのものを変えるわけじゃないんです。
主な効果は、コンテキストウィンドウとツール呼び出しの制限を大幅に広げることで、もっと複雑なタスクやエージェント的な作業ができるようになることです。
あと、Claude Opus は Max Mode でしか使えません。
コスパについて: 普通の作業で広いコンテキストや高度なツールが要らないなら、予測しやすい固定制の通常モード(Sonnet + Max Mode OFF)が一番コスパいいです。
Max Mode は、その強化された計算パワーとコンテキストが絶対必要な、価値の高い複雑な問題用に作られてます。
1. Cursor の Max Mode って何?
Cursor AI は、AI 搭載の革新的なコードエディターです。
開発者のコーディング、ドキュメント作成、クリエイティブライティングを効率化するために作られました。
リアルタイムの提案や高品質なコンテンツ生成で生産性アップを狙ってます。
普段のコーディングから複雑なプロジェクトまで、幅広くサポートしてくれるプラットフォームです。
Max Mode は、Cursor の高度な AI 機能のコア部分で、「Cursor の高度な AI モデルの全機能」にアクセスできます。
特に「追加の処理能力とより深い分析」が必要な場面のために設計されてます。
Max Mode の登場は、Cursor が複雑な開発ワークフロー向けに、もっと強力なツールを提供しようとする継続的な取り組みの現れです。
過去の課金体系でユーザーから不満が出たのを受けて、Max Mode はより高度なニーズに応えるための進化として位置づけられてます。
Max Mode は「コストを惜しまない」機能として位置づけられていて、他の標準モデルにはないインテリジェンスと機能を提供してくれます。
特に「モデルが最も考えて推論する必要がある超難しい問題」にめちゃくちゃ効果的とされてます。
大規模なコードベースの理解、複雑な問題のデバッグ、アーキテクチャ設計、大規模なコードリファクタリングなど、高度なプログラミングタスクに特化して作られてます。
Cursor の Max Mode は、製品の差別化と上級ユーザーから収益を上げるっていう戦略的な狙いがあります。
Cursor は無料の Hobby プランに加えて、有料の Pro と Business プランを提供してます。
通常モードは固定リクエスト制なのに対し、Max Mode はトークンベースの課金に 20%マージンを乗っけてます。
この 2 つのモード戦略は、Cursor が色んなユーザー層に対応しようとしてることを表してます。
普通の作業で予測しやすいコストを求めるユーザー(通常モード)と、複雑で価値の高いタスクのために強化された機能とパフォーマンスにお金を払ってもいいユーザー(Max Mode)ですね。
Anthropic の API コストに 20%マージンを上乗せしてるのは、Cursor が付加価値機能(コンテキスト管理やツールオーケストレーションなど)で稼ごうとしてるからです。
このモデルのおかげで、Cursor は大規模言語モデルの運用にかかる莫大なコストを継続的にカバーしながら、高度な機能を提供して、ヘビーユーザーへのサービス品質を保つことができます。
これは、AI のやり取りの複雑さとリソースの使用量に応じてスケールするビジネスモデルってことですね。
2. 課金の仕組みを詳しく見てみよう
2.1. 通常モード(Max Mode OFF)について
通常モードは、メッセージ/モデルごとの固定コストで動いてます。
標準的な「リクエスト」は 1 回あたり 0.04 ドルの設定です。
Cursor のサブスクプランは利用レベルに応じて複数の階層があります。
Hobby プラン(無料)は月間 50 リクエスト。
Pro プラン(月額 20 ドル)は月間 500 回の高速リクエストで、それを使い切った後は無制限の「低速リクエスト」が使えます。
Business プラン(ユーザーあたり月額 40 ドル)は、ユーザーごとに月間 500 回の高速リクエストです。
通常モードの課金は「めちゃくちゃ予測しやすい」とされてて、日常のコーディング作業やコスト予測が大事な簡単な質問に向いてます。
このモードでは、Claude 3.5 Sonnet や Claude 4 Sonnet などのモデルが使えます。
2.2. Max Mode(ON)- トークンベースの課金について
ユーザーの認識通り、Cursor の Max Mode は常に従量課金制です。
Max Mode はトークンベースの課金システムで動いてます。
Cursor は、モデルプロバイダーの API 料金に 20%マージンを上乗せして課金します。
このマージンは、入力メッセージ、添付されたコードファイル、フォルダ、ツール呼び出し、モデルに提供される他のすべてのコンテキストを含む、全てのトークンに適用されます。
コストは、処理された入力と出力トークンの総量によって変わります。
例えば、135,000 入力トークンと 82,000 出力トークンを含む複雑なプロンプトの場合、1 回のやり取りで約 4 リクエスト分のコストがかかることがあります。
Max Mode でのツール呼び出しは、個別のリクエストとして課金されるか、トークン使用量に加算されます。
例えば、Claude 3.7 Max Mode のプロンプトは 1 リクエストあたり 0.05 ドルに加えて、1 ツール呼び出しあたり 0.05 ドルかかります。
エージェントモードでのツール呼び出しは、最初のプロンプトリクエストに加えて、個別のリクエストとしてカウントされます。
トークンベースの性質上、Max Mode のコストは予測しくいで、「大量のコンテキストを送ったら高額になっちゃう可能性がある」と言われてます。
長い会話やたくさんのツール呼び出しが必要なタスクは、コストがかなり跳ね上がることがあります。
あと、Max Mode には「低速リクエスト」って概念がありません。
ユーザーが「高速リクエスト」(月間割り当て)を使い切った場合、Max Mode を継続して使うには従量課金を有効にする必要があります。
Cursor の通常モードが「リクエスト」って抽象化された単位(1 リクエストあたり 0.04 ドル)で課金されるのに対し、Max Mode は LLM プロバイダーからの生のトークンベースコストに Cursor マージンを乗せた形で課金されます。
この抽象化単位から生トークン価格への変更は、コストの大きなブレや、固定コストに慣れたユーザーさんにとっては思ってたより高い請求になっちゃう可能性があります。
通常モードの固定コスト「リクエスト」システムは、ユーザーエクスペリエンスと予算のシンプルさを重視してます。
一方、トークンベースの Max Mode は、生の処理能力と柔軟性を重視してて、複雑な AI のやり取りの実際の計算コストを反映してます。
Max Mode のコスト予測が難しいのは、トークンベースの性質と、AI のやり取りの長さや複雑さがバラバラだからです。
表 1:Cursor モードの比較:通常モード vs. Max Mode(2025 年 5 月現在)
比較項目 | 通常モード(Max Mode OFF) | Max Mode(ON) |
---|---|---|
課金方法 | メッセージ/モデルごとの固定リクエスト(例: 1 リクエストあたり 0.04 ドル) | トークンベース(入力/出力トークン + ツール呼び出し) |
コスト計算 | 標準プロンプト(例: Claude 3.5 Sonnet)で 1 リクエスト | モデルプロバイダー API 料金 + Cursor マージン 20%。総トークン数(入力、出力、コンテキスト、ツール呼び出し)で変動。例: 135k 入力 + 82k 出力 = 約 4 リクエスト。ツール呼び出しは 1 回 0.05 ドル。 |
コスト予測しやすさ | 高い;予算立てやすい | 低い;コンテキストサイズ、プロンプトの複雑さ、ツール呼び出し回数でかなり変わる。「Cursor のリクエストをあっという間に消費する」ことあり。 |
コンテキストウィンドウ | Cursor が最適化(例: 一部モデルで 10k-120k トークン) | かなり拡大;モデルのフルコンテキストウィンドウを使用(例: Claude 3.7 で最大 200k、一部モデルで最大 1M+トークン)。最大限のコンテキスト処理に最適化。 |
ツール呼び出し制限 | 標準的 | 再プロンプトなしで最大 200 回のツール呼び出し。ツール使用にめちゃ強い。 |
使えるモデル | Claude 3.5 Sonnet、Claude 4 Sonnet | Claude 4 Opus(Max Mode 限定)。Claude 3.7 Sonnet、Claude 4 Sonnet も強化されたコンテキスト/ツールで使用可能。 |
低速リクエスト | 高速リクエストを使い切ったら使える(Pro プラン) | 使えない;高速リクエストがなくなったら従量課金を有効にする必要あり。 |
適してる使い方 | 日常のコーディング、簡単な質問、予測しやすいコスト、軽いやり取り。 | 複雑な推論、難しいバグのデバッグ、たくさんツール呼び出しが必要なエージェントタスク、大規模コードベースの理解、アーキテクチャ設計、大規模コードリファクタリング。「コスト惜しまない」場合。 |
ユーザー体験 | シンプルな課金、予期せぬ高コストのリスク低い。 | もっと強力だけど、注意深いコスト監視が必要。変動コストのため、一部ユーザーにとっては「マジで博打」。 |
2.3. カスタム Anthropic API キーを使った場合の影響
Cursor は、Anthropic などの様々な LLM プロバイダーのカスタム API キーを設定できます。カスタム API キーを使う場合、Cursor は LLM プロバイダーへの呼び出しにそのキーを使います。つまり、ユーザーが「自己負担」で Anthropic に直接利用料を払うことになります。これで、特定のモデルに関しては Cursor の内部リクエストシステムを通した課金をスキップできます。
カスタム Anthropic API キーを使う場合、課金は Anthropic の API を通した完全な従量課金制になります。Anthropic の API 料金はトークンベースで設定されてます。
ユーザーの質問に「Claude Max を契約していても」ってありますが、Anthropic の「Max プラン」は、基本的に Claude.ai のウェブ、デスクトップ、モバイルアプリでの利用を対象としたサブスクプラン(Pro プランの 5 倍利用で月 100 ドル、20 倍利用で月 200 ドル)です。
これは Anthropic の直接プラットフォーム内での「利用量アップ」や「より高い出力制限」を提供してくれます。
大事なのは、Anthropic の Max プランに入ってても、Cursor の課金システムで「無制限に使える」わけじゃないってことです。Cursor の組み込み Max Mode を使う場合、ユーザーは Cursor に(トークンベース+20%マージンで)支払います。
一方、Cursor で自分の Anthropic API キーを使う場合、ユーザーは Anthropic の API トークン料金で直接 Anthropic に払います。これは、Anthropic のサブスクプランが提供するウェブ/アプリインターフェースの利用量とは別ものです。
Anthropic の API 利用は常にトークンベースです。例えば、Claude Code では、Max プランの割り当てと API クレジットの使用を切り替えられて、API 利用は「Max プランの料金とは違う標準 API 料金で請求される」ときちんと書いてあります。
カスタム API キーにはいくつか制限があります。例えば、Tab Completion みたいな一部の Cursor 機能は特別なモデルが必要なので、カスタム API キーでは使えません。
ユーザーは、Anthropic の「Max プラン」サブスクを結んでいれば、Cursor みたいなサードパーティアプリで Claude モデルを使う時に「無制限」や大幅割引で使えると誤解しちゃうかもしれません。でも、調査した結果、Anthropic のサブスクプランは基本的に彼らの直接プラットフォーム(Claude.ai)での利用を対象としてることが明らかになりました。Cursor の Max Mode(Cursor が課金)やカスタム Anthropic API キー(Anthropic が直接課金)を使う場合、課金は従量課金制のトークンコストに戻ります。
これは、マルチプラットフォーム AI エコシステムにおける一般的な混乱点を示しています。ユーザーは、モデルプロバイダーの直接サービス(例: Anthropic の Max プラン)を購読しても、サードパーティの統合にその特典が自動的に付与されるわけではないことを理解する必要があります。各プラットフォーム(Cursor、Anthropic API)には独自の課金ロジックが存在します。このため、IDE と LLM プロバイダーの両方の課金ドキュメントを慎重に確認することが不可欠です。
表 2:Anthropic API モデル料金(トークンベースコストの参考)
モデル | 入力トークン(100 万トークンあたり) | 出力トークン(100 万トークンあたり) |
---|---|---|
Claude Opus 4 | $15 | $75 |
Claude Sonnet 4 | $3 | $15 |
Claude Sonnet 3.7 | $3 | $15 |
Claude Sonnet 3.5 | $3 | $15 |
Claude Haiku 3.5 | $0.80 | $4 |
注:料金は基本の入力/出力トークンに対するものです。キャッシュされたトークン、バッチ処理、およびサーバーサイドのツール使用には追加料金が適用される場合があります。
3. 性能とモデル機能
3.1. Claude Sonnet の品質:Max Mode ON/OFF による出力品質
ユーザーの「Max Mode ON/OFF による Claude 4 Sonnet の出力品質差はない」という認識は、モデルの固有の能力という点では概ね正確です。Max Mode は、Claude 3.5/4 Sonnet のようなモデルの核となる品質や固有の能力ではなく、主にコンテキストウィンドウとツール呼び出しの制限に影響を与えます。モデル自体の基本的な品質を変えるものではありません。
Sonnet の本来の「知性」は同じままですが、Max Mode はより大きな操作範囲へのアクセスを提供します。これは、Sonnet が単一のインタラクション内でより広範なコンテキストを活用し、より多くのツール呼び出しを実行できることを意味し、モデルがより関連性の高い情報とアクションを利用できるため、複雑なタスクにおいてより良い結果につながる可能性があります。
Claude 4 Sonnet 自体が「Claude Sonnet 3.7 の重要なアップグレード」であり、「優れたコーディングと推論能力」を提供し、「指示により正確に応答する」という点も重要です。これは、Max Mode とは独立した、モデルの核となる能力の改善です。
3.2. Claude Opus の利用可能性
Max Mode を有効にすることで Claude 4 Opus を選択できるようになるというユーザーの理解は正しいです。Claude 4 Opus は Cursor 内で「Max Mode でのみ利用可能」です。Claude 4 Opus は、「複雑なタスクに最もインテリジェントなモデル」であり、「複雑で長時間実行されるタスクやエージェントワークフローにおいて持続的なパフォーマンスを発揮する、世界最高のコーディングモデル」と評されています。200K のコンテキストウィンドウを提供し、ローカルファイルへのアクセスが許可された場合、メモリ能力において以前のモデルを劇的に上回ります。
3.3. コンテキストウィンドウとツール機能
通常モードと Max Mode の主な違いは、「Max Mode が可能な限り多くのコンテキストを処理するように最適化されている」というコンテキストの振る舞いです。これは「より大きなコンテキストウィンドウ」を意味し、Claude 3.7 のようなモデルでは最大 200,000 トークン、一部のモデルでは最大 100 万トークン以上まで可能になります。これは、大規模なコードベースの理解、複雑な問題のデバッグ、アーキテクチャの設計にとって非常に重要です。
Max Mode は「非常に高いツール呼び出し制限」を提供し、「(継続を求めずに)最大 200 回のツール呼び出し」を可能にします。これにより、AI のエージェント機能が強化され、ウェブ検索、コード実行、コードベースのセマンティック検索など、より複雑な多段階ワークフローを実行できるようになります。
Max Mode は、モデルが「最も思考し、推論する必要がある」状況のために設計されています。拡張されたコンテキストとツールアクセスは、この強化された推論能力に直接貢献し、AI がニュアンス、ユーモア、複雑な指示をよりよく理解することを可能にします。
Max Mode は、Sonnet の核となるアルゴリズムを魔法のように「賢く」するわけではありません。むしろ、Max Mode は、より複雑な問題に対して Sonnet がその潜在能力を最大限に発揮できるように、リソース(より大きなコンテキストウィンドウ、より多くのツール呼び出し)を提供します。これは、非常に熟練したシェフにより多くの食材とより良い道具を与えることに似ています。彼らの固有のスキルは変わりませんが、より手の込んだ料理を作る能力は向上します。
Opus の場合、Max Mode はその優れた機能を利用可能にするゲートキーパーとしての役割を果たします。したがって、コードベースの深い理解や複雑な多段階操作を必要とするタスクでは、Max Mode は単なる「あれば便利」なものではなく、Claude モデル、特に Opus の完全な問題解決能力を解き放つための「必須」の機能となります。
Max Mode の価値提案は、開発タスクの複雑さと範囲に結びついています。Claude 4 Sonnet や Opus のような新しいモデルの迅速な導入(2025 年 5 月)と、その機能(例: コーディング能力の向上、メモリ、ツール使用)の継続的な更新は、AI 搭載 IDE の急速な進化を示しています。Cursor がこれらのモデルを迅速に統合していることは、最先端を維持しようとするコミットメントを示しています。これは、AI IDE が最新の最も強力なモデルを統合し続け、特にエージェントワークフローにおいて、それらの潜在能力を最大限に活用するための「Max Mode」のような機能が標準的なメカニズムになるという継続的なトレンドを示唆しています。ユーザーは、継続的な更新と最適な利用戦略の潜在的な変化を予測する必要があります。
4. 費用対効果分析と戦略的利用の推奨事項
4.1. 費用対効果を考慮した通常モード(Sonnet + Max Mode OFF)の利用時期
ユーザーの「必要がなければ Sonnet + Max Mode OFF の方がコスパ良く使える」という主張は強く支持されています。通常モードは、1 リクエストあたり固定料金で予測可能なコストを提供します。このモードは、「標準的なコード編集」、「日常的なコーディング、予測可能なコスト」、「軽量な対話」、および「簡単な質問」に最も適しています。通常モードの Cursor エージェントは、「依然として最も費用対効果の高いソリューションであり、Cursor が処理するプロンプトの 90%以上で十分」であるとされています。Pro プランのユーザーは、月間 500 回の高速リクエストと、その後無制限の低速リクエストを利用できます。これにより、日常業務に十分な割り当てが提供されます。
4.2. Max Mode(Opus または強化された Sonnet 機能)が正当化される場合
Max Mode は、「モデルが最も思考し、推論する必要がある最も困難な問題」のために設計されています。これには、「複雑な推論、困難なバグのデバッグ、複数のツール呼び出しを必要とするエージェントタスク、および大規模なコードベースでの作業」が含まれます。大規模なコンテキストウィンドウ(例: 大規模なコードベースの理解、重要なコードのリファクタリング)や広範なツール使用(例: ウェブ検索、コード実行、セマンティック検索)を必要とするタスクの場合、Max Mode は不可欠です。Claude Opus 4 の優れた知能とパフォーマンスが重要なタスクに必要とされる場合、Cursor 内でそれにアクセスする唯一の方法は Max Mode です。
4.3. Max Mode でのコスト管理のヒント
Max Mode はトークンベースであり、特にツール呼び出しを伴う場合、高額になる可能性があるため、ユーザーは「コストを効果的に管理するために、どれだけのツール呼び出しをトリガーしているかに注意を払う」必要があります。Max Mode は拡張されたコンテキストウィンドウを持っていますが、「明確な指示と関連するコンテキストを提供することで、結果が劇的に改善され」、不要なトークン使用を削減できます。チャットで@シンボルを使用して特定のファイル、フォルダ、またはドキュメントを参照することで、関連するコンテキストのみが提供されるようにします。
チャットがコンテキスト制限に達した場合、パフォーマンスの低下やモデルが過剰なコンテキストに苦しむことによる潜在的なハルシネーションを避けるために、新しいチャットを開始することが推奨されます。ユーザーは、新しいダッシュボードで各モデル呼び出しが消費したリクエスト/トークン数を確認できます。これを定期的に監視することで、コスト管理に役立ちます。
非常に高い利用量を持つユーザーの場合、カスタム Anthropic API キーを設定することで、課金をより直接的に管理し、異なるレート制限を享受できる可能性があります。これは、Anthropic に直接支払うことになるためです。ただし、これには Anthropic 自身の API 課金を管理し、その料金体系を理解する必要があります。
あるユーザーは、MAX モデルの使用を「真の博打」と表現しています。これは、1 ツール呼び出しあたり 0.05 ドルのコストと、放置すればコストが急増する可能性を指摘しています。この生々しい表現は、特に多くのツール呼び出しや広範なコンテキストを伴う複雑なエージェントタスクにおいて、管理されていない Max Mode の使用に関連する重大な財務リスクを強調しています。
このことは、高度な AI 機能、特に Max Mode を使用する際に、コスト監視、プロンプトエンジニアリング、戦略的なタスク割り当てが極めて重要であることを示しています。開発者は、技術的に熟練しているだけでなく、AI 支出を最適化するために経済的な意識も持つ必要があります。Cursor のダッシュボード機能は、この可視性を提供する上で不可欠です。
通常モードの予測可能な固定コストと Max Mode の変動するトークンベースコストの明確な区別は、根本的なトレードオフを提示します。ユーザーは、Max Mode の強化されたパフォーマンス、コンテキスト、およびモデルアクセスが、コストの変動性と潜在的な高額支出に見合うかどうかを判断する必要があります。このトレードオフは、大規模言語モデルの性質に固有のものです。より深い推論とより大きなコンテキストウィンドウは、本質的に多くの計算リソースを消費し、結果として高額で予測しにくいコストにつながります。Cursor の課金構造は、この根本的な現実を反映しており、ユーザーがコスト管理と AI の能力のバランスを選択できるようにしています。
5. 結論
Cursor の Max Mode における Claude モデルとの課金と性能差に関するユーザーの初期の要約(2025 年 5 月時点)は概ね正確であり、強固な基盤となっています。しかし、より深い分析を行うと、最適な利用とコスト管理のために不可欠な重要なニュアンスが明らかになります。
主要なポイント
課金は複雑: Cursor の Max Mode は確かに常に従量課金制(トークンベース)であり、Anthropic の Max プランを契約していても、Cursor の課金システム内で「無制限」に利用できるわけではありません。ユーザーは Cursor に(20%のマージンを加えて)支払うか、カスタム API キーを介して Anthropic に直接支払うかのいずれかであり、どちらもトークンベースです。
性能はコンテキストに依存: Max Mode は Claude Sonnet の固有の品質を向上させるものではありませんが、コンテキストウィンドウとツール呼び出しの制限を拡張することで、その運用能力を大幅に強化します。より強力なモデルである Claude Opus は、Max Mode でのみ利用可能です。
戦略的な利用が最重要: 予測可能なコストでルーチンタスクを実行するには、通常モードが最も費用対効果が高いです。Max Mode は強力ですが、潜在的に高額なツールであり、その拡張された機能と Opus へのアクセスが大きな価値を提供する、複雑でコンテキスト集約的な、またはエージェント的なタスクのために予約されるべきです。
監視と最適化: Max Mode のコストは変動するため、利用状況の継続的な監視と戦略的なプロンプトエンジニアリングが効果的なコスト管理のために不可欠です。
これらの違いを理解することで、ユーザーは情報に基づいた意思決定を行い、Cursor の AI 機能を効率的に活用しながら、急速に進化する AI 環境における支出を最適化することができます。