Claude Opus 4.6 料金 — $5/$25・Fast mode・Batch 割引まとめ
Claude Opus 4.6 の料金体系を、標準 API 単価・Batch 割引・Fast mode・1M コンテキストの追加コストまで一次情報で整理する。前世代からの大幅値下げで、実際にいくらで使えるのかがわかる。
Contents (10)
- Claude Opus 4.6 とは — 2026 年 2 月リリースの 1M コンテキストモデル
- 標準 API 料金 — 入力 $5・出力 $25/百万トークン
- Opus 4.1 比 67% 値下げ — モデル別価格比較表
- バッチ API — 50% 割引で入力 $2.50・出力 $12.50
- Fast mode — 即時応答が $30/$150 で買える
- プロンプトキャッシュ — キャッシュ読み出しで 90% 節約
- 1M コンテキスト — 長文リクエストも標準価格
- データ居住地・推論 US 指定 — 1.1 倍の加算
- コスト試算例 — 月間利用量別の概算
- Opus 4.6 の用途 — どんなタスクに向いているか
Claude Opus 4.6 とは — 2026 年 2 月リリースの 1M コンテキストモデル
Claude Opus 4.6 は Anthropic が 2026 年 2 月 4 日にリリースしたフラッグシップモデルである。OpenRouter の情報によれば、「Anthropic's strongest model for coding and long-running professional tasks」と位置づけられており、複雑なコードベース・大規模リファクタリング・マルチステップデバッグへの対応を強みとする。
コンテキストウィンドウは 1M トークン(100 万トークン)。Opus 4.5 の 200K トークンから大幅に拡張されており、長大なコードベース・ドキュメント・会話履歴をまとめて処理できる点が特徴だ。利用可能なプラットフォームは Claude API、claude.ai、Azure、AWS Bedrock、Google Vertex AI の 5 経路。
価格面では Opus 4.5 と同じ $5/$25 の水準を維持しつつ、Fast mode(高速推論)と 1M コンテキストウィンドウという二つのアップグレードを提供したモデルと理解できる。
出典: OpenRouter — Claude Opus 4.6 / Anthropic API Pricing
標準 API 料金 — 入力 $5・出力 $25/百万トークン
Anthropic 公式ドキュメントに掲載されている Claude Opus 4.6 の標準価格は以下のとおり。
| 項目 | 料金(百万トークンあたり) |
|---|---|
| 入力トークン(標準) | $5.00 |
| 出力トークン | $25.00 |
この価格は Opus 4.5・Opus 4.7 と同一である。Anthropic は Opus 4.5 世代で「Sonnet 相当の料金で Opus 相当の性能」という方針を打ち出し、以降の Opus 系モデルはこの価格帯を踏襲している。
1 回のリクエストあたりのコスト感を把握するため、実際の利用シーンで試算してみる。
- 通常のチャット1往復(入力 1,000 トークン・出力 500 トークン): 約 $0.0175
- 長いコードレビュー(入力 10,000 トークン・出力 5,000 トークン): 約 $0.175
- 大規模ドキュメント処理(入力 100,000 トークン・出力 20,000 トークン): 約 $1.00
API を直接呼ぶ場合、個人開発のPoC 段階ではほぼ問題にならないコストだが、月間数百万〜数千万トークンを消費するプロダクション規模になると最適化の余地が出てくる。
Opus 4.1 比 67% 値下げ — モデル別価格比較表
Claude Opus 系の価格推移を整理すると、Opus 4.5 世代での値下げがいかに大きかったかが分かる。
| モデル | 入力($/MTok) | 出力($/MTok) | ステータス |
|---|---|---|---|
| Claude Opus 4 | $15 | $75 | 廃止(Vertex AI のみ残存) |
| Claude Opus 4.1 | $15 | $75 | 非推奨(deprecated) |
| Claude Opus 4.5 | $5 | $25 | 現行 |
| Claude Opus 4.6 | $5 | $25 | 現行 |
| Claude Opus 4.7 | $5 | $25 | 現行 |
| Claude Opus 4.8 | $5 | $25 | 現行(最新) |
Opus 4.1 では入力 $15・出力 $75 だったところが、Opus 4.5 で入力 $5・出力 $25 に下がった。入力換算で 67%、出力換算でも 67% の値下げである。これ以降の Opus 系(4.5〜4.8)はすべて同一の $5/$25 の価格体系を採用しており、モデルが新しくなっても追加コストが発生しない点は重要だ。
なお、Opus 4.7 以降は新しいトークナイザーを採用しており、同一テキストでも最大 35% 多くのトークンを消費する可能性がある点に注意が必要だ。Opus 4.6 は旧トークナイザー世代にあたるため、この影響は受けない。
バッチ API — 50% 割引で入力 $2.50・出力 $12.50
Batch API(バッチ API)を使用すると、通常料金の 50% 割引が適用される。非同期処理で最大 24 時間の応答時間を許容する代わりにコストを半減できる。
| 項目 | 料金(百万トークンあたり) |
|---|---|
| バッチ入力トークン | $2.50 |
| バッチ出力トークン | $12.50 |
バッチ API が向いているユース ケース:
- 大量の文書をまとめて翻訳・要約する処理
- データセット全体に対するラベリング・分類タスク
- レポート生成など夜間バッチ処理で翌朝に結果が欲しい場面
- コスト削減を優先し、応答速度を妥協できる開発環境での評価実行
バッチ API は Fast mode とは組み合わせられないことに留意が必要だ。速度とコストはトレードオフの関係にあり、リアルタイム用途には標準 API または Fast mode を、非同期バッチ処理には Batch API を選ぶという使い分けが基本になる。
出典: Anthropic — Batch processing pricing
Fast mode — 即時応答が $30/$150 で買える
Fast mode は「research preview」として提供されている高速推論機能で、Claude Opus 4.6・4.7・4.8 で利用できる。通常より大幅に速い応答を得る代わりに、標準料金の 6 倍のプレミアム料金が発生する。
| モデル | Fast mode 入力 | Fast mode 出力 |
|---|---|---|
| Claude Opus 4.6 / 4.7 | $30/MTok | $150/MTok |
| Claude Opus 4.8 | $10/MTok | $50/MTok |
注目すべき点として、Opus 4.8 の Fast mode 料金($10/$50)は Opus 4.6/4.7 の Fast mode($30/$150)よりも大幅に安い。速度優先の用途では Opus 4.8 を選ぶ方が経済的だ。
また Fast mode は Claude Platform on AWS では利用不可、Batch API との併用も不可という制約がある。ただし、プロンプトキャッシュとデータ居住地の料金乗数は Fast mode 価格に対しても適用されるため、キャッシュを活用すれば Fast mode の実質コストを下げることができる。
Fast mode が有効な場面:
- リアルタイムの会話 UI でレイテンシを最小化したい
- ユーザーが画面の前で待機しているインタラクティブなコーディング支援
- 時間制約のある処理で応答速度が KPI に影響するプロダクト
出典: Anthropic — Fast mode pricing
プロンプトキャッシュ — キャッシュ読み出しで 90% 節約
プロンプトキャッシュは、同じシステムプロンプトや長いドキュメントを繰り返し送る場合に大きなコスト削減をもたらす機能だ。Opus 4.6 での価格は以下のとおり。
| 操作 | 料金(入力基準の乗数) | 具体的な金額(MTok) |
|---|---|---|
| キャッシュ書き込み(5 分) | 1.25 倍 | $6.25 |
| キャッシュ書き込み(1 時間) | 2.0 倍 | $10.00 |
| キャッシュ読み出し | 0.1 倍 | $0.50 |
5 分キャッシュの場合、書き込みコストを 1.25 倍払う代わりに、2 回目以降のリクエストではキャッシュ読み出し($0.50/MTok)が適用される。標準入力 $5 に対してキャッシュ読み出しは $0.50 なので、1 回のキャッシュヒットで元が取れ、以降はリクエストごとに 90% のコスト削減が得られる計算になる。
長いシステムプロンプト(1万〜10万トークン)を大量のリクエストで共有する RAG システムや、同じドキュメントに対して複数の質問をするチャットボットでは、プロンプトキャッシュの導入が特に効果的だ。
自動キャッシュ(リクエスト最上位に cache_control フィールドを追加)と明示的キャッシュブレークポイント(特定コンテンツブロックへの cache_control 直接付与)の 2 種類の有効化方法がある。
出典: Anthropic — Prompt caching pricing
1M コンテキスト — 長文リクエストも標準価格
Opus 4.6 のコンテキストウィンドウは 1M トークン(100 万トークン)である。Anthropic の公式ドキュメントによれば、1M コンテキストの全範囲に標準料金が適用される。90 万トークンのリクエストも 9,000 トークンのリクエストも、同じトークン単価で課金されるということだ。
これは以前の「一定トークン数を超えると割増料金」という構造とは異なり、大規模リクエストのコスト予測が単純になる。
1M トークンのコンテキストで実際にできることのイメージ:
- 数十万行規模のコードリポジトリ全体を一度に読み込んでリファクタリング案を生成する
- 書籍 1 冊分(約 10 万〜15 万語)を複数冊まとめて要約・比較する
- 長期間にわたる会話履歴(数千ターン)を保持しながら対話を継続する
- 大量のログデータや API レスポンスをそのままコンテキストに流し込んで分析する
プロンプトキャッシュとバッチ API の割引は、1M コンテキスト範囲においても同じ条件で適用される。
出典: Anthropic — Long context pricing
データ居住地・推論 US 指定 — 1.1 倍の加算
Opus 4.6 以降のモデルでは、API リクエストに inference_geo: "us" パラメータを付与することで、推論処理を米国内のインフラに限定できる。この場合、すべてのトークン料金カテゴリ(入力・出力・キャッシュ書き込み・キャッシュ読み出し)に 1.1 倍の乗数が加算される。
| 設定 | 入力 | 出力 |
|---|---|---|
inference_geo: "global"(デフォルト) |
$5.00/MTok | $25.00/MTok |
inference_geo: "us"(米国限定) |
$5.50/MTok | $27.50/MTok |
デフォルトの global はグローバルルーティングで標準価格。医療・金融・公共など、データの地理的処理場所をコンプライアンスで明示する必要がある用途向けに us オプションが用意されている。
なお、この機能は Claude API(Anthropic 直接)と Claude Platform on AWS にのみ対応している。Amazon Bedrock や Google Vertex AI はプラットフォーム側で独自の地域エンドポイント料金体系を持つため、別途各プラットフォームの価格表を参照する必要がある。
出典: Anthropic — Data residency pricing
コスト試算例 — 月間利用量別の概算
実際に Opus 4.6 の API を使う場合、用途や規模によってコストは大きく変わる。標準 API 料金($5/$25)を前提にした月間コストの概算を示す。
個人開発・PoC 規模(月間入力 100 万トークン・出力 50 万トークン):
| 項目 | 計算 | 金額 |
|---|---|---|
| 入力 | 1 MTok × $5 | $5.00 |
| 出力 | 0.5 MTok × $25 | $12.50 |
| 合計 | — | $17.50/月 |
中規模プロダクション(月間入力 1,000 万トークン・出力 500 万トークン):
| 項目 | 計算 | 金額 |
|---|---|---|
| 入力 | 10 MTok × $5 | $50.00 |
| 出力 | 5 MTok × $25 | $125.00 |
| 合計 | — | $175/月 |
バッチ API(50% 割引)を活用した場合、同じ処理量で $87.50/月 に半減できる。
コスト最適化のポイントは大きく 3 点に絞られる。
- 非リアルタイム処理は Batch API(50% 割引)に切り替える
- 共通のシステムプロンプトや参照ドキュメントはプロンプトキャッシュで再利用する
- タスクの複雑度に応じてモデルを使い分け、単純タスクは Haiku 4.5(入力 $1/出力 $5)や Sonnet 4.6(入力 $3/出力 $15)を選ぶ
Opus 4.6 の用途 — どんなタスクに向いているか
料金の話と合わせて、Opus 4.6 が実際にどんなタスクで使われるかを整理しておく。
コーディング・開発では、大規模コードベースのリファクタリング、複数ファイルにまたがるバグ修正、マルチステップのデバッグセッションが主な用途だ。1M コンテキストを使えばリポジトリ全体を一度に処理できる。
エンタープライズワークフローでは、財務分析・深い調査・ドキュメント処理を自律的に進めるエージェント用途に設計されている。単一プロンプトへの応答ではなく、ワークフロー全体を通した一貫性が強みとされる。
技術ドキュメント・計画立案では、「near-production-ready な成果物を生成でき、長時間のセッション中も一貫性を保つ」という特性が活きる(出典: eesel.ai)。
なお、Sonnet 4.6(入力 $3・出力 $15)は Opus 4.6 よりも安価であり、多くの日常的なタスクでは Sonnet で十分な精度を得られる。Opus 4.6 を選ぶのは、Sonnet で解けない高難度のコーディングや、長期にわたる自律的なタスク実行が必要な場面に絞るのが費用対効果の高い使い方だ。
出典: eesel.ai — Claude Opus 4.6 pricing and capabilities / Anthropic — Model pricing