大きなコンテキストを含む作業、Claudeが一番得意らしい…。|Claude Sonnet 4.6 およびOpus 4.6にて100万コンテキストが標準で利用可能に

Anthropicは、Claude Opus 4.6およびSonnet 4.6において、100万トークンのコンテキストウィンドウを一般公開したことを発表した。本アップデートにより、膨大な情報処理における制限が緩和され、強豪モデルと比較して長文脈下での性能低下が最も起こりにくいことがベンチマークを元に主張されている。

100万コンテキストの標準化と料金体系

今回の一般公開により、100万トークン全体にわたって標準価格が適用される仕様となった。Opus 4.6は100万トークンあたり入力5ドル/出力25ドル、Sonnet 4.6は入力3ドル/出力15ドルで提供される。トークン数に応じた価格の乗数はなく、ロングコンテキスト利用時の追加料金(プレミアム)は完全に撤廃されている形だ。

直近では、OpenAIGPT-5.4もコンテキストウィンドウが広がり、カタログスペック上ではGPT、Gemini、Claudeで差異がなくなっていた。しかし、各社ともに大きなコンテキストを使用するためには追加の料金を必要としていた。今回のAnthropicの決定は競争力を維持するという理由もあるとみられる。

↓ GPT-5.4 について詳しくはこちらの記事をどうぞ

↓ Gemini 3.1 Pro について詳しくはこちらの記事をどうぞ

メディア処理上限も大幅な拡大

テキスト情報の処理能力拡張に伴い、視覚データや文書ファイルの読み込み制限も緩和された。1リクエストあたりに入力できる画像やPDFページの上限が、従来の100枚から最大600枚へと引き上げられている。これにより、大規模なコードベース、長大な契約書、および複数のファイルにまたがるログデータなどを分割せずに一括で処理することが可能となった。

長文脈下における検索精度と推論能力の維持

Anthropic社のアナウンス記事より引用

コンテキストの長大化に伴う情報の見落としや精度低下は、言語モデルにおける主要な課題とされてきた。公式発表によると、100万トークン入力時のテストにおいて、Opus 4.6はMRCR v2で78.3%、Sonnet 4.6はGraphWalks BFSで68.4%のスコアを記録している。これらの数値は、同等のコンテキスト長を扱う最新モデルの中で最高水準として位置づけられており、膨大なデータを入力した際にも必要な情報を正確に抽出し、推論を行う能力が維持されていることを示している。

他社がAnthropicの仕掛けた競争に乗っかってくるか、注目です。

カテゴリ: AI・人工知能
この記事を書いた人
Seita Namba
イグナイトbiz 編集長