Mail

AIモデルの発表には二つのパターンがある。ベンチマーク数値を並べるだけの発表と、実際に何かを変える発表。Claude 4.6世代は後者に属する。

Anthropicは2026年2月5日にClaude Opus 4.6を、2月17日にClaude Sonnet 4.6をリリースした。両モデルとも100万トークンのコンテキスト窓を標準搭載し、コーディング・エージェントワークフロー・長文推論で前世代から明確な進化を見せた。価格は前世代と変わらない。

両モデルが共有する核心機能

100万トークンのコンテキスト窓

Opus 4.6とSonnet 4.6はともに100万トークンのコンテキスト窓を追加料金なしで標準提供する。

実感しにくければこう考えてみよう。一般的な小説1冊が約10万トークン。100万は小説10冊分のテキストを一度に扱える規模だ。大規模なコードベース全体、何百もの文書、学期全体の教育資料をコンテキストに入れた対話が可能になった。

Adaptive Thinking（適応型推論）

thinking: {type: "adaptive"}が両モデルで推奨される推論モードになった。Claudeが問題の複雑さに応じて、どれだけ深く考えるかを自律的に判断する。シンプルな質問には素早く、複雑な問題には深く考える。

動的ウェブ検索フィルタリング

ウェブ検索・フェッチツールが動的フィルタリングをサポート。Claudeが結果をコンテキスト窓に入れる前にコードを実行して関連情報だけを抽出する。より正確な回答と低いトークン消費を同時に実現する。

自動コンテキスト圧縮

会話がコンテキスト上限に近づくと、サーバー側で自動的に以前の会話を要約し、事実上無限の会話が可能になる。長期プロジェクトをAIと継続的に進める際に中断なく続けられる。

Opus 4.6専用: Agent Teamsと128k出力

Agent Teams — 並列エージェント協働

Opus 4.6の最も注目すべき機能がAgent Teamsだ。複数のClaudeインスタンスがプロジェクトの異なる部分を同時に処理する。ソフトウェアプロジェクトを例にすると：

インスタンスA → テスト作成
インスタンスB → モジュールのリファクタリング
インスタンスC → ドキュメント更新

三つの作業が順次ではなく並列で進む。複雑なマルチステップ作業の完了時間が大幅に短縮される。

128k出力トークン

Opus 4.6は最大128k出力トークンをサポート。長いエージェント実行や大規模なコード生成で途中で切れる問題が解消された。

比較項目	Opus 4.6	Sonnet 4.6
コンテキスト窓	100万トークン	100万トークン
最大出力	128kトークン	標準
Agent Teams	✅ 対応	❌ 非対応
価格（入力/出力）	$15/$ 75 per MTok	$3/$ 15 per MTok

Sonnet 4.6の躍進: ARC-AGI-2と数学能力

ARC-AGI-2: 4.3倍向上

ARC-AGI-2はAIの汎用推論能力を測る難しいベンチマークだ。Sonnet 4.6は13.6%から58.3%へ向上。Claude史上単一世代での最大上昇幅を記録した。

数学スコア大躍進

数学スコアが62%から**89%**へ上昇。以前の中間モデルが数学に弱点を見せていたとすれば、Sonnet 4.6はデータ分析や定量的作業で信頼できるレベルに達した。

コスト対性能

SWE-bench Verified（ソフトウェアエンジニアリング能力）基準：

Opus 4.6: 80.8%
Sonnet 4.6: 79.6%（差: 1.2%ポイント）
価格差: SonnetはOpusの1/5のコスト

多くのタスクでSonnet 4.6がOpus級の結果を1/5の価格で提供できる。

開発者・教育者のための実践ヒント

モデルが強くなるほど、うまく使う方法を知ることが重要になる。

教育現場でのClaude 4.6活用シナリオ:

カリキュラム全体分析: 100万トークンコンテキストで一学期分の教育資料を一度に分析
学生ごとのフィードバック自動化: Opus 4.6のAgent Teamsで複数学生の課題を並列処理
長文研究論文の要約: 100ページ以上のPDFを丸ごと入れて核心質問ベースの要約
数学・データ分析授業: Sonnet 4.6の向上した数学能力を問題解決支援に活用
プロンプトインジェクション対策: 学生がAIを「騙そうとする」試みへの安全な対応

Claude 4.6が示す方向性

Claude 4.6世代のメッセージはシンプルだ。AIが一度に扱える規模が大きくなり、同時に複数のことができるようになった。

100万トークンコンテキストは「AIがプロジェクト全体を記憶する」ことを意味し、Agent Teamsは「AIが複数の役割を同時に担う」ことを意味する。エデュテック視点では、単純な質疑応答の助手を超えて、学習プロセス全体を共に設計し実行する協力者としてAIを活用する可能性が現実化したことを意味する。

関連記事

Claude 4.6で最もやってみたい作業は何ですか？コメントで教えてください！

Sources:

Claude 4.6 完全解説 — 1Mコンテキスト・Agent Teams・ARC-AGI-2の躍進

目次