Claudeが41日で新モデル投入

2026/06/01

Anthropicは2026年5月28日、最新モデル「Claude Opus 4.8」をリリースしました。前モデルのOpus 4.7からわずか41日後の後継リリースで、数百の並列エージェントを使って数十万行規模のコードを一括書き換えできる「Dynamic Workflows」が最大の特徴です。
処理速度は2.5倍に向上し、価格は前モデルと同水準を維持しています。不正行為率の大幅な低減や正直さの向上など、安全性面でも改善が図られています。

【出典元】Introducing Claude Opus 4.8（Anthropic）

1. 主な改善点とベンチマーク結果
ベンチマークでGPT-5.5を上回る
Fast Modeで速度2.5倍・コスト3分の1
Effort Controlで応答品質を選択可能に
2. Dynamic Workflowsとは何か
数百のエージェントが並行して動く仕組み
想定されるユースケース
使い方と注意点
3. SNSでのリアルな反応
ポジティブな評価
ネガティブな声・懸念点
4. まとめ

主な改善点とベンチマーク結果

Claude Opus 4.8では、速度・コスト・安全性の三方向で改善が行われています。

ベンチマークでGPT-5.5を上回る

各種ベンチマークでの評価結果は以下のとおりです。

ベンチマーク	スコア・結果
Terminal-Bench 2.1	GPT-5.5を上回る
OSWorld-Verified	82.3%
Online-Mind2Web	84%（前モデル比で顕著な向上）
Legal Agent Benchmark	業界初の10%以上達成

コード補完・エージェント操作・法律分野の専門タスクまで幅広く評価され、いずれも前世代モデルから大きく改善されています。

Fast Modeで速度2.5倍・コスト3分の1

Opus 4.8には通常モードとFast Modeの2種類の動作モードが用意されています。

モード	入力（100万トークン）	出力（100万トークン）
通常モード	$5	$25
Fast Mode	$10	$50

Fast Modeは前モデル比でコストが3分の1となり、処理速度は2.5倍に向上しています。価格体系はOpus 4.7と同額に設定されており、コストを据え置いたまま性能が向上しています。

なお、プロンプトキャッシングを利用すると最大90%のコスト削減、バッチ処理では50%の削減が可能です。コンテキストウィンドウは100万トークン、最大出力は128,000トークンとなっています。

Effort Controlで応答品質を選択可能に

Claude.aiとCoworkでは「Effort Control」機能が追加され、応答の品質と速度のバランスをユーザー自身が選択できるようになりました。また、不確実な情報に対して4倍以上フラグを立てる「正直さの向上」も実現しており、不正行為率はOpus 4.7と比べて大幅に低減されています。

Dynamic Workflowsとは何か

Dynamic WorkflowsはClaude Codeに搭載された新機能で、現在リサーチプレビュー中です。

数百のエージェントが並行して動く仕組み

従来のAIコーディングツールは1つのエージェントが逐次的にタスクをこなしていましたが、Dynamic Workflowsでは1回のセッション内で数十〜数百の並列サブエージェントを動的に生成・実行できます。

固定された手順を実行するのではなく、タスクの内容に応じてオーケストレーションスクリプトをリアルタイムで組み立てて実行する点が大きな特徴です。

項目	仕様
同時並列実行数	最大16エージェント
1ワークフロー最大数	1,000エージェントまで
長時間タスク対応	中断後の再開が可能
対応プラン	Max・Team・Enterprise

想定されるユースケース

Dynamic Workflowsが特に力を発揮する場面は以下のとおりです。

数千ファイルにまたがるフレームワーク移行（例：React 18から19への一括アップグレード）
コードベース全体のバグ探索・セキュリティ監査
認証チェックや入力バリデーションなどのセキュリティ強化
プロファイラーを使ったパフォーマンス最適化監査

複数の独立したエージェントが異なる角度から問題を同時に検証するため、人間が手動で行えば数日かかる作業を短時間で完了できます。

使い方と注意点

Claude Codeに「Create a workflow」と直接指示するか、ultracode設定を有効にすると、Claudeが自動で使用を判断して起動します。初回使用時には確認ダイアログが表示されます。

通常のClaude Codeセッションと比べて大幅にトークンを消費するため、APIコストに注意が必要です。Enterprise管理者は設定から機能の無効化が可能となっています。

SNSでのリアルな反応

X（旧Twitter）では、Opus 4.8のリリースに対して多様な声があがっています。

ポジティブな評価

特に評価が高いのは、物理シミュレーションやHTML5 Canvasを使った描画能力で、前モデルのOpus 4.7を明らかに凌駕するという声が多数見られます。

Dynamic Workflowsが「タスクの難易度を自動検知し、オーケストレーションスクリプトを自ら生成して複数エージェントに役割分担させる」点が高く評価されています
iPhoneなどスマートフォン環境からでも高品質なウェブデザインやゲーム開発が可能になったという報告があります
「GPT-5.5を圧倒している」という声も複数確認されています

ネガティブな声・懸念点

一方で、コミュニティでは以下のような懸念も広がっています。

最も多く見られたのは、一部インフルエンサーによる誇大広告への批判です。「iPhoneだけでウェブデザイン会社を運営して大金稼いだ」「一夜でPS5にゲームをリリースした」といった投稿が相次いでおり、コミュニティ内のノイズが増加しているという指摘があります。Claudeの能力を誇張した非現実的な成功体験の発信が、正確な情報を得たいユーザーの妨げになっているという批判です。

また、High Effortモードがデフォルトで適用される場合のAPIコストとレイテンシへの懸念も多く見られました。速度と品質のトレードオフをユーザー自身が管理する必要があるため、コスト管理の難しさを指摘する声があがっています。

進化のスピードについては「速すぎてキャッチアップできない」という嬉しい悲鳴も見られ、AIツールの急速な進歩に対する戸惑いと期待が入り混じった反応となっています。