使えば使うほど賢くなるAI誕生
Anthropicは5月6日、AIアシスタント「Claude」のエージェント機能(Claude Managed Agents)に4つの新機能を追加しました。
目玉は「Dreaming(ドリーミング)」で、AIが過去のセッションを振り返り自動で自己改善する仕組みです。成果基準を設定してアウトプット品質を高める「Outcomes」や、複数のAIが分業・協働する「Multiagent Orchestration」なども加わり、使うほど賢くなるAIの実用化が本格的に始まっています。
Live from Code with Claude: we're launching dreaming in Claude Managed Agents as a research preview.
— Claude (@claudeai) May 6, 2026
Outcomes, multiagent orchestration, and webhooks are now in public beta. pic.twitter.com/p4DFRzFEd8
【出典元】New in Claude Managed Agents | Anthropic
「Dreaming」はセッションをまたいで自己改善する
「Dreaming」は、AIエージェントがセッションとセッションの「間」に学ぶ仕組みです。AIが仕事をしながらメモリに情報を記録する機能はこれまでもありましたが、DreamingはそのメモリをAI自身が定期的に見直し、パターンを抽出して次の作業に活かします。
具体的には、複数のセッションにわたって繰り返し発生した誤り、うまくいったワークフロー、チーム全体で共有すべき設定などを自動的に識別します。そして不要な情報を整理し、重要度の高い情報を優先して保持するようメモリを再構築します。Anthropicは「メモリが作業中にその場で学んだことを記録するとすれば、Dreamingはセッションとセッションの間にそのメモリを磨き上げる」と説明しています。
法律AIの「Harvey」では、Dreamingの導入により完了率が約6倍向上したとされています。ファイルタイプへの対応方法やツール固有のパターンを自動学習し、同じ種類の作業でのミスが大幅に減ったといいます。また、自動更新か、変更内容を確認してから適用するかを選択できるため、AIの学習内容を人間がコントロールすることも可能です。現時点ではリサーチプレビューとして、アクセスリクエストによる提供となっています。
成果基準で品質が自動で上がる
「Outcomes(アウトカムズ)」は、AIに対して「どんな成果物が良いか」の基準(ルーブリック)をあらかじめ設定しておく機能です。ルーブリックとは採点表のようなもので、「詳細への注意」「情報の網羅性」「ブランドの文体への一致」「ビジュアルガイドラインへの準拠」といった評価項目と水準を定めたものです。AIはその基準に照らして自分の出力を評価し、足りなければ自動的に再試行して品質を高めます。
仕組みとしては、出力を作成したエージェントとは別の独立した「採点エージェント」が、別のコンテキスト(思考の文脈)で評価を行います。採点エージェントが改善すべき点を特定すると、元のエージェントが再試行します。この流れが人間の確認なしで自動的に繰り返されます。
ベンチマークでは標準的な方法と比べて最大10ポイントの改善を記録し、ファイル生成の成功率ではWordファイル(docx)が+8.4%、PowerPointファイル(pptx)が+10.1%向上しました。特に難易度の高いタスクほど改善幅が大きくなっています。
医療文書管理の「Wisedocs」では、Outcomesを使った文書品質チェックエージェントを導入したことでレビュー速度が50%短縮され、チームの品質基準を維持しながら処理を高速化できたと報告されています。Outcomesは現在パブリックベータとしてClaude Consoleから利用できます。
複数AIが並列で作業を分担
「Multiagent Orchestration(マルチエージェント オーケストレーション)」は、一つのリードエージェントが複雑なタスクを分割し、それぞれの専門エージェントに振り分けて並列処理する仕組みです。各サブエージェントは独自のモデル・プロンプト・ツールを持ち、共有ファイルシステムを通じて連携します。処理のすべてのステップ(実行したエージェント・順序・理由)はClaude Consoleで確認でき、透明性も確保されています。
ライティングプラットフォームの「Spiral」(Every社製)では、軽量なリードエージェント(Haiku)がユーザーのリクエストを受け取ってフォローアップの質問を行い、複数の高性能サブエージェント(Opus)が並列で起草を実行する構成を採用しています。各起草案はOutcomesによって編集方針とユーザーの声に照らして自動採点されます。
Netflixのプラットフォームチームは、数百のビルドから生成されるログを複数のソースにわたって分析するためにこの仕組みを活用しています。数千のアプリに影響する変更を加えた際に、繰り返すパターンを検出して優先順位を付ける作業が効率化されています。
また、今回あわせて追加された「Webhooks」は、エージェントの処理が完了したタイミングで通知を受け取れる機能です。長時間かかる処理を自律実行させながら、完了を見届けるといった使い方が可能になります。
まとめ
Claude Managed Agentsの新機能は、AIが「一度設定して終わり」ではなく「使うほど賢くなる」存在へと進化していることを示しています。Dreamingによる自己改善、Outcomesによる品質の自動向上、マルチエージェントによる並列処理——これらが組み合わさることで、AIが担える業務の範囲と精度は急速に拡大しています。
Harvey・Wisedocs・Netflixといった先行事例が示すように、AIエージェントは法律・医療・エンジニアリングといった専門領域でも実務に耐えうる水準に達しつつあります。単純な自動化ツールを超え、業務の中で自律的に成長するAIの活用が、企業競争力に直結する時代が始まっています。