Alibaba、Qwen3.6-Plusを公開
Alibabaは2026年4月2日、エンタープライズ向けの新しいAIモデル「Qwen3.6-Plus」を公開しました。100万トークンのコンテキストウィンドウを標準搭載し、リポジトリ規模のコーディングや視覚的な推論を自律的にこなすエージェント型AIとして設計されています。
コーディングベンチマーク「Terminal-Bench 2.0」ではAnthropicのClaude 4.5 Opusを上回る結果を示し、中国発AIモデルの実力が改めて示されました。
【出典元】Alibaba Unveils Qwen3.6-Plus to Accelerate Agentic AI Deployment
コードを自律的に書き、直し、完成させる
Qwen3.6-Plusが最も力を入れているのはエージェント型のコーディング能力です。従来のAIが「コードを提案する」にとどまっていたのに対し、Qwen3.6-Plusは「計画・実装・テスト・修正」を自律的に繰り返し、プロジェクト全体を完成させることを目指して設計されています。
100万トークンのコンテキストウィンドウにより、大規模なコードベースを丸ごと読み込んで処理することが可能です。ファイル数が多く依存関係が複雑なリポジトリでも、全体を把握した上でコードを生成・修正できます。
さらに、UIのスクリーンショットやワイヤーフレームを解析して、そこから実際に動くフロントエンドコードを生成する機能も搭載しています。デザインをそのままコードに変換できるため、開発サイクルを大幅に短縮できます。
競合モデルを上回るベンチマーク
性能面での注目ポイントは、主要なベンチマークでの結果です。
- Terminal-Bench 2.0:エージェント型コーディングの評価指標。AnthropicのClaude 4.5 Opusを上回り、トップの評価を獲得しています。
- OmniDocBench v1.5:高密度ドキュメントの解析精度を測るベンチマーク。全モデル中1位の結果を示しています。
- QwenWebBench Elo:Webタスクの総合評価指標でも首位となっています。
特にTerminal-Bench 2.0でのClaude 4.5 Opus超えは、中国発のクローズドモデルがグローバルなトップ水準に達したことを意味しています。Alibabaはこれを「最強の国内コーディングモデル」と位置づけています。
エンタープライズ向けの実用機能
Qwen3.6-Plusはコーディングだけでなく、企業の業務全般で使えるよう設計されています。主な機能は以下の通りです。
- 高密度ドキュメント解析:複雑なレイアウトの契約書・請求書・技術文書などを正確に読み取ります。
- 長尺動画の推論:長時間の動画を分析し、要点の抽出や内容の要約が可能です。
- 視覚的な品質検査:製造ラインの画像から不良品を検出するといった産業用途にも対応します。
これらの機能はAlibaba傘下の企業向けAIプラットフォーム「Wukong」に統合されており、複数のAIエージェントを組み合わせた業務自動化ワークフローの中核として使用できます。
Claude CodeやClineとも連携できる
Qwen3.6-Plusの利用経路として注目されるのが、サードパーティツールとの連携です。開発者向けのコーディングエージェント「Claude Code」「Cline」「OpenClaw」とすでに互換性が確認されており、既存の開発環境にそのまま組み込むことができます。
モデルはAlibaba Cloud「Model Studio」およびチャットアプリ「Qwen Chat」から利用可能です。また、オープンソースの開発者コミュニティ向けには、Qwen3.6の軽量版モデルも引き続き提供されています。
Alibabaは今回のリリースと同時期に、音声・テキスト・映像をネイティブに扱うマルチモーダルモデル「Qwen3.5 Omni」(3月30日公開)も発表しており、短期間でのモデル投入が続いています。
まとめ
AlibabaのQwen3.6-Plusは、100万トークンのコンテキストと自律的なエージェント型コーディングを武器に、エンタープライズ市場へ本格参入するモデルです。主要ベンチマークでClaude 4.5 Opusを上回る結果を示しており、中国発AIモデルの実力が改めて証明されました。Claude CodeやClineとの連携も可能で、実際の開発現場にすぐ組み込める点が強みです。AIコーディングツールの選択肢として、今後注目が集まりそうです。