論文の図をAIが自動生成
研究者にとって、論文に掲載する図の作成は長年の悩みのタネです。内容は書けても、見栄えの良いメソドロジー図や統計グラフを仕上げるには、別途デザインの手間と時間がかかります。
そこに切り込んだのが、北京大学とGoogle Cloud AI Researchの共同研究チームが発表した「PaperBanana」です。AIエージェントが論文の図を自動で生成し、手作業のボトルネックを解消します。
【出典元】PaperBanana: Automating Academic Illustration for AI Scientists
PaperBananaは5つのAIエージェントが連携して動く
PaperBananaの特徴は、単一のAIが処理するのではなく、役割の異なる5つの専門エージェントが協調して図を完成させる点です。
| エージェント | 役割 |
|---|---|
| Retriever | 参考事例を検索・収集する |
| Planner | 論文の内容を詳細なテキスト説明に変換する(中核) |
| Stylist | 学術的な美観基準に沿ったスタイルを決定する |
| Visualizer | テキストから図や実行可能なコードに変換する |
| Critic | 生成した図をソースと照合し、改善フィードバックを出す |
Criticエージェントが自己評価・改善を繰り返す仕組みにより、精度と品質を段階的に高めていけるのが大きな強みです。
対応しているのはメソドロジー図だけではない
PaperBananaが生成できる図は、論文の手法を説明するメソドロジー図にとどまりません。統計グラフの生成にも対応しており、生データを渡すだけで視覚的にまとまったグラフを出力できます。
また、すでに手描きで作成した図を渡すと、スタイルガイドラインをもとに配色・タイポグラフィ・グラフィック要素を整えて美観を向上させる使い方もできます。既存の図をブラッシュアップしたいケースにも活用できます。
292件のテストで既存手法を上回る性能
研究チームは、PaperBananaの性能を測るために専用のベンチマーク「PaperBananaBench」も開発しました。NeurIPS 2025の論文から収集した292件のメソドロジー図を使ったテストケースで、以下の4つの評価軸で既存の主要ベースラインを上回る結果が出ています。
- 忠実性:論文の内容を正確に反映しているか
- 簡潔性:情報が過不足なく整理されているか
- 読みやすさ:視覚的に理解しやすいか
- 美観:学術論文として見栄えが良いか
現時点での課題も明らかに
全体的な性能は高いものの、接続エラーという課題も確認されています。ノード間の接続が冗長になったり、つながるべき要素がうまく対応しないケースがあります。Criticエージェントがこの種の問題を検出しにくいことが原因で、基盤モデル自体の知覚限界に起因する可能性があるとのことです。
まとめ
PaperBananaは、論文執筆における図作成の手間を大幅に削減する可能性を持つフレームワークです。5つのエージェントが分業して図を生成・評価・改善するアーキテクチャは、品質と再現性の両立を目指したものです。コードとデータセットは近日公開予定とのことで、研究者コミュニティへの普及が注目されます。