映像と音声を同時生成する「Sora 2」登場、新アプリも提供へ
OpenAIは2025年9月30日、映像と音声を同時に生成できる次世代モデル「Sora 2」と、新たなソーシャルプラットフォーム「Sora」アプリを発表しました。
Sora 2は、従来の動画生成AIを大きく超えるリアリティと制御性を備え、物理的に正確な動きや音声付きの映像表現を可能にします。さらに、安全性を設計段階から重視した仕組みによって、安心して利用できる環境を整えています。
Sora 2で作れる動画の特徴
- リアルな動き:物理法則に忠実で、成功だけでなく失敗や反動も自然に表現。
- 多彩なスタイル:実写風、映画風、アニメ調まで幅広く生成可能。
- ストーリー性:複数ショットをつなぎ、一貫した世界観を持つ映像を制作。
- 音声付き映像:セリフ、効果音、環境音を同期して生成。
- 実世界の融合(アプリ機能):カメオで自分や仲間を高精度に登場させられる。
【参照元】
OpenAI公式「Sora 2 is here」
OpenAI公式「Sora 2 System Card」
OpenAI公式X
物理的な精度とリアリズムの進化
Sora 2は「動画生成のGPT-3.5の瞬間」とも評され、従来では不可能だった複雑な動作を再現できます。
- 物理法則の順守:パドルボード上でのバックフリップや、猫を頭に乗せたままのトリプルアクセルといった高度な動きを正確に表現。
- 失敗のモデル化:シュートを外したバスケットボールが現実のようにバックボードに跳ね返るなど、成功だけでなく失敗までも物理的に忠実に描写。
スタイル・制御性・音声機能
Sora 2は映像の表現力や制御性においても大きく進化しました。
- 高い制御性:複数ショットにまたがる複雑なプロンプトでも、一貫した世界観を維持。
- 幅広いスタイル:リアリスティック、シネマティック、アニメスタイルの映像を高品質に生成可能。
- 高度な音声生成:対話、スピーチ、効果音、環境音をリアルに同期生成し、没入感のある動画を制作可能。
Sora 2の仕様と技術基盤
Sora 2は以下の仕様を持ち、従来より表現の幅が広がっています。
| 項目 | 内容 |
|---|---|
| 動画仕様 | 最大1080p、最長20秒。ワイド・縦型・正方形のアスペクト比対応 |
| 入力形式 | テキスト・画像・動画を組み合わせて生成。リミックスや拡張も可能 |
| 生成技術 | 拡散モデルを基盤に、可視化パッチやフレーム先読みを活用 |
| 継承技術 | DALL·EやGPTの技術を応用し、指示と映像表現の整合性を強化 |
Soraアプリ限定の「カメオ機能」
Sora 2を活用した新しいSoraアプリには、ユニークな機能として「カメオ(Cameos)」が搭載されています。これはユーザー自身や他者を生成動画に登場させる仕組みです。
- 実写要素の注入:短い動画で外見や声をキャプチャし、AI生成されたシーンに忠実に挿入可能。
- 幅広い対象:人間だけでなく、動物や物体にも対応。
- ユーザー制御:利用権限を本人が完全に管理し、削除やアクセス取り消しも自由に行えます。
Sora 2とSoraアプの安全性を重視した設計
Sora 2とSoraアプリは、安全性を最優先に開発されました。
- 利用対象は18歳以上に限定。
- 実在人物の肖像や顔写真のアップロードを制限。
- 未成年関連コンテンツは厳格に検出・排除。
- CSAM(児童性的虐待コンテンツ)対策を最優先課題に設定し、NCMECやThornと協力。
- 外部レッドチームと協力し、15,000回以上の生成テストを実施。
- 透かし(ウォーターマーク)やプロビナンスメタデータにより、コンテンツの出所を明確化。
提供形態と利用方法
Sora 2は招待制で段階的に公開されます。
- iOS版アプリ「Sora」:App Storeでダウンロード可能。通知登録でアクセスが解放。
- Web版・Android版:sora.comから利用(招待コードが必要)。
- 料金:当初は無料で利用可能。制限は緩やかに設定。
- Sora 2 Pro:ChatGPT Proユーザーは、より高品質なモデルを利用可能。
- API提供予定:今後、開発者向けに公開予定。
- 既存モデル:Sora 1 Turboは引き続き利用でき、生成物はsora.comのライブラリに保存。
まとめ
Sora 2は、物理法則に忠実な動きや失敗までも再現できる精度、幅広いスタイル表現、同期音声、そしてカメオ機能を備えた次世代の動画生成モデルです。
安全性に配慮しつつ、無料提供から段階的に普及を進める姿勢は、革新と社会的責任の両立を目指す取り組みといえるでしょう。
今後のAPI公開と「Sora 2 Pro」の展開によって、クリエイティブ分野での活用が一層広がることが期待されます。