音声対応×多言語AI「Geminiアプリ」が音声入力と日本語対応を拡張

GoogleのAIアプリ「Gemini」が大規模なアップデートを迎えました。音声ファイルのアップロード機能や日本語を含む多言語対応、さらに研究・学習支援ツール「NotebookLM」の機能強化が加わり、教育やビジネスの現場での活用が一層広がりそうです。
【出典元】
post on X by Josh Woodward
Gemini app finally expands to audio files
音声ファイルのアップロードに対応
Geminiはテキスト入力に加え、音声ファイルをそのまま解析できるようになりました。
プラン | 利用上限 | 対応形式 |
---|---|---|
無料ユーザー | 1日5プロンプト、合計10分まで | 音声ファイル(単一) |
Pro/Ultra | 1ファイル最大3時間、ZIPで最大10ファイル | 音声+ZIP対応 |
また「Audio Overview」機能により、アップロード内容を3〜5分のポッドキャスト風音声に変換可能。生成された音声は再生・共有・ダウンロードもできます。
日本語を含む多言語対応の拡大
Gemini 2.5の導入により、Google検索のAIモードが以下の言語を新たにサポートしました。
- 日本語
- 韓国語
- ヒンディー語
- インドネシア語
- ブラジルポルトガル語
これにより、母語で複雑な検索や要約が可能となり、より自然で幅広い利用が可能になっています。
NotebookLMの進化
学習・研究支援ツール「NotebookLM」も大幅に強化されています。
機能 | アップデート内容 |
---|---|
言語対応 | 80以上の言語でレポート、ブログ、クイズを生成可能 |
出力の柔軟性 | 文体や形式を自由に選択(カジュアル/フォーマルなど) |
音声機能 | 50以上の言語でAudio Overviewを生成可能 |
これにより、異なる言語の資料を扱う国際的なチームや学生・研究者にとって強力な支援ツールとなっています。
学習・研究現場での活用例
- 学生:講義録音をアップロード → 要約や復習用クイズを自動生成
- 研究者:外国語の文献をまとめ、多言語レポートとして出力
- ビジネス:会議音声を議事録化 → チームと共有し、要点だけを確認
Geminiは「聞く・読む・要約する」を多言語で一括処理できるため、効率的な情報活用を支援します。
まとめ
今回のアップデートは、Geminiが直感的かつ多文化に対応するAIアシスタントへ進化する大きな一歩です。音声入力、多言語対応、NotebookLMの機能強化により、教育から研究、ビジネスまで幅広い分野での活用が期待されています。
GoogleはGeminiを通じて、AIを「誰にとっても身近で頼れるパートナー」へと押し上げつつあります。