AIの今を知り、使い方を学べる「Aibrary（アイブラリー）」- ニュース・コラム・活用ヒントがそろう知識の棚

＞掲載希望の企業のみなさまへ

音声対応×多言語AI「Geminiアプリ」が音声入力と日本語対応を拡張

2025/09/09

GoogleのAIアプリ「Gemini」が大規模なアップデートを迎えました。音声ファイルのアップロード機能や日本語を含む多言語対応、さらに研究・学習支援ツール「NotebookLM」の機能強化が加わり、教育やビジネスの現場での活用が一層広がりそうです。

【出典元】
post on X by Josh Woodward
Gemini app finally expands to audio files

目次

1. 音声ファイルのアップロードに対応
2. 日本語を含む多言語対応の拡大
3. NotebookLMの進化
4. 学習・研究現場での活用例
5. まとめ

音声ファイルのアップロードに対応

Geminiはテキスト入力に加え、音声ファイルをそのまま解析できるようになりました。

プラン	利用上限	対応形式
無料ユーザー	1日5プロンプト、合計10分まで	音声ファイル（単一）
Pro／Ultra	1ファイル最大3時間、ZIPで最大10ファイル	音声＋ZIP対応

また「Audio Overview」機能により、アップロード内容を3〜5分のポッドキャスト風音声に変換可能。生成された音声は再生・共有・ダウンロードもできます。

日本語を含む多言語対応の拡大

Gemini 2.5の導入により、Google検索のAIモードが以下の言語を新たにサポートしました。

日本語
韓国語
ヒンディー語
インドネシア語
ブラジルポルトガル語

これにより、母語で複雑な検索や要約が可能となり、より自然で幅広い利用が可能になっています。

NotebookLMの進化

学習・研究支援ツール「NotebookLM」も大幅に強化されています。

機能	アップデート内容
言語対応	80以上の言語でレポート、ブログ、クイズを生成可能
出力の柔軟性	文体や形式を自由に選択（カジュアル／フォーマルなど）
音声機能	50以上の言語でAudio Overviewを生成可能

これにより、異なる言語の資料を扱う国際的なチームや学生・研究者にとって強力な支援ツールとなっています。

学習・研究現場での活用例

学生：講義録音をアップロード → 要約や復習用クイズを自動生成
研究者：外国語の文献をまとめ、多言語レポートとして出力
ビジネス：会議音声を議事録化 → チームと共有し、要点だけを確認

Geminiは「聞く・読む・要約する」を多言語で一括処理できるため、効率的な情報活用を支援します。

まとめ

今回のアップデートは、Geminiが直感的かつ多文化に対応するAIアシスタントへ進化する大きな一歩です。音声入力、多言語対応、NotebookLMの機能強化により、教育から研究、ビジネスまで幅広い分野での活用が期待されています。

GoogleはGeminiを通じて、AIを「誰にとっても身近で頼れるパートナー」へと押し上げつつあります。

関連記事