音声対応×多言語AI「Geminiアプリ」が音声入力と日本語対応を拡張

AIニュース,アイキャッチ

GoogleのAIアプリ「Gemini」が大規模なアップデートを迎えました。音声ファイルのアップロード機能や日本語を含む多言語対応、さらに研究・学習支援ツール「NotebookLM」の機能強化が加わり、教育やビジネスの現場での活用が一層広がりそうです。

【出典元】
post on X by Josh Woodward
Gemini app finally expands to audio files

音声ファイルのアップロードに対応

Geminiはテキスト入力に加え、音声ファイルをそのまま解析できるようになりました。

プラン利用上限対応形式
無料ユーザー1日5プロンプト、合計10分まで音声ファイル(単一)
Pro/Ultra1ファイル最大3時間、ZIPで最大10ファイル音声+ZIP対応

また「Audio Overview」機能により、アップロード内容を3〜5分のポッドキャスト風音声に変換可能。生成された音声は再生・共有・ダウンロードもできます。

日本語を含む多言語対応の拡大

Gemini 2.5の導入により、Google検索のAIモードが以下の言語を新たにサポートしました。

  • 日本語
  • 韓国語
  • ヒンディー語
  • インドネシア語
  • ブラジルポルトガル語

これにより、母語で複雑な検索や要約が可能となり、より自然で幅広い利用が可能になっています。

NotebookLMの進化

学習・研究支援ツール「NotebookLM」も大幅に強化されています。

機能アップデート内容
言語対応80以上の言語でレポート、ブログ、クイズを生成可能
出力の柔軟性文体や形式を自由に選択(カジュアル/フォーマルなど)
音声機能50以上の言語でAudio Overviewを生成可能

これにより、異なる言語の資料を扱う国際的なチームや学生・研究者にとって強力な支援ツールとなっています。

学習・研究現場での活用例

  • 学生:講義録音をアップロード → 要約や復習用クイズを自動生成
  • 研究者:外国語の文献をまとめ、多言語レポートとして出力
  • ビジネス:会議音声を議事録化 → チームと共有し、要点だけを確認

Geminiは「聞く・読む・要約する」を多言語で一括処理できるため、効率的な情報活用を支援します。

まとめ

今回のアップデートは、Geminiが直感的かつ多文化に対応するAIアシスタントへ進化する大きな一歩です。音声入力、多言語対応、NotebookLMの機能強化により、教育から研究、ビジネスまで幅広い分野での活用が期待されています。

GoogleはGeminiを通じて、AIを「誰にとっても身近で頼れるパートナー」へと押し上げつつあります。

関連記事