Published on

Gemini 2.5の3月進化:自分のファイルでDeep ResearchしてLyria 3で音楽まで

リサーチ中に「自分の資料をAIに渡して、その資料をもとにもっと深く調べてほしい」と思ったことはありませんか?

既存のAIリサーチツールはウェブからの情報収集に特化していました。自分がすでに持っている内部資料——集めた論文、会議録、インタビュー記録——を基盤にAIが追加調査をしてくれるのは難しいことでした。2026年3月、Geminiがその境界を壊しました。

さらに同月、Geminiはテキストと画像から音楽を生成するLyria 3音楽生成モデルも発表しました。リサーチツールとしてもクリエイティブパートナーとしても、Geminiの役割が大きく拡張した1ヶ月を振り返ります。


目次

  1. Deep Researchの進化:自分のファイルがソースになる
  2. Lyria 3:テキストと画像から音楽を生成するAI
  3. Gemini 2.5 Flashの改善:無料ユーザーも強くなった
  4. パーソナルインテリジェンスとAPIアップデート
  5. 実践活用シナリオ:研究者とクリエイターのためのガイド

1. Deep Researchの進化:自分のファイルがソースになる

外部検索だけだったAIリサーチツールに、自分の資料を直接供給できるようになりました。

2026年3月、GeminiのDeep Researchにファイルおよび画像アップロード機能が追加されました。ユーザーが持つ文書(PDF、Wordファイル、画像など)をDEep Researchのソースとして直接含めることができます。AIが内部資料と外部検索を組み合わせて、より文脈のあるリサーチレポートを生成します。

この変化が実質的に重要な理由は信頼性です。従来のAIリサーチは外部検索結果に依存していたため、自分の研究コンテキストとずれていたり、すでに知っている情報を繰り返したりすることが多くありました。自分の資料を基盤にすることで、AIが研究の空白をより正確に埋められるようになります。

Gemini Deep Research ファイルアップロード機能

Deep Researchが無料で開放

さらに嬉しいニュースは、Gemini 2.5 FlashベースのDeep Researchが無料ユーザーにも開放されたことです。従来は有料サブスクライバー専用の機能でしたが、誰でも試せるようになりました。品質に差はありますが、リサーチ体験そのものを無料で試せるようになりました。


2. Lyria 3:テキストと画像から音楽を生成するAI

説明するだけで音楽が生成されます。楽器ができなくても大丈夫。

同月リリースされたLyria 3はGoogleの音楽生成AIモデルです。2つのバージョンがあります:

モデル特徴
lyria-3-clip-preview30秒クリップ生成に最適化
lyria-3-pro-previewフルレングス楽曲を生成

両モデルとも48kHz ステレオオーディオを出力し、テキストと画像を同時に入力として受け付けます。参考用画像をアップロードして、その雰囲気に合った音楽を生成することも可能です。

どう活用できるか

  • 教育コンテンツクリエイター:動画に合ったBGMを自分で生成
  • YouTuber・クリエイター:著作権フリーのオリジナル音楽で動画を完成
  • プレゼン資料作成:発表の雰囲気に合ったBGMを生成
  • EdTech:授業開始時の雰囲気設定用アンビエントサウンドを生成

「音楽を作る能力が民主化されています。楽譜が読めなくても、楽器が弾けなくても——望む雰囲気を言葉で表現できれば、それで十分です。」

このモデルは現在Gemini APIを通じて開発者に提供されており、今後一般ユーザーインターフェースにも広がる見込みです。


3. Gemini 2.5 Flashの改善:無料ユーザーも強くなった

改善された書式と画像理解能力が無料ユーザーにも提供されます。

改善されたGemini 2.5 Flashのバージョンが全Geminiアプリユーザーに展開されました。主な変化は2つです:

書式の改善:複雑な出力物にヘッダー、リスト、表などの書式要素をより積極的に活用します。テキストの塊ではなく、構造化された情報を提供するため可読性が大幅に向上しました。

画像理解の向上:ユーザーが画像をアップロードした際に内容をより正確に解釈して応答します。図表、グラフ、写真内のテキスト認識が改善されました。


4. パーソナルインテリジェンスとAPIアップデート

Geminiが自分のデジタルライフ全体を理解し始めています。

パーソナルインテリジェンスの無料開放(米国)

Personal Intelligence機能が米国内の全Geminiユーザーに無料開放されました。Gmail、Google Photos、YouTubeを接続して、パーソナライズされたAIアシスタントとして活用できます。旅行計画、プロジェクト調整、個人記録の整理などで文脈のある助けが得られます。

国際展開のタイミングはまだ不透明ですが、Googleのグローバル拡張パターンから見て、近いうちに国際地域にも広がる見込みです。

APIの主要アップデート

開発者向けGemini APIも合わせてアップデートされました:

  • Cloud Storageサポート:Google Cloud Storageバケットをデータ入力ソースとして直接使用可能
  • ファイルサイズ上限を引き上げ:20MB → 100MB(5倍拡大)
  • 組み込みツール+関数呼び出しの組み合わせ:Geminiの内蔵ツールとカスタム関数呼び出しを一つのAPIリクエストで同時使用可能

ファイルサイズ制限が100MBに拡大されたことは、高解像度画像、長い動画クリップ、大容量PDFをAPIで処理する作業で実質的な差をもたらします。


5. 実践活用シナリオ:研究者とクリエイターのためのガイド

今回のアップデートを最大限活用できる2つの使用パターンです。

研究者のためのDeep Researchワークフロー:

  1. 自分が収集した一次資料(論文、報告書、インタビュー記録)をファイルとして準備
  2. Gemini Deep Researchにファイルをアップロードしてリサーチ目標を設定
  3. AIが内部資料と外部検索を組み合わせて総合報告書を生成
  4. 空白の論拠や反論になり得る資料をAIが自動的に探索

クリエイターのためのコンテンツ制作ワークフロー:

  1. 動画のコンセプトをテキストで説明(例:「温かい春の教室、穏やかなピアノのメロディ」)
  2. 雰囲気の参考用画像を追加アップロード(任意)
  3. Lyria 3で30秒のBGMクリップを生成
  4. 動画に挿入——著作権の問題なく活用

おわりに

Geminiの3月アップデートは2つのキーワードで要約されます:自分の資料の統合創作領域の拡張。Deep Researchが外部と内部をつなぎ、Lyria 3がテキストから音楽への境界を壊しました。

AIツールが各自の専門領域を超えて互いの領域に侵入し、接続するスピードが速まっています。この流れの中で重要なのは、ツールを知ることではなく、自分が欲しいものを明確に表現する能力です。


関連記事

Lyria 3とDeep Researchのうち、先に試してみたい機能はどちらですか?コメントで教えてください!


出典:

Gemini 2.5の3月進化:自分のファイルでDeep ResearchしてLyria 3で音楽まで | MINSSAM.COM