NATIVEAUDIO

3 posts

Gemini

Gemini Liveアップグレード — リアルタイム音声翻訳とProactive AudioでAIが耳になる

2026年5月、GoogleがGemini 2.5 Flash Native Audioを大幅アップグレードした。話者のトーン・速度・ピッチを保ちながらリアルタイムで音声を翻訳するLive Speech-to-Speech Translationと、自分に向けられた発話にのみ反応するProactive Audioが核心だ。AIが状況を読み取り、必要なときだけ応答する方式へと進化した。

READ MORE
Gemini

Gemini 2.5 Flash-Lite 正式リリース — 20-30%コスト削減、SFTサポート付き

GoogleがGemini 2.5 Flash-LiteをVertex AIで正式(GA)リリースした。標準のFlashと比べてトークンを20-30%削減しながら、推論・コード・マルチモーダルの性能は維持する。SFT(教師あり微調整)にも対応し、Deep ResearchはFlashモデルで無料公開。コスト効率を重視するチームと個人に注目のアップデートだ。

READ MORE
nativeaudio | MINSSAM.COM