音声AI

3 posts

Gemini

Gemini Liveアップグレード — リアルタイム音声翻訳とProactive AudioでAIが耳になる

2026年5月、GoogleがGemini 2.5 Flash Native Audioを大幅アップグレードした。話者のトーン・速度・ピッチを保ちながらリアルタイムで音声を翻訳するLive Speech-to-Speech Translationと、自分に向けられた発話にのみ反応するProactive Audioが核心だ。AIが状況を読み取り、必要なときだけ応答する方式へと進化した。

READ MORE
ClaudeCode

AIツール最新情報 2026年4月16日 — Claude Code Routines・Notion音声入力・Gemini LearnLM完全解説

2026年4月14日、AIツールのエコシステムがまた揺れた。Claude Codeはクラウドベースの自動化ルーティンとマルチセッションデスクトップを発表。NotionはデスクトップAIへの音声入力と35〜50%コスト削減されたカスタムエージェントを公開。Gemini 2.5 ProはLearnLMを統合し、世界最高の学習特化AIの地位を公式に宣言した。

READ MORE
音声ai | MINSSAM.COM