Gemini
Gemini Live升级 — 实时语音翻译与Proactive Audio让AI成为你的耳朵
2026年5月,Google对Gemini 2.5 Flash Native Audio进行了重大升级。核心是保留说话人语调、语速和音调的实时语音翻译,以及仅对面向自己的发话做出回应的Proactive Audio。AI正在进化为能够读懂情境、只在必要时介入的智能聤聼者。
READ MORE3 posts
2026年5月,Google对Gemini 2.5 Flash Native Audio进行了重大升级。核心是保留说话人语调、语速和音调的实时语音翻译,以及仅对面向自己的发话做出回应的Proactive Audio。AI正在进化为能够读懂情境、只在必要时介入的智能聤聼者。
READ MOREGoogle在Vertex AI上正式发布(GA)Gemini 2.5 Flash-Lite。与标准Flash相比,在保持推理、代码、多模态性能的同时,Token使用量减少20-30%。支持SFT(监督微调),Deep Research已在Flash模型上免费开放。对注重成本效率的团队和个人而言,这是值得关注的重大更新。
READ MORE2026年5月,谷歌大幅升级了Gemini 2.5 Flash Native Audio。更精准的函数调用、更流畅的对话流程、多说话人TTS——用语音讲授的教育内容制作,用几行AI代码即可实现。EdTech CEO分享实际应用场景和API实现方法。
READ MORE