Published on

Gemini 2.5 Flash-Lite正式发布 — 速度更快、成本降低20-30%,支持SFT微调

选择AI模型时,总会浮现同一个问题:「这个价格值不值?」

2026年5月,Google给出了新的答案。Gemini 2.5 Flash-Lite在Vertex AI上正式发布(GA)。这是一个专为效率设计的模型——使用20-30%更少的Token完成与Flash相同的工作。降低成本,提升速度,保持品质。

与此同时,Deep Research在Flash模型上向所有人免费开放,Gemini 2.5 Flash Native Audio也获得了重要升级。作为每天在实际场景中使用AI的教育科技CEO,我来分析这些变化究竟意味着什么。


Gemini 2.5 Flash-Lite — 重新定义"性价比模型"

Gemini 2.5 Flash-Lite基准对比占位图

Flash-Lite的不同之处

Flash-Lite不是Flash的简化版,而是专为效率设计的模型

指标Gemini 2.5 FlashGemini 2.5 Flash-Lite
Token使用量基准减少20-30%
速度更快
推理/代码/多模态保持同等水平
SFT(微调)支持-支持
发布状态GAGA (Vertex AI)

关键在最后两行:Flash-Lite支持SFT(监督微调)。企业和团队可以用自己的数据进行训练,打造专属模型——而成本比Flash更低。

从教育科技角度思考:学校可以基于Flash-Lite,用课程资料、学生反馈模式和学科专业词汇进行微调,打造出针对特定场景的专属AI模型,运营成本低于通用Flash。


Token减少20-30%实际意味着什么

单次对话听起来差几分钱。但放大规模就不同了。

一天处理1万次AI请求的服务,一个月就是数百万次。Token减少30%直接等于成本降低30%。对创业公司而言,这意味着资金跑道延长30%。

对个人用户而言,在Google AI Studio切换到Flash-Lite,相同配额内可以完成更多工作。


Deep Research — 在Flash模型上免费开放

Gemini Deep Research Canvas转换占位图

过去Deep Research是付费高级功能。现在在Gemini 2.5 Flash模型上向所有人免费开放

免费开放的同时新增了两项功能:

1. 上传自己的文件和图片 可以将自己的文件和图片作为Deep Research的来源上传,结合外部信息和内部资料生成研究报告。

2. Canvas转换 Deep Research报告可以转换为交互式视觉材料、测验和学习摘要。报告从终点变成起点。

一个实用的课堂工作流:用Deep Research整理课程资料,在Canvas中转换成学生可以直接作答的测验。整个流程都在Google生态系统内完成。


Gemini 2.5 Flash Native Audio升级

语音AI中常见的问题:对话中断、丢失上下文、难以应对复杂指令。

本次Native Audio更新改善了三点:

  • Function Calling精度提升:AI判断何时调用外部工具或API的准确度提高
  • 指令遵循改善:能更准确理解和执行复杂、多步骤的指令
  • 保留上下文信息:更一致地记住对话中之前说过的内容

在教师课堂中实时检索资料、学生获得语音实时反馈等场景中,这些改善带来了切实可感的差异。


Gemini 2.5 Pro & Flash GA — 从预览到正式发布

Google将Gemini 2.5 Flash和Pro模型全部转为**GA(正式发布)**状态。

预览到GA的转变意义重大。GA状态附带服务级别协议(SLA),企业可以获得API稳定性的正式保障。在预览状态下存在突然变更或中断的风险,GA状态则提供了稳定性保证。

对于在Vertex AI上考虑企业级SFT应用的团队来说,现在是认真评估正式部署的时机。


教育科技CEO视角——这些更新指向何方

将本次更新放在一起看,方向清晰可见:

「让AI触达更多人,以更低成本,支持更多用途。」

Flash-Lite降低了成本门槛。Deep Research免费化降低了功能门槛。Native Audio改善降低了语音界面的准入门槛。

这对教育领域的意义很明确:个别教师和小型教育科技团队,现在有了能够在服务中实际部署AI功能的成本结构。这不再是大型科技公司独有的游戏。


使用技巧

1. 先用Flash-Lite测试,必要时再升级到Flash 开发新AI功能时,先用Flash-Lite构建原型。无成本压力快速测试,需要时再切换到Flash或Pro。

2. Deep Research + 上传自己的文件 = 定制化研究 将会议记录、内部资料、PDF一起上传,结合外部信息生成深度研究报告。在Canvas中转换为测验即可成为课程资料。

3. 现在就规划SFT训练数据的收集 Flash-Lite的SFT支持具有长期重要性。核心是数据质量——尽早开始收集标注样本,为将来的微调做好准备。

4. 将GA视为企业采用的绿灯 如果您的组织在采用AI API前需要SLA保证,Vertex AI上的Gemini 2.5 Flash和Flash-Lite现在已满足条件。


AI模型竞争已不再只是"谁最强大",而是转向"谁能以最可持续的成本触达最广泛的用户"。Google本次的更新是这一方向的明确一步。


相关文章


来源

Gemini 2.5 Flash-Lite正式发布 — 速度更快、成本降低20-30%,支持SFT微调 | MINSSAM.COM