Mail

"Flash 当然比 Pro 差。"——这个常识在 2026 年被打破了。

Google 发布 Gemini 3 Flash，将其设为 Gemini 应用和 AI Mode in Search 的默认模型。声称以 Flash 级的速度和成本提供 Pro 级的推理能力。实际基准测试数据支持这一说法。

作为每天在实际工作中使用 AI 工具的教育科技 CEO，让我整理一下 Gemini 3 Flash 是什么、与以前的模型有何不同，以及应该如何看待它。

1. Gemini 3 Flash 是什么

Gemini 3 Flash 是 Google 推出的一款全新定位模型。在以往的系列中，Flash 是比 Pro 更快但性能较弱的"轻量版"。Gemini 3 Flash 颠覆了这一公式。

Google 的描述："以 Flash 系列的速度、效率和成本，提供 Gemini 3 Pro 的推理能力。"

这是同时追求"速度"与"能力"的尝试。目前 Gemini 3 Flash 已成为 Gemini 应用和 AI Mode in Search 的默认模型，正在向全球数百万用户推送。

Gemini 3 Flash 模型介绍

看基准测试数据就能理解这个模型为何备受关注。

GPQA Diamond 评估专家级科学和数学推理能力。90.4% 处于当前公开模型的最高水平。

SWE-bench Verified 的 78% 衡量 AI 解决实际软件工程任务的准确度。这一数据不仅超越了 2.5 系列，还超过了 Gemini 3 Pro。

"即使在最高思考级别下，Gemini 3 Flash 平均比 2.5 Pro 少使用 30% 的 Token。"——Google

与性能同等重要的是速度和价格。

速度：基于 Artificial Analysis 基准，比 2.5 Pro 快 3 倍。在实时对话、智能体循环、代码补全等延迟敏感的任务中，体感差异显著。

Token 效率：在典型流量下，比 2.5 Pro 平均少使用 30% 的 Token。用更低成本完成相同工作。

价格：

仅为 2.5 Pro 价格的一小部分。性能相当甚至更强，成本却大幅降低。值得重新评估生产 API 的成本结构。

Gemini 3 Flash 可通过多种渠道访问：

Gemini CLI 的可用性对开发者尤为重要。可以与 Claude Code 或 Cursor 配合使用，将 Gemini 3 Flash 作为推理引擎。

Deep Research 现在基于 Gemini 2.5 Flash 对所有用户免费开放。复杂的研究任务可以立即使用。

作为教育科技 CEO，Gemini 3 Flash 给教育领域传递的信号有两点。

第一，AI 辅导质量与成本的平衡改变了。 在教育平台运营 AI 辅导时，最大的矛盾是"质量 vs 成本"。Pro 级模型效果好但成本高，Flash 级模型便宜但复杂推理能力弱。Gemini 3 Flash 缩小了这一差距。

第二，免费 AI 的水平大幅提升。 Gemini 应用的默认模型换成 Gemini 3 Flash，意味着免费用户也能使用这一能力级别。从 AI 教育普及化的角度来看，这是重要的变化。

将 Gemini CLI 集成到开发工作流：通过 gemini 命令直接使用 Gemini 3 Flash。结合 Claude Code 从多角度进行代码审查。
免费使用 Deep Research：Deep Research 现已免费。用于复杂主题调研、竞品分析、市场研究。
重新计算 API 成本：如果正在使用 Gemini 2.5 Pro API，试着用 Gemini 3 Flash 处理相同任务，测量成本节省幅度。
在智能体编程中实验：SWE-bench 78% 显示了其作为编程智能体的实力。在代码审查、重构、测试生成中尝试使用。

Gemini 3 Flash 是打破"速度"与"能力"界限的尝试。基准测试数据支持这一说法，Google 将其设为 Gemini 应用默认模型体现了自信。

AI 模型市场中速度·性能·成本的三角形始终存在权衡。Gemini 3 Flash 正在将三角形的一个顶点向内拉。期待 Google I/O 2026（5 月 19-20 日）带来的后续发布。

您最想用 Gemini 3 Flash 尝试哪种任务？欢迎在评论区分享！

参考资料