Gemini
Google 发布 Gemini 3 Flash,并将其替换为 Gemini 应用和 AI Mode in Search 的默认模型。以 2.5 Pro 三倍的速度实现同等或更强的性能,GPQA Diamond 达 90.4%、SWE-bench 达 78%。以 $0.50/1M 输入 Token 的合理价格处理编程、复杂分析和智能体工作流,本文分析这一模型对 AI 开发生态的影响。
READ MOREGemini
Google 在 Google I/O 2026 正式发布(GA)Gemini 2.5 Pro 和 Flash,并推出 Deep Think 模式。通过并行探索多个假设的全新推理方式,在数学、编程和多模态推理基准测试中取得历史性成绩。本文分析这一 AI 推理架构变革对教育和工作的影响。
READ MOREClaude4
Anthropic发布了Claude 4。由Sonnet 4和Opus 4组成的新模型阵容在智能体任务和长时间推理方面超越前一代。Claude Code集成、安全改进、OpenClaw政策变化——从教育科技角度分析Claude 4带来的变化。
READ MORE