Published on

2026年6月 AI工具趋势 — NotebookLM智能体研究、Claude Code多智能体、Gemini Omni视频生成

AI生态系统终于开始摆脱"单独使用工具"的时代。

本月三大更新都指向同一个方向:AI不再等待人类指令,而是自主规划、自主执行、主动与其他AI智能体协作

作为教育科技CEO和AI工具爱好者,我选出了本月最重要的三个变化,从实际工作场景的角度进行解析。


目录

  1. NotebookLM 2.0 — "AI主动去找信息来源了"
  2. Claude Code多智能体 — "智能体生成智能体"
  3. Gemini Omni — "通过对话创作视频的革命"
  4. 三大更新指向何方

1. NotebookLM 2.0 — "AI主动去找信息来源了"

NotebookLM智能体研究界面占位图

2026年6月8日,Google发布了NotebookLM历史上最重大的更新。

以前的NotebookLM是分析你上传文档的工具。现在不同了。只需抛出一个主题,NotebookLM会自己搜索Google、找到相关来源、运行代码分析数据,并逐步展示推理过程。

智能体研究:从零开始也没关系

过去,打开NotebookLM前需要先准备好相关PDF或链接。现在这个顺序反转了。

以项目主题开始对话,NotebookLM会利用Google搜索功能主动推荐相关来源,自动构建知识库。即使从"不知道该查什么"开始也完全没问题。

这为何具有革命意义?以往AI只处理你提供的信息。现在AI主动成为信息收集的主体。

代码执行:笔记本里有了一台电脑

NotebookLM代码执行界面占位图

基于Gemini 3.5模型,每个笔记本现在内置了一台安全隔离的云端电脑

  • 直接执行Python代码进行数据分析
  • 直接生成图表、电子表格、PDF、PowerPoint文件
  • 逐步展示推理过程的思维链(Chain of Thought)

例如,上传多篇研究论文,说"比较分析这些数据并用图表展示",NotebookLM会编写代码、运行并直接生成可视化结果。

教育场景中的应用潜力:

场景使用方式
指导学生研究仅给定主题,AI辅助收集信息源
数据分析课通过代码执行实现实时可视化
制作课程资料同时生成PDF、PPT、电子表格
论文评审推理步骤公开,提升可验证性

展示推理过程:信任AI的前提条件

我认为本次更新最重要的特性是推理步骤的公开展示

不信任AI输出的最大原因是不知道它如何得出结论。现在NotebookLM不只给出结论,而是逐步展开推理路径。在你觉得有问题的步骤,可以指出"这一步是错的"并要求修正。

让AI成为真正合作伙伴所需的条件终于具备了。

教育科技CEO视角:NotebookLM已成为集搜索、执行、推理于一体的"全能研究伙伴"。学生学习研究的方式本身可能会改变。教"如何验证"比教"去哪里找"更加重要了。


2. Claude Code多智能体 — "智能体生成智能体"

Claude Code智能体视图占位图

Claude Code 6月更新的核心只有一个:AI智能体可以自主创建其他智能体来分配工作。

开发者圈子里开始出现"vibing coding已过时"的声音。2月Andrej Karpathy亲自宣布"vibe coding已是旧式",并提出了更结构化的**智能体工程(Agentic Engineering)**范式。Claude Code正处于这一转变的中心。

智能体视图:在一个界面管理多个AI

现在可以在单个CLI界面中同时管理多个Claude会话。

# Claude Code智能体视图示例
● Session 1: [代码审查中]  ← 活跃任务
● Session 2: [运行测试中]  ← 后台
● Session 3: [文档编写: 等待输入] ← 需要输入
  • 同时管理多个智能体:启动、后台切换、状态查看、返回均可实现
  • 只在需要时介入:只有智能体遇到障碍时人类才需要介入
  • 工作流可视化:立即查看每个智能体的最后响应

这就像成了一个团队领导。团队成员(智能体)各自处理工作,领导(你)只解决卡点。

子智能体生成子智能体:五层结构

本次更新的技术核心是层级式智能体结构

Claude Code智能体现在可以将自己无法高效处理的任务委托给其他智能体。那个子智能体还可以再创建智能体。最多支持五层深度的智能体层级。

层级角色示例
第1层(编排器)整体项目规划与协调
第2层(专家)代码编写、文档编写、测试
第3层(子任务)文件解析、API调用、验证
第4-5层细粒度并行处理

一个提示词可触发数十至数百个子智能体并行处理的动态工作流也成为了可能。

/cd命令与自动模式

还有两个实用变化值得关注。

/cd命令:无需重建提示词缓存,即可将当前会话迁移到不同的工作目录。保持上下文的同时仅切换目录,在将长上下文任务继续应用到其他代码库时非常有用。

自动模式(研究预览):AI分类器自动判断权限请求。安全操作不中断直接执行,危险操作才阻塞给人类审查。不再需要每次都回答"允许吗?"。

速率限制翻倍:Anthropic将Claude Code的API速率限制提升了一倍,让持续开发工作更加稳定。

教育科技CEO视角:在新代码46%由AI生成的今天,这一架构已超越单纯的开发工具范畴。可用于自动化学生代码反馈,或多阶段生成课程内容。从"使用AI"转变为"运营AI团队"的时机已到。


3. Gemini Omni — "通过对话创作视频的革命"

Gemini Omni视频生成界面占位图

在Google I/O 2026上发布的Gemini Omni正在打破视频创作的门槛。

以往的AI视频工具需要精准的提示词。即使用文字详细描述场景,效果与预期不符时也只能从头再来。Gemini Omni颠覆了这种方式。

通过对话编辑视频

Gemini Omni的核心是对话式编辑

  • "把背景换成夜晚的城市"
  • "给这个场景加个缓慢推进的效果"
  • "保持和前一个场景的光线一致"

仅凭这样的自然语言指令就能修改视频。文本、图片、音频、现有视频任何输入都可以混合使用。由于记住了之前的指令,场景切换时人物、光线、物体的一致性得以保持。

理解物理定律的AI

Gemini Omni物理模拟占位图

Gemini Omni与以往视频AI差异化的技术核心是对物理定律的理解

模型理解重力、动能、流体力学等物理现象,因此生成视频中水流或球滚动的场景都十分自然。以往AI视频中常见的"物理不合逻辑"的镜头大幅减少。

Gemini还将其历史、科学、文化知识融入视频生成。请求"清代春节场景",即可生成反映该历史知识的视觉表达。

使用方式与现状

项目内容
当前模型Gemini Omni Flash(生成10秒视频)
访问入口Gemini应用、Google Flow
使用条件Google AI Plus、Pro或Ultra订阅用户
YouTube联动YouTube Shorts Remix、YouTube Create(18岁以上免费)
水印自动嵌入SynthID数字水印

通过YouTube Shorts Remix免费使用这一点值得关注。超过200万YouTube创作者可以立即访问这款AI视频工具。

教育科技CEO视角:制作教育内容的门槛急速降低。老师自己制作教学视频,或学生在演示资料中加入视频,将不再是特殊技能。与此同时,"这个视频是谁做的"这一透明度问题与媒体素养教育的重要性也同步提升。


三大更新指向何方

贯穿6月三大更新的关键词是**"能动性(Agency)"**。

NotebookLM在被指示前就自主搜寻来源、运行代码。Claude Code具备了智能体相互委托协作的层级结构。Gemini Omni将我的自然语言意图实时转换为视频。

共同点只有一个:AI开始自主处理中间步骤了。

人类需要做的事越来越聚焦于"明确自己想要什么"。如何执行,AI更擅长。先感知并适应这一变化的人与未能适应的人之间的差距,将从现在起越来越快地扩大。


使用技巧

1. NotebookLM:不上传任何来源,直接开始研究 打开新笔记本,不上传任何资料,直接在聊天中输入项目主题。看看AI推荐什么来源,把它当作帮你确定研究方向的伙伴来使用。

2. Claude Code:尝试将任务委托给子智能体/agent命令把一个简单任务交给子智能体。在智能体工作期间推进其他工作,亲身体验多任务处理方式的改变。

3. Gemini Omni:利用YouTube Shorts Remix 在YouTube Shorts的Remix功能中可以免费体验Gemini Omni。调出现有的短视频,尝试通过对话方式更换背景或光线效果。

4. 建立查看推理步骤的习惯 当NotebookLM展示推理步骤时,不要只用最终结果——养成检查中间步骤的习惯。这是提升AI成果可信度最快的方法。


AI工具的成熟意味着功能更强大,同时也意味着你需要做出更多判断。将哪个智能体分配何种任务、如何验证哪个输出结果——这些判断仍然是人类的责任。


相关文章


来源 (Sources)

2026年6月 AI工具趋势 — NotebookLM智能体研究、Claude Code多智能体、Gemini Omni视频生成 | MINSSAM.COM