Published on

Claude Code 开始操控鼠标:计算机直接控制时代已然来临

让 AI 写代码,结果 AI 自己打开浏览器去查错误的时代来了。

以前,AI 编程工具的定位很明确——"写代码的工具"。它们擅长快速生成高质量代码,但实际运行程序、查看屏幕、追踪错误,依然是人类的工作。这条边界从 2026 年 3 月开始被打破。

Claude Code 的最新更新并非普通的功能迭代,而是 AI 向完全自主 Agent 跃升的过程——不仅写代码,还能操作整个计算机环境。无论你是开发者,还是正在尝试氛围编程(Vibe Coding)的非开发者,都有必要理解这一变化的意义。


目录

  1. 什么是计算机使用(Computer Use)功能
  2. 子 Agent 与权限中继:像团队一样协作的 AI
  3. 上下文扩展:Opus 4.6 的 128k 输出
  4. 改变开发工作流的细节更新
  5. 氛围编程视角下的实战使用建议

1. 什么是计算机使用(Computer Use)功能

Claude Code 不再只是写代码,而是真正看到了屏幕。

2026年3月23日,Anthropic 为 Claude Code 添加了**计算机使用(Computer Use)**功能,面向 Pro 和 Max 订阅用户开放,无需额外配置,Claude 就能直接打开文件、运行开发工具、移动鼠标、点击操作、浏览屏幕。

这与以往 AI 编程工具的根本区别在于反馈闭环。过去的流程是:AI 写代码 → 人类运行 → 发现错误 → 复制错误信息 → 再次提交给 AI。现在,Claude Code 可以自己运行代码、读取屏幕上的错误信息、自主完成修复迭代。

Claude Code 计算机使用功能界面

现在能做什么

  • 直接在浏览器中查看 UI 错误:可视化地发现渲染问题并修复
  • 直接操作 DevTools:读取控制台错误并进行调试,无需复制粘贴
  • 浏览文件系统:通过直接探索理解项目结构
  • 验证运行结果:运行代码后当场确认输出

从教育科技或非开发者角度看,这一功能进一步降低了氛围编程的门槛。用自然语言描述需求,AI 就能写代码、运行它、查看结果、自动修复——整个过程无需人工介入每个环节。


2. 子 Agent 与权限中继:像团队一样协作的 AI

从单个 AI 独立工作,转向多个 AI 协同作战。

此次更新中值得关注的另一变化是支持具名子 Agent(Named Subagents)。通过 @ 提及,可以指定特定子 Agent 承担特定任务,就像给团队成员分配角色一样。一个复杂项目可以由多个 Claude Agent 分工处理。

--channels:将审批请求转发至手机

在涉及敏感操作时,AI 有时需要等待人类审批才能继续。新增的 --channels 权限中继功能可以将这些审批请求转发至手机。即使不在电脑前,也可以通过智能手机批准或拒绝 Claude Code 的关键操作。

defer 选项:稍后再决定

PreToolUse 钩子中新增了 defer 选项。无界面会话可以在特定工具调用时暂停,稍后通过 -p --resume 命令恢复,让钩子重新评估。这为完全自动执行与人工介入之间的平衡提供了更精细的控制。


3. 上下文扩展:Opus 4.6 的 128k 输出

更长的代码,更深的分析,不再截断。

Anthropic 将 Opus 4.6 的默认输出提升至 64k Token,最大上限提升至 128k。Sonnet 4.6 同样支持最多 128k 输出。实际意味着什么?

  • 单次响应可生成或修改更长的完整文件
  • 分析大型代码库时截断问题大幅减少
  • 可以一次性撰写复杂的系统设计文档

这不只是数字变大,而是 AI 终于能够不间断地处理现实工作中实际规模的项目。


4. 改变开发工作流的细节更新

小而重要的变化叠加起来,真正改变生产效率。

功能说明
PowerShell 工具预览为 Windows 环境添加 PowerShell 支持
--bare 标志针对脚本自动化调用优化的简洁输出模式
自定义自动内存目录可指定内存文件的存储位置
内存文件时间戳为内存条目添加时间记录
VS Code 速率限制警告在达到速率限制前提前提醒
系统提示词缓存支持 ToolSearch 和 MCP 工具的缓存
无闪烁屏幕渲染采用备用屏幕渲染方式,提升 UI 稳定性

PowerShell 支持尤为重要。AI 开发工具生态长期以 Mac/Linux 为中心,Claude Code 积极支持 Windows 环境,是向平台均衡发展的重要信号。


5. 氛围编程视角下的实战使用建议

不懂编程也能和 AI 一起构建软件的时代正在到来。

氛围编程(Vibe Coding)是指通过自然语言描述期望结果、与 AI 协作的编程方式,而非编写技术语法。Claude Code 的此次更新让这种方式更加强大。

计算机使用功能 + 氛围编程场景:

  1. 说"帮我做一个学生出勤管理的网页应用"
  2. Claude Code 编写代码并在本地直接运行
  3. 直接查看浏览器界面,自动修复 UI 错误
  4. "按钮颜色看起来不对" → 查看屏幕后自行修改 CSS

有过氛围编程经验的人都清楚,最繁琐的环节是:AI 给出代码后,需要自己运行,复制错误信息,再粘贴给 AI 等待修复。计算机使用功能消除了这一循环。

"AI 写代码和 AI 构建软件是两件不同的事。Claude Code 正在走向后者。"


结语

Claude Code 此次更新的方向非常清晰:将 AI 从"工具"转变为"自主 Agent"。计算机使用、子 Agent、权限中继、更大的上下文——所有这一切都指向同一个方向。

作为教育工作者,我认为这一趋势将改变编程教育本身的意义。从"教语法"的时代,向"清晰表达你想构建什么"的能力培养时代转型。这些更新正是这一转变的信号。


相关文章

你是否尝试过氛围编程或 Claude Code?哪个地方让你印象最深刻?欢迎在评论区分享!


参考来源:

Claude Code 开始操控鼠标:计算机直接控制时代已然来临 | MINSSAM.COM