Mail

"AI现在能用我的脸来制作视频了。"

这句话曾经听起来像科幻小说。然而截至2026年7月4日，这项技术已经内置在智能手机应用里。谷歌的Gemini Omni、Anthropic的Claude Code /rewind、字节跳动的CapCut AI Effect Engine——三个更新来自不同领域，却传递着同一个信号：AI不再只是输出结果的工具，它开始像创作者身体的一部分一样运作。

1. Gemini Omni：我的脸出现在AI视频里

谷歌于2026年7月发布的Gemini Omni不是简单的视频生成器。它可以自由混合文字、照片和视频片段来创作高质量影片，甚至能将一个酷似用户本人的AI头像置入视频中。

想象传统的视频剪辑：把素材片段排列在时间轴上，添加字幕，混音配乐。Gemini Omni将这个过程颠倒过来。只需输入"以旅行照片为背景，创建一个酷似我的角色对着镜头做简短自我介绍的视频"，谷歌的生成式媒体模型就会从零开始设计这段视频。

![Gemini Omni — 用户上传自己的照片并选择AI头像模板来生成自定义视频的Gemini应用界面，头像预览和文字提示输入框并排显示的画面]

AI头像：酷似自己的角色出现在视频里

Omni最引人注目的功能是自定义AI头像。你可以从零开始创建、混合相册里的照片，或者从预制模板开始。完成的头像会在视频中开口说话、移动并表达情感。

谷歌在模型层面内置了防深度伪造（Deepfake）安全机制。未经授权使用真实人物面孔将在模型层面被拦截。首次创建个人头像时，用户需要完成大声朗读数字序列的身份验证引导流程。自己的脸出现在视频中，只有通过明确同意和认证才能实现。

谁可以使用

Gemini Omni Flash目前面向所有Google AI Plus、Pro和Ultra订阅用户，通过Gemini应用和Google Flow全球提供。年龄要求为18岁以上。

功能	描述
输入方式	文字、照片、视频片段自由组合
AI头像	完成身份验证后生成酷似本人的头像
防深伪造	模型层面屏蔽真实人物面部描绘
访问条件	Google AI Plus/Pro/Ultra订阅用户（18岁以上）

教育科技视角：Gemini Omni有望成为教育内容制作的强大工具。教师可用自己的头像批量制作重复讲解视频，学生也可以在演示文稿中嵌入AI解说员。但请注意：将未成年学生的面孔用作AI头像，必须事先进行充分的法律和伦理审查。

2. Claude Code /rewind + Chrome正式发布：回退与浏览器落地

2026年7月，Anthropic为Claude Code发布了两项重要更新：用于回退对话的/rewind命令，以及Chrome浏览器集成的正式发布（GA）。

与AI协作编程时，经常会遇到这样的情况：尝试了实验性重构导致代码变得复杂，或者执行了/clear清空对话后发现需要刚才的上下文。以前没有任何办法回退到那个时刻。

![Claude Code /rewind — 在终端执行/rewind命令后显示以前对话检查点列表，并选择恢复代码、对话或两者的界面画面]

/rewind：AI协作的时间机器

/rewind 是将对话回退到执行 /clear 之前状态的命令。有三种触发方式：

在终端输入 /rewind 命令
连续按两次 Esc 键
从设置菜单打开检查点列表

恢复选项也有三种：仅恢复代码、仅恢复对话、同时恢复代码和对话。这个设计至关重要。有时你想撤销代码更改但保留与AI的讨论上下文，有时则相反——两种情况都得到了支持。

更戏剧化的表述是："一台可以随时安全回退AI协作实验的时间机器。"这让你可以大胆地相信AI建议的代码并付诸实践。知道失败了也能回退的确信，让尝试变得更加自由。

Claude in Chrome：正式发布（GA）

Claude in Chrome正式发布。此前这是一项实验性功能，现在开始在Windows和macOS环境下向使用Chrome的Google AI Pro或Ultra订阅用户从美国起逐步开放。

智能体工作流也得到了增强。可以通过通知接收后台运行的智能体状态；PR（拉取请求）草稿可以移交给其他工具的Handoff功能；网络故障时自动切换到其他路径的Failover也得到了改进。

额外的性能改进包括流式传输期间CPU使用率降低约37%。对于长时间与AI协作的开发者来说，这是一项可以切实感受到的改善。

教育科技视角：/rewind功能在教育现场有助于设计"允许失败的实验"。学生与AI探索编程时，它提供了一个不必害怕犯错而勇于尝试的心理安全网。教师可以利用这个功能设计"让我们回到这个检查点，换一种方式来尝试"的课堂活动。

3. CapCut AI Effect Engine + Video Studio：一句话生成视频特效

CapCut于2026年发布了两项核心AI功能：通过自然语言创建自定义视频特效的AI Effect Engine，以及仅靠文字提示即可编辑视频的无时间轴Video Studio。

传统视频编辑工具的局限性一直很明显：如果库里没有想要的特效，就必须自己动手制作，而这个过程需要专业技能。CapCut的AI Effect Engine用自然语言消除了这道障碍。

![CapCut AI Effect Engine — 在文字输入框中输入"金色粒子飘散的效果"，预览面板中实时显示生成的自定义特效的编辑画面]

AI Effect Engine：用语言"订购""机器人爆炸"特效

在5万多个预制特效库的基础上，CapCut叠加了一个生成引擎。用自然语言描述想要的特效，AI就会即时创建出来。

"霓虹灯光流淌而下的感觉"
"老旧胶片断裂时的质感"
"像在水下拍摄一样波纹荡漾的画面"

一段这样的描述就能生成自定义特效。专业动态图形设计师需要数小时完成的工作，如今一句自然语言就能替代。

Video Studio：无时间轴的视频编辑

Video Studio是基于字节跳动Seedance 2.0模型的网页平台AI工作区。它抛弃了传统视频编辑工具的时间轴概念，采用基于画布的故事板方式进行创作。

输入文字提示后，最长15秒的场景就会生成，将这些场景连接起来就可以编辑成完整视频。背景替换、自动插入字幕、风格转换都通过文字指令来处理。

Auto Captions升级：100种语言，支持语码转换

2026年CapCut的自动字幕功能实现了跨代式飞跃。

功能	之前	2026年
支持语言数	约30种	100种以上
语码转换	不支持	处理混合语言
翻译字幕	手动	实时翻译

语码转换是指在一个句子中混合使用多种语言，比如"今天在会议上发表了AI strategy"。以前的工具遇到这种情况，字幕会出错或完全遗漏某一语言。2026年的CapCut能够处理这种情况。

教育科技视角：100种语言自动字幕和实时翻译大幅降低了多语言教育内容的制作成本。教师用中文录制的课程视频会自动获得英语、日语字幕。AI Effect Engine让学生在视频项目课程中无需专业软件就能应用专业级视觉特效。但请提前确认生成特效的版权归属和学校的应用程序使用政策。

4. 三个更新共同指向的方向

Gemini Omni、Claude Code /rewind、CapCut AI Effect Engine。三个更新来自完全不同的公司、完全不同的产品线。然而它们共同指向了同一个方向。

"AI正在向容忍错误的方向进化。"

Gemini Omni在头像生成过程中加入了身份验证引导流程——这是防止误用的安全装置。Claude Code的/rewind让AI协作中随时可以回退到之前的节点。CapCut的Video Studio采用场景叠加的方式，无需重新制作全部内容就能进行局部修改。

随着AI工具越来越强大，"可回退性"成为核心功能而非附加选项。工具设计者们开始理解：允许大胆尝试的环境，才能产生更好的成果。

现在就能尝试的使用技巧

Gemini Omni（Google AI Plus及以上）： 在Gemini应用中打开Omni，完成身份验证引导流程。然后尝试制作一段简单的问候视频——以旅行照片为背景，头像对着镜头说话的15秒短片。这次体验会直接告诉你这项技术的实际水平。

Claude Code /rewind： 在使用Claude Code尝试重构之后，立即输入/rewind。从列表中选择一个检查点并选择"仅恢复代码"，代码就会恢复到之前的状态，而对话保持不变。只要经历一次这个流程，你就会立刻明白之前为什么会觉得缺少这个功能有多可惜。

CapCut AI Effect Engine： 打开CapCut网页版或应用程序，新建一个视频项目。在特效选项卡中找到"用自然语言创建特效"按钮。用中文描述你想要的氛围来生成自定义特效。当一个现有库里从未有过的专属特效出现在预览中的那一刻，视频编辑的标准就此改变。

这三个更新中，你最想首先在自己的创作或工作中尝试哪个功能？欢迎在评论中告诉我。

出处 (Sources)

Google Blog (2026). Introducing Gemini Omni. https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/
Google Gemini Release Notes (2026.07). Gemini Apps Release Updates. https://gemini.google/release-notes/
Chrome Unboxed (2026). Going hands-on with Google's new Gemini Omni AI avatar feature. https://chromeunboxed.com/going-hands-on-with-googles-new-gemini-omni-ai-avatar-feature-is-an-absolute-trip/
Claude Code Docs (2026.07). What's New — Claude Code. https://code.claude.com/docs/en/whats-new
Releasebot (2026.07). Claude Code Updates by Anthropic — July 2026. https://releasebot.io/updates/anthropic/claude-code
Zenn (2026). Claude Code检查点功能（rewind）是什么. https://zenn.dev/tmasuyama1114/articles/claude_code_checkpoint_rewind
MLQ News (2026). CapCut Launches Video Studio with AI Video Generation. https://mlq.ai/news/capcut-launches-video-studio-with-ai-video-generation/
Flowith Blog (2026). CapCut Desktop Pro 2026's AI Auto-Edit and Effect Engine. https://flowith.io/blog/capcut-desktop-pro-2026-ai-auto-edit-define-short-form-video-2026/

用自己的脸制作AI视频、回退代码错误、用语言生成视频特效：2026年7月4日AI简报

目录