- Published on
用自己的脸制作AI视频、回退代码错误、用语言生成视频特效:2026年7月4日AI简报
"AI现在能用我的脸来制作视频了。"
这句话曾经听起来像科幻小说。然而截至2026年7月4日,这项技术已经内置在智能手机应用里。谷歌的Gemini Omni、Anthropic的Claude Code /rewind、字节跳动的CapCut AI Effect Engine——三个更新来自不同领域,却传递着同一个信号:AI不再只是输出结果的工具,它开始像创作者身体的一部分一样运作。
目录
- Gemini Omni:我的脸出现在AI视频里
- Claude Code /rewind + Chrome正式发布:回退与浏览器落地
- CapCut AI Effect Engine + Video Studio:一句话生成视频特效
- 三个更新共同指向的方向
1. Gemini Omni:我的脸出现在AI视频里
谷歌于2026年7月发布的Gemini Omni不是简单的视频生成器。它可以自由混合文字、照片和视频片段来创作高质量影片,甚至能将一个酷似用户本人的AI头像置入视频中。
想象传统的视频剪辑:把素材片段排列在时间轴上,添加字幕,混音配乐。Gemini Omni将这个过程颠倒过来。只需输入"以旅行照片为背景,创建一个酷似我的角色对着镜头做简短自我介绍的视频",谷歌的生成式媒体模型就会从零开始设计这段视频。
![Gemini Omni — 用户上传自己的照片并选择AI头像模板来生成自定义视频的Gemini应用界面,头像预览和文字提示输入框并排显示的画面]
AI头像:酷似自己的角色出现在视频里
Omni最引人注目的功能是自定义AI头像。你可以从零开始创建、混合相册里的照片,或者从预制模板开始。完成的头像会在视频中开口说话、移动并表达情感。
谷歌在模型层面内置了防深度伪造(Deepfake)安全机制。未经授权使用真实人物面孔将在模型层面被拦截。首次创建个人头像时,用户需要完成大声朗读数字序列的身份验证引导流程。自己的脸出现在视频中,只有通过明确同意和认证才能实现。
谁可以使用
Gemini Omni Flash目前面向所有Google AI Plus、Pro和Ultra订阅用户,通过Gemini应用和Google Flow全球提供。年龄要求为18岁以上。
| 功能 | 描述 |
|---|---|
| 输入方式 | 文字、照片、视频片段自由组合 |
| AI头像 | 完成身份验证后生成酷似本人的头像 |
| 防深伪造 | 模型层面屏蔽真实人物面部描绘 |
| 访问条件 | Google AI Plus/Pro/Ultra订阅用户(18岁以上) |
教育科技视角:Gemini Omni有望成为教育内容制作的强大工具。教师可用自己的头像批量制作重复讲解视频,学生也可以在演示文稿中嵌入AI解说员。但请注意:将未成年学生的面孔用作AI头像,必须事先进行充分的法律和伦理审查。
2. Claude Code /rewind + Chrome正式发布:回退与浏览器落地
2026年7月,Anthropic为Claude Code发布了两项重要更新:用于回退对话的/rewind命令,以及Chrome浏览器集成的正式发布(GA)。
与AI协作编程时,经常会遇到这样的情况:尝试了实验性重构导致代码变得复杂,或者执行了/clear清空对话后发现需要刚才的上下文。以前没有任何办法回退到那个时刻。
![Claude Code /rewind — 在终端执行/rewind命令后显示以前对话检查点列表,并选择恢复代码、对话或两者的界面画面]
/rewind:AI协作的时间机器
/rewind 是将对话回退到执行 /clear 之前状态的命令。有三种触发方式:
- 在终端输入
/rewind命令 - 连续按两次
Esc键 - 从设置菜单打开检查点列表
恢复选项也有三种:仅恢复代码、仅恢复对话、同时恢复代码和对话。这个设计至关重要。有时你想撤销代码更改但保留与AI的讨论上下文,有时则相反——两种情况都得到了支持。
更戏剧化的表述是:"一台可以随时安全回退AI协作实验的时间机器。"这让你可以大胆地相信AI建议的代码并付诸实践。知道失败了也能回退的确信,让尝试变得更加自由。
Claude in Chrome:正式发布(GA)
Claude in Chrome正式发布。此前这是一项实验性功能,现在开始在Windows和macOS环境下向使用Chrome的Google AI Pro或Ultra订阅用户从美国起逐步开放。
智能体工作流也得到了增强。可以通过通知接收后台运行的智能体状态;PR(拉取请求)草稿可以移交给其他工具的Handoff功能;网络故障时自动切换到其他路径的Failover也得到了改进。
额外的性能改进包括流式传输期间CPU使用率降低约37%。对于长时间与AI协作的开发者来说,这是一项可以切实感受到的改善。
教育科技视角:/rewind功能在教育现场有助于设计"允许失败的实验"。学生与AI探索编程时,它提供了一个不必害怕犯错而勇于尝试的心理安全网。教师可以利用这个功能设计"让我们回到这个检查点,换一种方式来尝试"的课堂活动。
3. CapCut AI Effect Engine + Video Studio:一句话生成视频特效
CapCut于2026年发布了两项核心AI功能:通过自然语言创建自定义视频特效的AI Effect Engine,以及仅靠文字提示即可编辑视频的无时间轴Video Studio。
传统视频编辑工具的局限性一直很明显:如果库里没有想要的特效,就必须自己动手制作,而这个过程需要专业技能。CapCut的AI Effect Engine用自然语言消除了这道障碍。
![CapCut AI Effect Engine — 在文字输入框中输入"金色粒子飘散的效果",预览面板中实时显示生成的自定义特效的编辑画面]
AI Effect Engine:用语言"订购""机器人爆炸"特效
在5万多个预制特效库的基础上,CapCut叠加了一个生成引擎。用自然语言描述想要的特效,AI就会即时创建出来。
- "霓虹灯光流淌而下的感觉"
- "老旧胶片断裂时的质感"
- "像在水下拍摄一样波纹荡漾的画面"
一段这样的描述就能生成自定义特效。专业动态图形设计师需要数小时完成的工作,如今一句自然语言就能替代。
Video Studio:无时间轴的视频编辑
Video Studio是基于字节跳动Seedance 2.0模型的网页平台AI工作区。它抛弃了传统视频编辑工具的时间轴概念,采用基于画布的故事板方式进行创作。
输入文字提示后,最长15秒的场景就会生成,将这些场景连接起来就可以编辑成完整视频。背景替换、自动插入字幕、风格转换都通过文字指令来处理。
Auto Captions升级:100种语言,支持语码转换
2026年CapCut的自动字幕功能实现了跨代式飞跃。
| 功能 | 之前 | 2026年 |
|---|---|---|
| 支持语言数 | 约30种 | 100种以上 |
| 语码转换 | 不支持 | 处理混合语言 |
| 翻译字幕 | 手动 | 实时翻译 |
语码转换是指在一个句子中混合使用多种语言,比如"今天在会议上发表了AI strategy"。以前的工具遇到这种情况,字幕会出错或完全遗漏某一语言。2026年的CapCut能够处理这种情况。
教育科技视角:100种语言自动字幕和实时翻译大幅降低了多语言教育内容的制作成本。教师用中文录制的课程视频会自动获得英语、日语字幕。AI Effect Engine让学生在视频项目课程中无需专业软件就能应用专业级视觉特效。但请提前确认生成特效的版权归属和学校的应用程序使用政策。
4. 三个更新共同指向的方向
Gemini Omni、Claude Code /rewind、CapCut AI Effect Engine。三个更新来自完全不同的公司、完全不同的产品线。然而它们共同指向了同一个方向。
"AI正在向容忍错误的方向进化。"
Gemini Omni在头像生成过程中加入了身份验证引导流程——这是防止误用的安全装置。Claude Code的/rewind让AI协作中随时可以回退到之前的节点。CapCut的Video Studio采用场景叠加的方式,无需重新制作全部内容就能进行局部修改。
随着AI工具越来越强大,"可回退性"成为核心功能而非附加选项。工具设计者们开始理解:允许大胆尝试的环境,才能产生更好的成果。
现在就能尝试的使用技巧
Gemini Omni(Google AI Plus及以上): 在Gemini应用中打开Omni,完成身份验证引导流程。然后尝试制作一段简单的问候视频——以旅行照片为背景,头像对着镜头说话的15秒短片。这次体验会直接告诉你这项技术的实际水平。
Claude Code /rewind: 在使用Claude Code尝试重构之后,立即输入/rewind。从列表中选择一个检查点并选择"仅恢复代码",代码就会恢复到之前的状态,而对话保持不变。只要经历一次这个流程,你就会立刻明白之前为什么会觉得缺少这个功能有多可惜。
CapCut AI Effect Engine: 打开CapCut网页版或应用程序,新建一个视频项目。在特效选项卡中找到"用自然语言创建特效"按钮。用中文描述你想要的氛围来生成自定义特效。当一个现有库里从未有过的专属特效出现在预览中的那一刻,视频编辑的标准就此改变。
这三个更新中,你最想首先在自己的创作或工作中尝试哪个功能?欢迎在评论中告诉我。
相关文章
- NotebookLM 2.0·Claude Code动态工作流·Gemini 3 Flash:7月AI工具简报
- Claude Code 5级智能体·OpenClaw·Suno语音克隆:2026年7月AI工具简报
- CapCut Seedream 5 AI图像生成功能分析
出处 (Sources)
- Google Blog (2026). Introducing Gemini Omni. https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/
- Google Gemini Release Notes (2026.07). Gemini Apps Release Updates. https://gemini.google/release-notes/
- Chrome Unboxed (2026). Going hands-on with Google's new Gemini Omni AI avatar feature. https://chromeunboxed.com/going-hands-on-with-googles-new-gemini-omni-ai-avatar-feature-is-an-absolute-trip/
- Claude Code Docs (2026.07). What's New — Claude Code. https://code.claude.com/docs/en/whats-new
- Releasebot (2026.07). Claude Code Updates by Anthropic — July 2026. https://releasebot.io/updates/anthropic/claude-code
- Zenn (2026). Claude Code检查点功能(rewind)是什么. https://zenn.dev/tmasuyama1114/articles/claude_code_checkpoint_rewind
- MLQ News (2026). CapCut Launches Video Studio with AI Video Generation. https://mlq.ai/news/capcut-launches-video-studio-with-ai-video-generation/
- Flowith Blog (2026). CapCut Desktop Pro 2026's AI Auto-Edit and Effect Engine. https://flowith.io/blog/capcut-desktop-pro-2026-ai-auto-edit-define-short-form-video-2026/