MINssam
Published on

用自己的脸制作AI视频、回退代码错误、用语言生成视频特效:2026年7月4日AI简报

"AI现在能用我的脸来制作视频了。"

这句话曾经听起来像科幻小说。然而截至2026年7月4日,这项技术已经内置在智能手机应用里。谷歌的Gemini Omni、Anthropic的Claude Code /rewind、字节跳动的CapCut AI Effect Engine——三个更新来自不同领域,却传递着同一个信号:AI不再只是输出结果的工具,它开始像创作者身体的一部分一样运作。


目录

  1. Gemini Omni:我的脸出现在AI视频里
  2. Claude Code /rewind + Chrome正式发布:回退与浏览器落地
  3. CapCut AI Effect Engine + Video Studio:一句话生成视频特效
  4. 三个更新共同指向的方向

1. Gemini Omni:我的脸出现在AI视频里

谷歌于2026年7月发布的Gemini Omni不是简单的视频生成器。它可以自由混合文字、照片和视频片段来创作高质量影片,甚至能将一个酷似用户本人的AI头像置入视频中。

想象传统的视频剪辑:把素材片段排列在时间轴上,添加字幕,混音配乐。Gemini Omni将这个过程颠倒过来。只需输入"以旅行照片为背景,创建一个酷似我的角色对着镜头做简短自我介绍的视频",谷歌的生成式媒体模型就会从零开始设计这段视频。

![Gemini Omni — 用户上传自己的照片并选择AI头像模板来生成自定义视频的Gemini应用界面,头像预览和文字提示输入框并排显示的画面]

AI头像:酷似自己的角色出现在视频里

Omni最引人注目的功能是自定义AI头像。你可以从零开始创建、混合相册里的照片,或者从预制模板开始。完成的头像会在视频中开口说话、移动并表达情感。

谷歌在模型层面内置了防深度伪造(Deepfake)安全机制。未经授权使用真实人物面孔将在模型层面被拦截。首次创建个人头像时,用户需要完成大声朗读数字序列的身份验证引导流程。自己的脸出现在视频中,只有通过明确同意和认证才能实现。

谁可以使用

Gemini Omni Flash目前面向所有Google AI Plus、Pro和Ultra订阅用户,通过Gemini应用和Google Flow全球提供。年龄要求为18岁以上。

功能描述
输入方式文字、照片、视频片段自由组合
AI头像完成身份验证后生成酷似本人的头像
防深伪造模型层面屏蔽真实人物面部描绘
访问条件Google AI Plus/Pro/Ultra订阅用户(18岁以上)

教育科技视角:Gemini Omni有望成为教育内容制作的强大工具。教师可用自己的头像批量制作重复讲解视频,学生也可以在演示文稿中嵌入AI解说员。但请注意:将未成年学生的面孔用作AI头像,必须事先进行充分的法律和伦理审查。


2. Claude Code /rewind + Chrome正式发布:回退与浏览器落地

2026年7月,Anthropic为Claude Code发布了两项重要更新:用于回退对话的/rewind命令,以及Chrome浏览器集成的正式发布(GA)。

与AI协作编程时,经常会遇到这样的情况:尝试了实验性重构导致代码变得复杂,或者执行了/clear清空对话后发现需要刚才的上下文。以前没有任何办法回退到那个时刻。

![Claude Code /rewind — 在终端执行/rewind命令后显示以前对话检查点列表,并选择恢复代码、对话或两者的界面画面]

/rewind:AI协作的时间机器

/rewind 是将对话回退到执行 /clear 之前状态的命令。有三种触发方式:

  • 在终端输入 /rewind 命令
  • 连续按两次 Esc
  • 从设置菜单打开检查点列表

恢复选项也有三种:仅恢复代码仅恢复对话同时恢复代码和对话。这个设计至关重要。有时你想撤销代码更改但保留与AI的讨论上下文,有时则相反——两种情况都得到了支持。

更戏剧化的表述是:"一台可以随时安全回退AI协作实验的时间机器。"这让你可以大胆地相信AI建议的代码并付诸实践。知道失败了也能回退的确信,让尝试变得更加自由。

Claude in Chrome:正式发布(GA)

Claude in Chrome正式发布。此前这是一项实验性功能,现在开始在Windows和macOS环境下向使用Chrome的Google AI Pro或Ultra订阅用户从美国起逐步开放。

智能体工作流也得到了增强。可以通过通知接收后台运行的智能体状态;PR(拉取请求)草稿可以移交给其他工具的Handoff功能;网络故障时自动切换到其他路径的Failover也得到了改进。

额外的性能改进包括流式传输期间CPU使用率降低约37%。对于长时间与AI协作的开发者来说,这是一项可以切实感受到的改善。

教育科技视角:/rewind功能在教育现场有助于设计"允许失败的实验"。学生与AI探索编程时,它提供了一个不必害怕犯错而勇于尝试的心理安全网。教师可以利用这个功能设计"让我们回到这个检查点,换一种方式来尝试"的课堂活动。


3. CapCut AI Effect Engine + Video Studio:一句话生成视频特效

CapCut于2026年发布了两项核心AI功能:通过自然语言创建自定义视频特效的AI Effect Engine,以及仅靠文字提示即可编辑视频的无时间轴Video Studio。

传统视频编辑工具的局限性一直很明显:如果库里没有想要的特效,就必须自己动手制作,而这个过程需要专业技能。CapCut的AI Effect Engine用自然语言消除了这道障碍。

![CapCut AI Effect Engine — 在文字输入框中输入"金色粒子飘散的效果",预览面板中实时显示生成的自定义特效的编辑画面]

AI Effect Engine:用语言"订购""机器人爆炸"特效

在5万多个预制特效库的基础上,CapCut叠加了一个生成引擎。用自然语言描述想要的特效,AI就会即时创建出来。

  • "霓虹灯光流淌而下的感觉"
  • "老旧胶片断裂时的质感"
  • "像在水下拍摄一样波纹荡漾的画面"

一段这样的描述就能生成自定义特效。专业动态图形设计师需要数小时完成的工作,如今一句自然语言就能替代。

Video Studio:无时间轴的视频编辑

Video Studio是基于字节跳动Seedance 2.0模型的网页平台AI工作区。它抛弃了传统视频编辑工具的时间轴概念,采用基于画布的故事板方式进行创作。

输入文字提示后,最长15秒的场景就会生成,将这些场景连接起来就可以编辑成完整视频。背景替换、自动插入字幕、风格转换都通过文字指令来处理。

Auto Captions升级:100种语言,支持语码转换

2026年CapCut的自动字幕功能实现了跨代式飞跃。

功能之前2026年
支持语言数约30种100种以上
语码转换不支持处理混合语言
翻译字幕手动实时翻译

语码转换是指在一个句子中混合使用多种语言,比如"今天在会议上发表了AI strategy"。以前的工具遇到这种情况,字幕会出错或完全遗漏某一语言。2026年的CapCut能够处理这种情况。

教育科技视角:100种语言自动字幕和实时翻译大幅降低了多语言教育内容的制作成本。教师用中文录制的课程视频会自动获得英语、日语字幕。AI Effect Engine让学生在视频项目课程中无需专业软件就能应用专业级视觉特效。但请提前确认生成特效的版权归属和学校的应用程序使用政策。


4. 三个更新共同指向的方向

Gemini Omni、Claude Code /rewind、CapCut AI Effect Engine。三个更新来自完全不同的公司、完全不同的产品线。然而它们共同指向了同一个方向。

"AI正在向容忍错误的方向进化。"

Gemini Omni在头像生成过程中加入了身份验证引导流程——这是防止误用的安全装置。Claude Code的/rewind让AI协作中随时可以回退到之前的节点。CapCut的Video Studio采用场景叠加的方式,无需重新制作全部内容就能进行局部修改。

随着AI工具越来越强大,"可回退性"成为核心功能而非附加选项。工具设计者们开始理解:允许大胆尝试的环境,才能产生更好的成果。


现在就能尝试的使用技巧

Gemini Omni(Google AI Plus及以上): 在Gemini应用中打开Omni,完成身份验证引导流程。然后尝试制作一段简单的问候视频——以旅行照片为背景,头像对着镜头说话的15秒短片。这次体验会直接告诉你这项技术的实际水平。

Claude Code /rewind: 在使用Claude Code尝试重构之后,立即输入/rewind。从列表中选择一个检查点并选择"仅恢复代码",代码就会恢复到之前的状态,而对话保持不变。只要经历一次这个流程,你就会立刻明白之前为什么会觉得缺少这个功能有多可惜。

CapCut AI Effect Engine: 打开CapCut网页版或应用程序,新建一个视频项目。在特效选项卡中找到"用自然语言创建特效"按钮。用中文描述你想要的氛围来生成自定义特效。当一个现有库里从未有过的专属特效出现在预览中的那一刻,视频编辑的标准就此改变。

这三个更新中,你最想首先在自己的创作或工作中尝试哪个功能?欢迎在评论中告诉我。


相关文章


出处 (Sources)

用自己的脸制作AI视频、回退代码错误、用语言生成视频特效:2026年7月4日AI简报 | MINSSAM.COM