一手评测 Gemini Omni Flash：它不是最强的视频模型，但 Flow 正在做一件更危险的事

本来 AI 视频赛道已经够卷了。

结果今天凌晨，Google Flow 又塞进来一个新东西：

Gemini Omni Flash。

这次最值得注意的，不只是”Google 又发了一个视频模型”——同时还给 Flow 塞了一大堆新功能。

Flow 不再是一个单纯的视频生成工具，更像一个完整的 AI 视频工作台了。

Flow 这次的方向很明确：

不想只做一个视频模型，而是想把 AI 视频创作的整条链路，尽可能全部吃下来。

这就很值得聊了。

视频插入位：赛车 Demo
本地视频：assets/Gemini Omni/gemini-omni-racing-demo.mp4

一. Gemini Omni Flash：不是最强，但性价比有点狠

先说这次的主角。

Gemini Omni Flash 在 Flow 里支持 4s、6s、8s、10s 四个时长参数。

它支持首尾帧，也支持帧参考模式。

这个帧参考模式，可以理解成类似即梦里的”全能参考”：用参考图去约束画面，而不是只靠一句提示词让模型自由发挥。

这对 AI 视频很关键。

因为真正做过视频的人都知道，AI 视频最大的问题不是”能不能动起来”，而是”能不能按我的方向动起来”。

没有参考和控制，模型再强也容易变成抽卡。

从实测结论看，Gemini Omni Flash 目前还不是全场最强。

我的阶段性判断是：

Seedance 2.0 > Gemini Omni > HappyHorse 1.0。

也就是说，如果你追求极限质量，Seedance 2.0 还是更强。

但 Gemini Omni Flash 真正狠的地方，在价格。

一个 10s 视频消耗 60 积分，Gemini Pro 会员每月给 1000 积分。粗暴算一下，都拿来生成 10s 视频，大概能出十几条。

对 AI 视频创作者来说，这个性价比已经很能打了。

它可能不是最锋利的那把刀，但它很可能会成为很多人日常高频使用的那把刀。

尤其是电商场景。

产品展示、香水广告、跳舞 Demo、简单口播、短视频素材——场景不是特别复杂的话，Gemini Omni Flash 已经完全够用，不需要条条都上 Seedance 2.0。

香水 Demo：

视频插入位：香水 Demo
本地视频：assets/Gemini Omni/gemini-omni-perfume-demo.mp4

跳舞 Demo：

视频插入位：跳舞 Demo
本地视频：assets/Gemini Omni/gemini-omni-dance-demo.mp4

这就很现实了。

很多时候，创作者并不需要每条视频都达到”世界第一模型”的水准。他需要的是便宜、快、稳定、能批量出。

这一点，Flow 踩得很准。

二. 角色库：长视频终于不用每条都重新捏人了

这次更新里，我觉得非常重要的一个功能，是角色库（characters）。

AI 视频要从”玩具”变成”生产力”，角色一致性几乎是绕不开的问题。

你做一条 10 秒的玩梗视频，可以每次长得不一样。但你要做短剧、数字人口播、电商模特，就不可能每次都重新捏一个人。

角色不稳定，内容就不稳定。内容不稳定，品牌感就没了。

Flow 这次的角色的核心价值，就是让你把一个角色沉淀下来，后面反复复用。

角色创建里可以选择 Nano Banana Pro 和 Nano Banana 2。

声音这块也有内置声音库，数量已经很多，也支持 AI 重新生成声音。但目前似乎还不支持直接导入自己的声音——这点比较可惜，不过后面创建 AI 分身时可以弥补。

三. Flow Agent：脚本和分镜开始内置进工作台

这次 Flow 还加了内置 Agent。

它可以写脚本，生成分镜图，甚至继续生成图片和视频。

这个方向我非常喜欢。因为 AI 视频真正的门槛，从来不是”输入一句话生成一个片段”。

真正的门槛是导演思维——拍什么、怎么拆镜头、每个镜头承担什么叙事功能、哪里该给特写、哪里该给远景、哪里该快切、哪里该停顿。

过去很多视频生成工具，只解决了”动起来”这件事，但没有解决”怎么像一个作品”这件事。

Flow 把 Agent 放进来，本质上就是想把脚本、分镜、生成这三步连起来。

四. Tools：Flow 真正厉害的是开始像一个工具工厂

这次 Flow 还有一个特别值得注意的变化：你可以在里面搭建属于自己的 tools。

比如角度切换器，用来调整摄像机角度。比如 time stretch，用来拉伸时间和改变 fps。

而且 Flow 内置已经有几十个工具了。

这就不是简单的”加几个按钮”——它更像是在把专业视频创作里的常见操作，逐渐模块化、工具化。

普通用户可以直接用内置工具。更专业的影视创作者，甚至可以借助内置 Agent 写代码，搭建自己的专属工具。

Flow 正在开创一种全新的创作环境：不是传统剪辑软件，不是单点 AI 生成器，而是一个”模型 + Agent + 工具 + 素材节点”的一站式创作平台。

这和过去的 AI 视频产品不在一个维度。过去大家拼的是模型能力，现在 Flow 想拼的是工作流。这也是我觉得这次更新最关键的地方。

五. 上传照片和声音，生成你自己的 AI 分身

这次还有一个很容易让普通人上头的新功能：上传自己的照片和声音，生成自己的 AI 分身视频。

这个功能不是随便上传就能用，需要扫码到手机上做验证。

流程分两步。第一步，对着屏幕上的数字念出来——要用英文，两位数英文。第二步，跟着提示左右摇头，完成真人动作验证。

这个设计很合理。因为一旦涉及”用本人照片和声音生成视频”，安全和授权就非常重要。没有验证，这功能很容易变成深度伪造工具。

不过我自己认证完成后，电脑端没有反应。大概率还是刚上线流量太大，服务没撑住。

但我们透过现象看本质：未来普通人做自己的 AI 分身视频，门槛会越来越低。

以前做数字人，要拍素材、录音、训练、抠像、调参数。现在越来越像是：上传本人资料，验证身份，直接进入生成流程。

这对个人 IP、课程口播、企业培训、电商主播，都会非常有用。

同时也要提醒一句：这种功能一定要谨慎用。自己的照片、声音、身份验证，都是高敏感素材。能用小号测试就先小号测试，能不上传核心隐私素材就不要随便上传。AI 视频越强，隐私边界就越要自己守住。

六. Flow App：AI 视频从桌面走到手机

这次 Flow App 也在 Android 移动端推出了，名字叫 Google Flow Beta。

这件事对咱们也挺关键。Codex 实现了随时 vibe coding，Flow 就是实现了随时 vibe creating。

过去 AI 视频创作很像一个桌面工程——坐在电脑前，开网页，整理素材，调参数，下载文件。但现在有了 Flow App，很多轻量视频生成可能变成随手操作。

出门看到一个场景，拍一张参考图。路上写一个提示词。手机直接生成几条视频素材。晚上回去再统一筛选、剪辑、发布。

这会彻底改变 AI 视频的使用频率。一个工具一旦进了手机，就不再只是”工作时用一下”，而是一个随时可以打开的创作入口。

这也是 Flow 想做平台的另一层信号。

七. 谁最适合现在去试

这次 Flow 更新，最值得这几类人优先尝试。

第一类，电商运营。产品展示、模特展示、香水、服装、饰品、食品这些短视频素材，Gemini Omni Flash 的性价比非常香。不一定每条都要追求影视级效果，能稳定批量出素材，就已经能省很多时间。

第二类，短视频创作者。角色库、Agent、Tools、移动端，对短视频创作者都很友好。尤其是有固定栏目、固定角色、固定视觉风格的时候，角色复用会越来越重要。

第三类，AI 视频玩家。如果你已经在用 Seedance、可灵、即梦、Runway、Sora、Vidu，这次 Flow 值得加进你的测试清单。它未必马上替代你现在的主力工具，但会是一个很好的补充。

第四类，做个人 IP 的人。真人照片和声音生成视频这块，如果后面稳定了，会非常适合知识博主、课程博主、企业培训。但这类人也最需要注意隐私和授权。

第五类，专业影视创作者。现在 Flow 的模型能力未必能满足所有高复杂度镜头，但自定义 tools 和 Agent 写代码这个方向，非常值得盯。因为专业创作最终需要的不是”一个按钮生成视频”，而是可控、可复用、可扩展的工作流。

八. 先别急着神化它

这次更新很强，但还没到可以无脑吹的程度。

先说模型能力。按照实测，Gemini Omni Flash 目前还是弱于 Seedance 2.0。复杂动作、复杂分镜、强剧情、强一致性，Seedance 2.0 依然是更强的选择。

再说稳定性。Flow Agent 现在会因为使用量过大而无法正常响应。真人视频认证完成后，电脑端也可能没反应。很多功能还处在刚上线的拥挤状态。

再说声音。角色库支持内置声音和 AI 生成声音，但暂时似乎不能导入自己的声音。这对想做固定个人 IP 的用户来说，会影响完整度。

最后是会员门槛。Flow 似乎只有 Gemini Pro 及以上的付费会员才能比较完整地玩。Pro 会员每月 1000 积分，Ultra 会员据说有 45000 积分。（需要会员渠道我也能提供）

尝鲜的话，Pro 够用。真要批量做视频，那就搞个Ultra吧。

所以这东西现在最准确的定位应该是：很值得试，但还不是所有场景的终极答案。

写在最后

我觉得 Flow 这次最重要的变化，不是 Gemini Omni Flash 这一个模型，而是它终于开始把 AI 视频这件事，从”模型能力竞争”往”创作工作流竞争”推了。

过去一年，AI 视频工具一直在卷：谁更清晰、谁动作更稳、谁更听话、谁更便宜、谁更像真实拍摄。这些都重要。

但 AI 视频要大规模进入普通人的工作流，光靠模型还不够——你还得解决脚本、分镜、角色一致性、素材管理、工具链、移动端、真人形象、安全验证这些问题。Flow 这次就是在朝这个方向走。

它像是在告诉所有视频创作平台：我不只想做一个生成按钮，我想做从想法到成片的整条链路。

到这里听起来只是”野心大”，但为什么说它危险？

因为 Flow 身后站的是 Google 的整套生态。Android 分发、YouTube 出口、Gemini 会员体系——这些东西单独一家模型公司根本抄不了。Seedance 再强、可灵再便宜、Runway 再专业，它们只能卖模型，而 Google 可以把模型绑在一个 $20/月的会员里，连工具带分发一起给。

更关键的是切换成本。等你在 Flow 里建好了十几个角色、跑通了脚本和分镜、搭好了定制 tools，你就已经不是一个”来试试新模型”的用户了——你已经把自己的生产线焊在了 Flow 里。哪天 Flow 把底层模型从 Gemini Omni 换成 Veo，你根本不会在意，因为你被锁住的不是模型，而是整个工作流。

到那时候，模型就变成了可替换零件。单卖模型的公司，全部会被边缘化。

这才是真正的危险——不是 Flow 今天多强，而是它想让所有对手变成它的零件供应商。

如果你是做电商、短视频、AI 口播、轻量广告的，我建议这波可以尽快试一下。不一定马上替换掉 Seedance 2.0，但一定值得加入你的工具箱。

因为接下来的 AI 视频竞争，可能不再是”谁单个模型最强”，而是”谁能让普通人更快、更便宜、更稳定地把一条视频做出来”。Flow 这次，已经开始往那个方向去了。

Flow 入口： https://labs.google/fx/tools/flow

逸尘的AI知识库

探索

Gemini Omni

一手评测 Gemini Omni Flash：它不是最强的视频模型，但 Flow 正在做一件更危险的事

关系图谱