一手评测 Gemini Omni Flash:它不是最强的视频模型,但 Flow 正在做一件更危险的事

本来 AI 视频赛道已经够卷了。

结果今天凌晨,Google Flow 又塞进来一个新东西:

Gemini Omni Flash。

这次最值得注意的,不只是”Google 又发了一个视频模型”——同时还给 Flow 塞了一大堆新功能。

Flow 不再是一个单纯的视频生成工具,更像一个完整的 AI 视频工作台了。

Flow 这次的方向很明确:

不想只做一个视频模型,而是想把 AI 视频创作的整条链路,尽可能全部吃下来。

这就很值得聊了。

视频插入位:赛车 Demo
本地视频:assets/Gemini Omni/gemini-omni-racing-demo.mp4

一. Gemini Omni Flash:不是最强,但性价比有点狠

先说这次的主角。

Gemini Omni Flash 在 Flow 里支持 4s、6s、8s、10s 四个时长参数。

它支持首尾帧,也支持帧参考模式。

这个帧参考模式,可以理解成类似即梦里的”全能参考”:用参考图去约束画面,而不是只靠一句提示词让模型自由发挥。

这对 AI 视频很关键。

因为真正做过视频的人都知道,AI 视频最大的问题不是”能不能动起来”,而是”能不能按我的方向动起来”。

没有参考和控制,模型再强也容易变成抽卡。

从实测结论看,Gemini Omni Flash 目前还不是全场最强。

我的阶段性判断是:

Seedance 2.0 > Gemini Omni > HappyHorse 1.0。

也就是说,如果你追求极限质量,Seedance 2.0 还是更强。

但 Gemini Omni Flash 真正狠的地方,在价格。

一个 10s 视频消耗 60 积分,Gemini Pro 会员每月给 1000 积分。粗暴算一下,都拿来生成 10s 视频,大概能出十几条。

对 AI 视频创作者来说,这个性价比已经很能打了。

它可能不是最锋利的那把刀,但它很可能会成为很多人日常高频使用的那把刀。

尤其是电商场景。

产品展示、香水广告、跳舞 Demo、简单口播、短视频素材——场景不是特别复杂的话,Gemini Omni Flash 已经完全够用,不需要条条都上 Seedance 2.0。

香水 Demo:

视频插入位:香水 Demo
本地视频:assets/Gemini Omni/gemini-omni-perfume-demo.mp4

跳舞 Demo:

视频插入位:跳舞 Demo
本地视频:assets/Gemini Omni/gemini-omni-dance-demo.mp4

这就很现实了。

很多时候,创作者并不需要每条视频都达到”世界第一模型”的水准。他需要的是便宜、快、稳定、能批量出。

这一点,Flow 踩得很准。

二. 角色库:长视频终于不用每条都重新捏人了

这次更新里,我觉得非常重要的一个功能,是角色库(characters)。

AI 视频要从”玩具”变成”生产力”,角色一致性几乎是绕不开的问题。

你做一条 10 秒的玩梗视频,可以每次长得不一样。但你要做短剧、数字人口播、电商模特,就不可能每次都重新捏一个人。

角色不稳定,内容就不稳定。内容不稳定,品牌感就没了。

Flow 这次的角色的核心价值,就是让你把一个角色沉淀下来,后面反复复用。

角色创建里可以选择 Nano Banana Pro 和 Nano Banana 2。

声音这块也有内置声音库,数量已经很多,也支持 AI 重新生成声音。但目前似乎还不支持直接导入自己的声音——这点比较可惜,不过后面创建 AI 分身时可以弥补。

三. Flow Agent:脚本和分镜开始内置进工作台

这次 Flow 还加了内置 Agent。

它可以写脚本,生成分镜图,甚至继续生成图片和视频。

这个方向我非常喜欢。因为 AI 视频真正的门槛,从来不是”输入一句话生成一个片段”。

真正的门槛是导演思维——拍什么、怎么拆镜头、每个镜头承担什么叙事功能、哪里该给特写、哪里该给远景、哪里该快切、哪里该停顿。

过去很多视频生成工具,只解决了”动起来”这件事,但没有解决”怎么像一个作品”这件事。

Flow 把 Agent 放进来,本质上就是想把脚本、分镜、生成这三步连起来。

四. Tools:Flow 真正厉害的是开始像一个工具工厂

这次 Flow 还有一个特别值得注意的变化:你可以在里面搭建属于自己的 tools。

比如角度切换器,用来调整摄像机角度。比如 time stretch,用来拉伸时间和改变 fps。

而且 Flow 内置已经有几十个工具了。

这就不是简单的”加几个按钮”——它更像是在把专业视频创作里的常见操作,逐渐模块化、工具化。

普通用户可以直接用内置工具。更专业的影视创作者,甚至可以借助内置 Agent 写代码,搭建自己的专属工具。

Flow 正在开创一种全新的创作环境:不是传统剪辑软件,不是单点 AI 生成器,而是一个”模型 + Agent + 工具 + 素材节点”的一站式创作平台。

这和过去的 AI 视频产品不在一个维度。过去大家拼的是模型能力,现在 Flow 想拼的是工作流。这也是我觉得这次更新最关键的地方。

五. 上传照片和声音,生成你自己的 AI 分身

这次还有一个很容易让普通人上头的新功能:上传自己的照片和声音,生成自己的 AI 分身视频。

这个功能不是随便上传就能用,需要扫码到手机上做验证。

流程分两步。第一步,对着屏幕上的数字念出来——要用英文,两位数英文。第二步,跟着提示左右摇头,完成真人动作验证。

这个设计很合理。因为一旦涉及”用本人照片和声音生成视频”,安全和授权就非常重要。没有验证,这功能很容易变成深度伪造工具。

不过我自己认证完成后,电脑端没有反应。大概率还是刚上线流量太大,服务没撑住。

但我们透过现象看本质:未来普通人做自己的 AI 分身视频,门槛会越来越低。

以前做数字人,要拍素材、录音、训练、抠像、调参数。现在越来越像是:上传本人资料,验证身份,直接进入生成流程。

这对个人 IP、课程口播、企业培训、电商主播,都会非常有用。

同时也要提醒一句:这种功能一定要谨慎用。自己的照片、声音、身份验证,都是高敏感素材。能用小号测试就先小号测试,能不上传核心隐私素材就不要随便上传。AI 视频越强,隐私边界就越要自己守住。

六. Flow App:AI 视频从桌面走到手机

这次 Flow App 也在 Android 移动端推出了,名字叫 Google Flow Beta。

这件事对咱们也挺关键。Codex 实现了随时 vibe coding,Flow 就是实现了随时 vibe creating。

过去 AI 视频创作很像一个桌面工程——坐在电脑前,开网页,整理素材,调参数,下载文件。但现在有了 Flow App,很多轻量视频生成可能变成随手操作。

出门看到一个场景,拍一张参考图。路上写一个提示词。手机直接生成几条视频素材。晚上回去再统一筛选、剪辑、发布。

这会彻底改变 AI 视频的使用频率。一个工具一旦进了手机,就不再只是”工作时用一下”,而是一个随时可以打开的创作入口。

这也是 Flow 想做平台的另一层信号。

七. 谁最适合现在去试

这次 Flow 更新,最值得这几类人优先尝试。

第一类,电商运营。产品展示、模特展示、香水、服装、饰品、食品这些短视频素材,Gemini Omni Flash 的性价比非常香。不一定每条都要追求影视级效果,能稳定批量出素材,就已经能省很多时间。

第二类,短视频创作者。角色库、Agent、Tools、移动端,对短视频创作者都很友好。尤其是有固定栏目、固定角色、固定视觉风格的时候,角色复用会越来越重要。

第三类,AI 视频玩家。如果你已经在用 Seedance、可灵、即梦、Runway、Sora、Vidu,这次 Flow 值得加进你的测试清单。它未必马上替代你现在的主力工具,但会是一个很好的补充。

第四类,做个人 IP 的人。真人照片和声音生成视频这块,如果后面稳定了,会非常适合知识博主、课程博主、企业培训。但这类人也最需要注意隐私和授权。

第五类,专业影视创作者。现在 Flow 的模型能力未必能满足所有高复杂度镜头,但自定义 tools 和 Agent 写代码这个方向,非常值得盯。因为专业创作最终需要的不是”一个按钮生成视频”,而是可控、可复用、可扩展的工作流。

八. 先别急着神化它

这次更新很强,但还没到可以无脑吹的程度。

先说模型能力。按照实测,Gemini Omni Flash 目前还是弱于 Seedance 2.0。复杂动作、复杂分镜、强剧情、强一致性,Seedance 2.0 依然是更强的选择。

再说稳定性。Flow Agent 现在会因为使用量过大而无法正常响应。真人视频认证完成后,电脑端也可能没反应。很多功能还处在刚上线的拥挤状态。

再说声音。角色库支持内置声音和 AI 生成声音,但暂时似乎不能导入自己的声音。这对想做固定个人 IP 的用户来说,会影响完整度。

最后是会员门槛。Flow 似乎只有 Gemini Pro 及以上的付费会员才能比较完整地玩。Pro 会员每月 1000 积分,Ultra 会员据说有 45000 积分。(需要会员渠道我也能提供)

尝鲜的话,Pro 够用。真要批量做视频,那就搞个Ultra吧。

所以这东西现在最准确的定位应该是:很值得试,但还不是所有场景的终极答案。

写在最后

我觉得 Flow 这次最重要的变化,不是 Gemini Omni Flash 这一个模型,而是它终于开始把 AI 视频这件事,从”模型能力竞争”往”创作工作流竞争”推了。

过去一年,AI 视频工具一直在卷:谁更清晰、谁动作更稳、谁更听话、谁更便宜、谁更像真实拍摄。这些都重要。

但 AI 视频要大规模进入普通人的工作流,光靠模型还不够——你还得解决脚本、分镜、角色一致性、素材管理、工具链、移动端、真人形象、安全验证这些问题。Flow 这次就是在朝这个方向走。

它像是在告诉所有视频创作平台:我不只想做一个生成按钮,我想做从想法到成片的整条链路。

到这里听起来只是”野心大”,但为什么说它危险?

因为 Flow 身后站的是 Google 的整套生态。Android 分发、YouTube 出口、Gemini 会员体系——这些东西单独一家模型公司根本抄不了。Seedance 再强、可灵再便宜、Runway 再专业,它们只能卖模型,而 Google 可以把模型绑在一个 $20/月的会员里,连工具带分发一起给。

更关键的是切换成本。等你在 Flow 里建好了十几个角色、跑通了脚本和分镜、搭好了定制 tools,你就已经不是一个”来试试新模型”的用户了——你已经把自己的生产线焊在了 Flow 里。哪天 Flow 把底层模型从 Gemini Omni 换成 Veo,你根本不会在意,因为你被锁住的不是模型,而是整个工作流。

到那时候,模型就变成了可替换零件。单卖模型的公司,全部会被边缘化。

这才是真正的危险——不是 Flow 今天多强,而是它想让所有对手变成它的零件供应商。

如果你是做电商、短视频、AI 口播、轻量广告的,我建议这波可以尽快试一下。不一定马上替换掉 Seedance 2.0,但一定值得加入你的工具箱。

因为接下来的 AI 视频竞争,可能不再是”谁单个模型最强”,而是”谁能让普通人更快、更便宜、更稳定地把一条视频做出来”。Flow 这次,已经开始往那个方向去了。

Flow 入口: https://labs.google/fx/tools/flow