一个全新的世界模型,终于让AI视频进入了“无限流”时代。 * { margin: 0; padding: 0; outline: 0; } body { font-family: “PingFang SC”, system-ui, -apple-system, BlinkMacSystemFont, “Helvetica Neue”, “Hiragino Sans GB”, “Microsoft YaHei UI”, “Microsoft YaHei”, Arial, sans-serif; line-height: 1.6; } .__page_content__ { max-width: 667px; margin: 0 auto; padding: 20px; text-size-adjust: 100%; color: rgba(0, 0, 0, 0.9); padding-bottom: 64px; } .title { user-select: text; font-size: 22px; line-height: 1.4; margin-bottom: 14px; font-weight: 500; } .__meta__ { color: rgba(0, 0, 0, 0.3); font-size: 15px; line-height: 20px; hyphens: auto; word-break: break-word; margin-bottom: 50px; } .__meta__ .nick_name { color: 576B95; } .__meta__ .copyright { color: rgba(0, 0, 0, 0.3); background-color: rgba(0, 0, 0, 0.05); padding: 0 4px; margin: 0 10px 10px 0; } blockquote.source { padding: 10px; margin: 30px 0; border-left: 5px solid ccc; color: #333; font-style: italic; word-wrap: break-word; } blockquote.source a { cursor: pointer; text-decoration: underline; } .item_show_type_0 > section { margin-top: 0; margin-bottom: 24px; } a { color: 576B95; text-decoration: none; cursor: default; } .text_content { margin-bottom: 50px; user-select: text; font-size: 17px; white-space: pre-wrap; word-wrap: break-word; line-height: 28px; hyphens: auto; } .picture_content .picture_item { margin-bottom: 30px; } .picture_content .picture_item .picture_item_label { text-align: center; } img { max-width: 100%; } .pay_subscribe_notice { margin: 30px 0; padding: 20px; background: fffbe6; border: 1px solid ffe58f; border-radius: 8px; } .pay_subscribe_badge { display: inline-block; padding: 4px 12px; background: faad14; color: fff; border-radius: 4px; font-size: 14px; font-weight: 500; margin-bottom: 12px; } .pay_subscribe_desc { font-size: 15px; line-height: 1.8; color: rgba(0, 0, 0, 0.7); margin-bottom: 12px; } .pay_subscribe_hint { font-size: 13px; color: rgba(0, 0, 0, 0.4); } .__bottom-bar__ { display: flex; justify-content: space-between; align-items: center; position: fixed; bottom: 0; left: 0; right: 0; height: 64px; padding: 8px 20px; background: white; box-sizing: border-box; border-top: 1px solid rgba(0, 0, 0, 0.2); } .__bottom-bar__ .left { display: flex; align-items: center; font-size: 15px; white-space: nowrap; } .__bottom-bar__ .right { display: flex; } .__bottom-bar__ .sns_opr_btn { display: flex; align-items: center; user-select: none; background: transparent; border: 0; color: rgba(0, 0, 0, 0.9); font-size: 14px; } .__bottom-bar__ .sns_opr_btn:not(:last-child) { margin-right: 16px; } .__bottom-bar__ .sns_opr_btn > img { margin-right: 4px; }
一个全新的世界模型,终于让AI视频进入了“无限流”时代。
原创 数字生命卡兹克 数字生命卡兹克 2026-01-14 08:08 北京
昨晚夜里快12点,AI视频公司PixVerse毫无预兆的发了一个项目。
PixVerse R1,下一代实时世界生成模型。
这玩意你看文字,可能不是很好理解,我直接放一个官方的demo视频,大家的感觉应该会强一些。
上面是视频,下面是实时输入的Prompt。
整个过程,都是AI一直连续不断的生成视频,你可以在过程中用Prompt修改视频的进程,比如开头第一句Promtp,是士兵躺在雪山上,然后躺着躺着,你就输入了一个Prompt,说一只黑乌鸦飞过,飞完了以后,这个视频准备自己去做一些决策了自己去演后续的剧情了,你又有了新想法,于是,你又发了一段Prompt过去:
巡逻队发现了士兵。
每次你输入Prompt延迟2秒左右之后,你会发现,这个世界的剧情,就随着你的不断输入,不断的进行变化。
如果你不给Prompt干涉的话,他会自己一直演下去,最长的时间,在官方的技术报告里,写的是:
无限、连续的视觉流式传输。
PixVerse将其称为,实时世界生成模型。
网址在此:https://pixverse.ai/en/blog/pixverse-r1-next-generation-real-time-world-model
项目报告我也看了一下。
还是蛮有意思的。
但是在实际给大家看这个项目之前,我觉得还是需要我们先统一一下,大家对于世界模型的定义,这样才更好去聊。
毕竟,世界模型这个词,这一两年,出现的太多了,以至于大家,好像完全不知道世界模型到底指向的是什么了。
我心中的世界模型,因为这一波23年到25年的生成式浪潮,所以其实是一个非常泛的定义:
能用一个可持续的内部状态,去预测世界接下来会怎样变化,并且能被交互和验证。
这也是为什么同一个词,经常会同时被拿来形容三类东西:
视频生成模型、可交互的生成世界、面向机器人和自动驾驶的物理仿真基础模型。
只要满足这个条件的,在目前的大众语境里,都可以被统称为,世界模型。
目前已有的世界模型代表,基本可以用几个项目,代表3个方向:
1. Google的Genie 3和Odyssey。
以Genie 3举例子。
我之前也写过文章:Google重磅上线通用世界模型Genie 3 - 此即未来。
大概就是给一个文本提示,就能生成你可以实时导航的动态世界,24fps,720p,一致性可以维持到分钟级。
我极度极度看好世界模型,之前也极度的看好Genie的项目,我曾经甚至说,没有把Genie 3写火,让很多人关注到这个项目,是我们这些做AI内容的不专业和失职。
它代表的,是一次生成,然后可以在里面操控方向进行简单交互的视频类动态世界模型。
2. 李飞飞World Labs的Marble和混元3D世界模型。
以Marble举例子。
一个以三维空间智能为中心的多模态世界模型,
World Labs给Marble的定义重点在3D,世界模型需要重建、生成、模拟三维世界,同时允许人和智能体在其中交互,这类路线的核心难点变成3D 表示和空间一致性,视频画面只是表层输出。
它代表的,是一次生成,然后可以在里面进行简单交互的3D类世界模型。
3. 英伟达Cosmos。
一个非常纯粹的,为物理AI服务的世界基础模型平台。
Cosmos的定位是面向自动驾驶、机器人、视频分析agent的WFM平台,强调数据处理、tokenizer、guardrails 和把世界模型用于高保真、物理相关的合成数据与后训练。
这条路线的评价标准更偏物理正确性、可控性、可用于训练与验证。
它代表的,是为训练具身智能和自动驾驶而生的世界模型。
这几个方向,基本就是现在世界模型方向的主流。
现在,相信大家也对世界模型,有了基本的差异化了解了,其他这玩意还是比较泛的,并没有一个特别明确的定义,路线又挺多,场景也挺多。
而这次,PixVerse的这个新的项目,为世界模型,补上了第四个方向,也是我自己过去一直期待的方向。
实时视频生成。
他们也上线了一个可以实测的demo版本可以玩。
网址在此:https://realtime.pixverse.ai/
里面已经给了6个预设的模板,感觉后面还会更新更多。
我点了一下,发现,要邀请码。
我就跑去问PixVerse的朋友,问他们为啥这年头了还要搞邀请码这事。
他们是这么说的:
不过我还是舔着老脸,深夜要了一个邀请码过来。
实际去体验了一下。
这个体验的结果,我说实话,可能是我最近,体验的最快乐的产品了。
你们看完就知道,为啥快乐了。。。
拿到邀请码进去以后,我先随手点了最后一个那个卡通的模板。
在页面上,你就会发现,有一个倒计时,大概意思就是,你只能在这个live里,体验五分钟,体验五分钟之后,就得新起一个窗口重来了。
核心原因,还是这玩意太烧算力了。
我点了进去。
一进去,这魔性的音乐,噔噔噔噔噔的,差点给我洗脑了。。。
然后,一双脚,就开始瞪着跑起来了。
我一定要给你们看看这个抽象的画面,我真的,凌晨2点多,在家里笑的嘎嘎的。
说实话,我硬生生看着小人跑了2分钟,我愣是一句话没发出去。。。
因为实在是太欢乐了,我就一直看着它跑,跑着跑着2分钟过去了,我都忘了我是可以随时更改剧情的。。。
然后,我又点开了他们那个1944的模板,疯狂的开始互动,这一次,我在家里笑出了猪叫,特别是最后,我让它从黑洞中穿梭,尽头是卡皮巴拉的时候。
我感觉我的大脑褶皱都抚平了。
真的,非常坦率的讲,PixVerse R1作为一个实验性的全新物种,在生成质量上,肯定还是有很强的进步空间的。
但是,作为一个全新的物种,它的实时生成,他的随时可交互。
这个快乐,如果不亲身体验一下的话,你是绝对感受不到的。
那是一种,你完全未知的快乐,但是你就是期待着,下一秒,他会发生什么。
你就是会期待着,你的那句话,会对这个屏幕里的小人,产生什么样的影响。
还有这个赛博朋克,也很好玩。
真的,我们看了太多太多套路话的故事,那种千篇一律没有新意的故事,这种实时生成的AI,由AI所造出的世界。
好像,会更让我惊喜,会更让我期待。
更别提,我还能用嘴,来指挥后续的动作了。
这里我强烈建议大家使用这个语音模式。
相信我,你在玩的时候的卡点,可能是是打字速度跟不上你想要的剧情速度。
除了这些预设好的模板之外。
你当然,也可以去自定义。
第一个想到的demo,其实就是一个我还满喜欢的游戏,无人深空,因为这个游戏,跟实时生成实在太契合了。
我直接直接发了个起始Prompt过去:
这是一个正在运行的科幻探索类游戏画面,不是被摄像机拍摄的影像。 ``画面以稳定的游戏视角呈现,不存在摄影机跟随、推拉或电影化运镜。世界由程序生成并持续运行,角色只是世界中的一部分,画面变化来自世界状态的演化。
然后,这个探索,就开始了。
非常的酷非常的有意思。
还有,街霸PK。
真的,太好玩了。
好久没有用AI,这么纯粹的快乐了。
我非常开心,能见到我们未来的娱乐形态,可能又会多一种非常好玩的方式。
也许再过几年,所谓的电影、综艺、游戏,根本就不再是固定时长的文件,而是一条条永远流动着的世界时间线。
创作者给一个起点,给一些世界观设定,剩下的交给世界模型自己往前长,观众进来以后,用一句话、一个表情、一次选择,把剧情轻轻拽偏一点。
所有人看到的,都是同一个宇宙,但却是不同的一条时间支线。
虽然让人人创造内容,是一种奢望。
但,在人的本源里,我觉得,每个人还是享受,创造的乐趣的。
这一天。
可能是AI模型历史上,会标红的一页。
很新,很有趣,但同时。
也很未来。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:卡兹克
>/ 投稿或爆料,请联系邮箱:wzglyay@virxact.com
数字生命卡兹克
 阅读 赞  分享 ‘%3E %3Cg transform=‘translate(0 -2.349)‘%3E %3Cpath d=‘M0 2.349h24v24H0z’/%3E %3Cpath fill=‘%23576B95’ d=‘M16.45 7.68c-.954 0-1.94.362-2.77 1.113l-1.676 1.676-1.853-1.838a3.787 3.787 0 0 0-2.63-.971 3.785 3.785 0 0 0-2.596 1.112 3.786 3.786 0 0 0-1.113 2.687c0 .97.368 1.938 1.105 2.679l7.082 6.527 7.226-6.678a3.787 3.787 0 0 0 .962-2.618 3.785 3.785 0 0 0-1.112-2.597A3.687 3.687 0 0 0 16.45 7.68zm3.473.243a4.985 4.985 0 0 1 1.464 3.418 4.98 4.98 0 0 1-1.29 3.47l-.017.02-7.47 6.903a.9.9 0 0 1-1.22 0l-7.305-6.73-.008-.01a4.986 4.986 0 0 1-1.465-3.535c0-1.279.488-2.56 1.465-3.536A4.985 4.985 0 0 1 7.494 6.46c1.24-.029 2.49.4 3.472 1.29l.01.01L12 8.774l.851-.85.01-.01c1.046-.951 2.322-1.434 3.59-1.434 1.273 0 2.52.49 3.472 1.442z’/%3E %3C/g%3E %3C/g%3E %3C/g%3E%3C/svg%3E) 推荐 ’ fill=‘%23000’ fill-opacity=’.9’/%3E%3C/svg%3E) 留言