中国版Sora震撼登场，原生16秒直出超清视频！国产黑马火了，世界模型签约多个大客户-奇宝库

新智元报道

编辑：编辑部

【新智元导读】近来，国产AI视频模型强大生成能力震惊了国外网友。刚刚，中国首个超长时长、高性价比、端侧可用的Sora级视频模型诞生了，由国产黑马联手清华打造。与别家出发点不同之处在于，这是为了实现世界模型而创建的AI视频模型。

Sora爆火之后，视频生成领域不断迎来新的进展，视频的时代正在开启！

近日，在奇绩创坛路演日上，世界模型公司「极佳科技」联合清华大学自动化系正式发布中国首个超长时长、高性价比、端侧可用的Sora级视频生成大模型「视界一粟 YiSu」，引起社会各界广泛的反响和关注。

模型原生16秒，超长时长，超大运动，超强表现力

概括来说，「视界一粟 YiSu」的特点如下：

- 拥有模型原生的16秒超长时长，并可生成至1分钟以上；

- 同时还拥有超大运动、超强表现力、懂物理世界等众多优势；

- 更重要的是，YiSu模型成本更低、速度更快、端侧可用。

基于此，团队希望通过YiSu模型强大的性能和极致的性价比，更快实现长视频生成的大规模产品应用。

不止步于DiT，自研的视频生成技术路线

年初Sora的爆火，让DiT受到了业内极大的关注，很多公司和项目也开始复现DiT路线。

极佳科技和清华大学研究人员在视频生成技术路线上有着深入的积累和独特的理解，在autoregressive、Masked Token、DiT、UNet等不同路线方面均拥有丰富的经验。

此前，团队提出WorldDreamer，是全球第一次以Transformer和LLM为中心的视频生成工作。

项目地址：https://world-dreamer.github.io/

「视界一粟 YiSu」基于团队自研的视频生成大模型技术，并没有止步于DiT，而是融合LLM和扩散模型的自研架构，结合各种路线的优势，在多模态融合、训练效率、推理效率、模型效果等方面达到极致的优化，打造视频生成的最佳方案。

这家公司有点独特，可能和市面上视频生成公司的出发点都不一样！

「我们做视频生成是为了实现世界模型」，极佳科技创始人&CEO黄冠博士表示。

被问及做视频生成的出发点？

黄冠博士表示：「我们可能和市面上目前所有做视频生成公司的出发点都不一样。」

「我们公司在成立之初就意识到，自动驾驶、通用机器人等物理世界通用智能的核心瓶颈是数据问题，而随着生成式AI、大语言模型等技术的突破，我们很早就看到数据最好的来源就是世界模型。同时，我们也很快意识到，世界模型的核心是视频生成。」

「所以，基本从去年9月份开始，发布了全球首个真实世界驱动的自动驾驶世界模型工作DriveDreamer之后，我们基本就把视频生成和世界模型的底层架构统一了，通过视频生成走向通用世界模型，加速走向通用智能。」

未来更重要的事情是「世界模型」！

世界模型通过对未来的预测来增加对世界的理解能力，对于自动驾驶、机器人、具身智能等方向的发展拥有至关重要的作用。

具体而言，世界模型在数据生成、闭环仿真、端到端方案等方向都具有重要的价值。