当前位置:   article > 正文

颠覆AI视频生成!秒出4K高清大片!Gen-2迎来"iPhone时刻"般的史诗级更新!

人工智能生成超高清视频内容

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【扩散模型和Transformer】交流群

在CVer微信公众号后台回复:视频生成,可以下载"视频生成"最全学习资料,学起来!

金磊 克雷西 发自 凹非寺
转载自:量子位(QbitAI)

这,绝对称得上是生成式AI进程中的里程碑。

就在深夜,Runway家标志性的AI视频生成工具Gen-2,迎来了“iPhone时刻”般的史诗级更新——

依旧是简单一句话输入,不过这一次,视频效果一口气拉到了4K超逼真的高度!

话不多说,我们直接来看炸裂的效果:

不难看出,这一次AI生成视频的效果已经克服了以往“一眼AI”的缺点,即不连贯、闪烁变形以及低清等等。

而这也正是Gen-2这次史诗级更新的内容重点:

在文生视频和图生视频中,为结果的保真度一致性带来了重大改进。

66b04b433f627f802edb422d7bad3d90.png

虽然Runway在官方说法中只是轻描淡写地描述为“发布了一项更新”,但在许多网友看来,这堪比一个大版本的迭代。

0bec79e60d5d9a05e71d58d989e9e260.png

很多人在看到视频效果之后,已然是处于沸腾、燃爆的状态。

例如一位人工智能电影制作人将其称之为“彻底改变游戏规则”

00b0a4b273404bafbd60ad0636d08f9e.png

另一位生成式AI专家也认为:

这是生成式AI的关键时刻。

b7c9aa1ea04f58602c484cdb0d6c9503.png

要知道,现在距离Gen-2正式发布也仅仅过了4个月(今年6月)而已,这不得不让人感慨AI进步、迭代的速度。

正如公众号“数字生命卡兹克”给出的评价:

人间一天,AI一年。

值得一提的是,Gen-2此次的重磅更新,是在网站和APP上同步进行的。

那么接下来,我们继续深入体验一下新Gen-2的炸裂效果。

扫码加入CVer知识星球可以最快学习到最新顶会顶刊上的论文idea和CV从入门到精通资料,以及最前沿项目和应用想发论文看过来!

09f23b598e9402e3b340f104cb4e6034.jpeg

0成本生成超级大片

现在,无论你是在网站或是APP上体验,只要用的是Gen-2,那么生成视频的结果,就是基于它最新的能力。

这不,一位网友就火速拿着Gen-2,配上小曲儿,秒生成了一部高级感满满的时尚广告大片

这颜色,这模特,这角度,广告大片算是被Gen-2稳稳拿捏住了。

还有下面这种高级MV镜头既视感的视频,也是不在话下:

dbd276473e35d681197cd072f688aadb.gif

再如这种脑洞大开、创意十足的科幻电影片段

bee802c7c8fb683d27cef69639474c47.gif

讲真,当看到这些Gen-2生成的逼真4K视频,我们也是被狠狠地吸引住了。

于是乎,我们也决定亲自体验一把。

操作上可以说是极其的简单,进入Runway官网,点击“Text to Video”,再选择“Gen-2”,便可来到文本输入界面:

199d6e5974cb83f5a5c8e56aab37fdc7.png

我们测试的文本内容是这样的:

Interstellar travel,surreal.
星际旅行,超现实主义。

在静候几秒之后,AI视频就出炉了:、

357bf539f17c4e045b1eaa382ab9d124.gif

有一说一,其实Gen-2的结果跟我们原本在脑海中的设想是有些出入(以为会是宇宙星空背景的星舰)的。

但无论是场景亦或是飞船的样式,都给人一种耳目一新、别出心裁的感觉。

这对于创意工作者来说可谓是一种福利了,灵感枯竭的时候,不妨让Gen-2帮你想想。

而在图生视频(Image to Video)能力上,有网友拿着PIKA这位AI生成视频顶流,跟Gen-2做了一番比较。

186eaedc60248063490ae245fda645fc.gif

从整体结果上来看,Gen-2目前无论是在画质的清晰度,视频的流畅度等方面,都是更胜一筹。

BTW,手机体验最新Gen-2也是相当方便的哦~

b6c8cfaa5123c36929f0ea024d819330.jpeg

半年彻底改写游戏规则

本次里程碑式更新,虽然没有带来新的功能,但在真实性和一致性上的飞跃,使得最新版本的Gen-2依旧是一款划时代的产品。

虽然Gen-2的有关论文还是coming soon,但可以确定它是在Gen-1的基础模型之上改进得到的。

ba20099c49c126b1e25ff647a2621ae2.png

相比于传统的文本控制扩散模型,Gen通过文本、图像、视频混合的训练模式,提高了生成视频的质量和一致性,同时还降低了训练消耗。

同时,Runway还提出了延时扩散模型,在预训练的扩散模型中引入时序层,使得模型在推理阶段具有更高的时间一致性。

Runway在宣传片中用三组对比展示了Gen-2的这种显著变化。

e18316ab54375e7f3afcbe992363fafc.gif

尽管官方还未给出具体的测试数据,但Gen-1的用户偏好在Runway的一项用户调查中就已经击败了Stable Diffusion 1.5和Text2Live。

0c534764b303032f727f81d2858558a5.png

Gen-2是于今年3月开始测试,6月正式向公众发布的。

与Gen-1不同的是,前者通过现有的视频片段结合文字指导进行合成,而Gen-2则可以只用文字、图片或两者结合来生成。

57ec4e5dd384cc8a66001c4a0c78124c.png

此外,Gen-1中的风格变换、蒙版、模型定制等功能也在Gen-2中得到了保留。

934e87db46671ee0d75874c930b83ce0.png

发布半年以来,Gen-2已经经历了多次更新。

8月,Runway将Gen-2生成视频的最大长度从4秒提升到了18秒,这样的长度在AI视频生成工具中前所未有。

9月,Runway又官宣Gen-2新增了导演模式,可以控制“镜头”的位置和移动速度。

857a40985a859d9e271983deb7bda21d.png

此后不久,Gen-2又新增了“Motion Slider”的功能,可以调节视频中的动作幅度。

72e6099664c5521d7b957dbfc080a67d.png

这几次大大小小的更新,让这款视频生成工具走向顶流,最终震撼了整个行业。

创始人:创意软件已死

随着Gen-2的更新,对影视和创意行业带来了不小的冲击。

Runway创始人兼CEO Cristóbal Valenzuela更是在中表示,“创意软件已死”

5079117c0d9d0e7ff3c24f6c17e55fec.png

Valenzuela进一步解释到,尽管过去人们可以手工“操纵像素”,但人工智能创作工具可以让人们只用自然语言和参数调节就完成创作,这是传统的(创意)软件无法做到的。

最后,Valenzuela再次强调,一个激动人心的新(创意)时代就要开始了。

6b042deea2b4217fce1e210c1eb232e1.png

在Valenzuela的这篇帖子中,有很多网友表示了赞同,直言这些模型现在就画笔。

397ddcae6a23fd639e34c59fa09269b0.png

而这位创作者虽然没有直接夸赞,但回忆起了以往每次花六个月制作视频的经历,仿佛一切尽在不言之中……

ef9f908d12ca6d98a4388fc19054514c.png

最后,体验地址放下面了,感兴趣的小伙伴们快去尝试吧~

Gen-2体验地址:
https://research.runwayml.com/gen2

参考链接:
[1]https://twitter.com/runwayml/status/1720064304374792615?s=20
[2]https://twitter.com/hashtag/Gen2
[3]https://venturebeat.com/ai/runways-gen-2-update-is-blowing-peoples-minds-with-incredible-ai-video/
[4]https://mp.weixin.qq.com/s/jwKtx-wpSVVvAxhUTMXQBw

点击进入—>【扩散模型和Transformer】交流群

ICCV / CVPR 2023论文和代码下载

 
 

后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:ICCV2023,即可下载ICCV 2023论文和代码开源的论文合集
  1. 扩散模型和Transformer交流群成立
  2. 扫描下方二维码,或者添加微信:CVer444,即可添加CVer小助手微信,便可申请加入CVer-扩散模型或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。
  3. 一定要备注:研究方向+地点+学校/公司+昵称(如扩散模型或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

 
 
  1. ▲扫码或加微信号: CVer444,进交流群
  2. CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集近万人!
  3. ▲扫码加入星球学习
 
 
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看f7366ef67b65d7dc4f2266e6f4e1a397.gif
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/一键难忘520/article/detail/943687
推荐阅读
相关标签
  

闽ICP备14008679号