视频生成框架EasyAnimate正式开源！

作者：天景科技苑 | 2024-08-05 19:47:56

踩

easyanimate

近期，Sora模型的热度持续上涨，社区中涌现了一些类Sora的开源项目，这些项目均基于Diffusion Transformer结构，使用Transformer结构取代了UNet作为扩散模型的基线，旨在生成更长、更高分辨率、且效果更好的视频。EasyAnimate是阿里云人工智能平台PAI自主研发的DiT-based视频生成框架，它提供了完整的高清长视频生成解决方案，包括视频数据预处理、VAE训练、DiT训练、模型推理和模型评测等。在预训练模型的基础上，EasyAnimate可通过少量图片的LoRA微调来改变生成视频的风格，相比已有方案具有更好的扩展性和完整性。EasyAnimate在人工智能平台PAI上进行了集成，供用户一键训练和部署，其支持以下功能：

最大分辨率768x768，最长144帧的视频推理（512x512分辨率可在A10 24G上推理）
DiT 基线模型的训练
DiT LoRA模型的训练（512x512分辨率可在A10 24G上训练图片Lora）
VAE模型的训练和推理
视频预处理

用户可以使用EasyAnimate来进行任意风格视频模型的训练和推理。目前，EasyAnimate项目仍处在初期，并将持续优化来达到更好的生成效果，欢迎大家持续关注～开源地址：https://www.wpsshop.cn/w/天景科技苑/article/detail/933945