赞
踩
在我们的团队项目中,我们最初的设想是通过拍摄实物照片生成商品海报。然而,由于效果不佳,我们决定转变思路,开发一款帮助设计师从线稿到3D模型的设计产品。我们的目标是简化设计流程,让设计师能够从线稿出发,通过AI技术生成成品图像,并进一步转化为3D模型。以下是我们在这一过程中经历的探索、尝试和反思。
新的设想是利用AI技术,通过输入设计师的线稿,生成多幅成品图像。然后,设计师可以从这些生成的图像中选择一幅最满意的,再通过3D建模工具将其转换为3D模型。这一过程的核心步骤包括:
在从线稿生成成品图像方面,我们决定使用Stable Diffusion。这是一种基于扩散过程的图像生成模型,通过逐步去噪生成高质量的图像。我们选择Stable Diffusion是因为它在这一任务中的表现非常出色,生成的图像在细节和质量上都非常优异,因此我们没有调研其他模型。其基本原理在上一篇文章中已经简要概括,此处不再赘述。
在将成品图像转换为3D模型方面,我们进行了广泛的调研和测试,包括以下几种模型:Wonder3D、Image Dream、MVDream-three studio、HiFA、GeoDream、3DFuse-three studio和Gaussian Dreamer。
Image Dream是一种图像生成工具,可以将线稿转换为成品图像。然而,在我们尝试过程中,生成的图像质量和细节不如Stable Diffusion,且风格化处理过于明显,影响了原始设计的表达。
扩散网络训练:
NeRF模型训练:
多控制器
多级控制器是指在ImageDream系统中,用于处理和调节图像特征的多个控制器。这些控制器包括全球控制器、局部控制器和像素控制器。每个控制器在不同的层级上对图像特征进行处理,以实现更精细的控制和更高的生成质量。
全球控制器(Global Controller):
局部控制器(Local Controller):
像素控制器(Pixel Controller):
多级控制器通过在不同层级上对图像特征进行处理和调节,确保生成的图像既具有全局一致性,又包含丰富的局部细节和高分辨率的像素级信息。这种多层次的控制机制使得ImageDream能够生成高质量的3D模型,并在各种视角和细节层面上表现出色。
全球控制器和局部控制器:
像素控制器:
效果
MVDream-three studio专注于多视角图像生成和3D建模,是ImageDream的基础,其功能是从文字生成3D模型,不符合我们的目的,此处不再赘述。
Wonder3D 能够根据单张图像生成一致的多视图法线图和彩色图像。具体过程如下:
在这些条件下,Wonder3D 生成一致的多视图法线图和彩色图像。随后,Wonder3D 采用创新的法线融合算法,从2D表示中稳健地重建高质量的3D几何形状,最终生成高保真度的纹理网格模型。
效果
TripoSR是一种用于生成高分辨率3D模型的工具。虽然在生成模型的正面效果尚可,但在处理模型的其他面时,效果非常糟糕,导致整体模型质量不佳。TripoSR的技术原理基于超级分辨率算法,试图通过提高图像分辨率来改善3D模型的细节。然而,我们发现其在生成全面和一致的3D模型方面存在显著不足。
效果
尝试
输入图片
输出模型
HiFA(High Fidelity Augmentation)是一种高保真度的图像到3D模型转换工具。经过多次测试,我们发现HiFA在保持原始图像细节和精度方面表现最佳,能够将设计师选定的成品图像高质量地转换为3D模型。
预训练的2D潜变量扩散先验:
评分蒸馏:
效果
尝试
这些模型在发布开源的年份相似,基本都是去年发布的。尽管它们在某些示例模型上表现良好,但在将随机图片转换为3D模型时表现很差。这些模型存在以下共性问题:
Image Dream 是字节跳动新开源的模型,尽管其生成效果较好,但也存在一些问题:
在我们测试的模型中,HiFA 的表现是最好的,但仍有改进空间:
我们最终确定了以下方案:
在这一探索过程中,我们经历了从初步设想到推翻重来的过程。通过对多种AI工具的调研和测试,我们最终选择了Stable Diffusion和HiFA的组合。这一组合不仅简化了设计流程,还大大提高了生成图像和3D模型的质量。未来,我们希望能进一步优化这一流程,为设计师提供更高效、更便捷的设计工具。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。