SD全新开源模型SDXL1.0评测 - 留给Midjourney的时间不多了

原创 数字生命卡兹克 数字生命卡兹克 2023-07-30 17:58 天津

原文地址: https://mp.weixin.qq.com/s/PcI5BGWeNSU7QJrEqhPDBA

互动数据

  • 阅读:3241
  • 点赞:52
  • 转发:20
  • 喜欢:16
  • 留言:4

在AI绘图上,一直有两个阵营。

一派是以开源为首的StableDiffusion,一派是以封闭为首的Midjourney。

在过去,基于SD的生态蓬勃发展,出现了N多优秀的大模型,比如我经常极力推崇的MajicMIX还有GhostMIX等等。

但是这些大模型无一例外,都是特定画风或者特定场景的。从来没有那种比肩MJ5.2或者Niji5质量的通用大模型。

直到前几天,stability开源了他们的SDXL1.0,SD阵营在这一块的短板,终于被彻底补齐。

所有的SD玩家都特么的可以自豪的说一句:

劳资也有通用大模型啦!MJ吔屎啦你!

然而最值得期待的,并不是SDXL本身。

而是未来基于SDXL而发展起来的生态。

现有的C站、Liblib上的模型,基本都是基于SD1.5这个通用大模型微调来的。

**通用大模型本身就是一个妹子的底子,而微调就是画一层妆。
**

SD1.5这个1分妹子,经过化妆后,都有将近7分的实力。

那SDXL1.0这个本身就已经5~6分的妹子,化完妆后,有多牛逼?这个想象空间太大了。

像赫赫有名的DreamShaper,已经第一时间推出了基于SDXL1.0的微调版本。

我认识的几个挺有名的大模型作者,也已经开始在加班加点的做SDXL1.0的微调适配工作,未来一周内,可能就会有大量的超级模型出现。

但是有一说一,现阶段的原生SDXL1.0,离MJ还是有一些距离。

放一些随手生成的对比图。

prompt是完全一模一样,毕竟SDXL1.0现在对于长语义也有非常好的理解了,但是尺寸用的是SDXL1.0效果最好的1024*1024。

可以看到,在一些超写实或者真是场景中,SDXL能跟MJ V5.2打的有来有回了,但是在审美上…个人觉得还是有很多差距,stability的审美真的就是那种很直男…

就比如这张,樱花落在北极熊身上…这构图、这光影、这色彩对比…

SDXL的简直不忍直视。

不过审美这玩意本身也不是stability这公司的强项,审美的东西还是让广大网友来微调吧…

至于在插画、3D等领域,SDXL1.0跟MJ的Niji5比,那就稍微有点欺负SDXL1.0了。。。

目前还属于被摁在地上爆锤的情况。但是未来可期,毕竟网友人才多啊。。。

说下目前SDXL的用法。

现在有两种,一种是官方的在线SDXL,一种是老规矩的本地SD。

有心的会留意到我上面的所有图片都有个Cilpdrop的水印。

之前有一期给大家推荐过Clipdrop:用AI一键抹除照片里的人物还原场景 - 极致体验,这是stability的官方网站,集成了很多他们自己开发的应用。

网址:https://clipdrop.co/

第一个工具就是SDXL1.0的在线版,直接手写prompt就可以,下面三个选项可以选择风格、尺寸,以及写负面提示词。

生成完的推荐大家去增强一下,提高分辨率。

目前每天可以带水印的跑400张免费图片。

如果你觉得水印麻烦,也可以使用哩布哩布的在线SD,目前每天也可以免费100张。

他们也第一时间支持了SDXL1.0,记住,如果你使用SDXL1.0,下面那个XL Refiner选项必须勾选!!!

然后就是我们最常用的本地SD安装了。

需要下载3个模型,我已经全部打包好放到了网盘里,私信SDXL就有了。

其中有两个大模型,base和refiner,一个VAE。

打开秋叶大佬的SD启动器,把版本更新到1.5.1,然后正常装模型和VAE就行。

SDXL1.0的工作流和以前的流程不太一样,**需要先使用base做一遍文生图,而且尺寸必须是1024*1024。生成完的图片再发送到图生图,切换到refiner模型再跑一遍。**这样才能得到最好的效果。

这块我提醒一句,SDXL对配置要求非常高,大概需要32G以上的内存和12G以上的显存。

我自己的电脑是16G内存,3060显卡。即使加了30G虚拟内存,SDXL1.0一运行必爆。

没有这个配置的,不用下模型了,直接Clipdrop或者liblib吧。

同时,现在的SDXL1.0因为刚出来,所以生态非常不完善,不支持SD1.5基础的所有LoRA,也不支持ControlNET。

我不太建议大家现在直接在本地跑,线上用用试试就得了。

等2~3周,生态、插件、体验完善,再开整也不迟。

写在最后。

SDXL1.0是SD的一次反击。

SD从来不是靠通用大模型的质量去取胜,他靠的是生态,是百万开发者基于SD之上而构建起的超级生态帝国。

以前的SD1.5,本身质量太差,但是在这种质量的模型上,居然都演化出了N多能跟Midjourney掰掰手腕的大模型们。

而现在质量提高了无数数量级后的SDXL1.0,基于它之上的生态上限,无法想象未来有多么辉煌。

留给Midjourney的时间,确实不多了。

AI绘图行业的格局,也该变天了。