ai炼丹软件凡人修仙路：AI绘画篇（Chapter 03）——炼丹卷（初级炼丹术01）

默认分类1年前 (2023)发布 admin

2,033 0 0

我的炼丹炉是 webUI人工智能绘画框架（简称）。

感谢开源社区无私的贡献在每一个无产阶级兄弟的心中播下了社会主义的种子。

感谢 webUI人工智能绘画框架的作者给我们分享了他的智慧。

让资本家们控制AI机器人的战略规划又一次遭到了致命的打击。

整个凡人修仙路——AI绘画篇由：

炼丹卷（初级炼丹术、中级炼丹术、高级炼丹术），铸炉卷，咒语卷三卷组成。

的人机交互是采用的NLP，自然语言处理技术，通过输入单词、词语或者句子来生成图片。

封装的NLP模块是使用的..us。

它是框架神经网络的重要训练来源。

占了绝大多数的关键词（超过80%）的tag都是来源于此。

真正的修真者必然是一位英语较好（不要求英语的听、说、写）。

至少具备能阅读并理解相关英语论文技能的人。

一位大炼丹师，必然能熟练运用英语中的各类生动表达方式。

能够理解一些场景专业术语与服装术语。

能够直接应用合规的英文单词进行大段叙述描写。

所以修仙的基础就是英语，学好英语是每一位修真者的必修课。

I ——

在我们搭建完了炼丹炉之后，就要开始第一次炼丹了。

在开始炼丹之前，我们要对我们的炼丹炉做一次全方位的优化。

AI的发展现在基本是每周一次小更新，半个月一次大更新。

所以第一件事就是拿到最新的炼丹法门。

一般而言一个月前发布的软件框架版本已经过保质期，没有安装的价值。

一名真正的修真者必然会追求事物的圆融，思想的通达。

我们的炼丹炉能用4090显卡，肯定不会上4080显卡。

如果你采用的是单独安装框架和依赖的话，需要安装最新的、和cuda版本。

进入目录命令行，或者激活虚拟环境，升级代码如下：

python -m pip install -U -I --no-deps https://github.com/C43H66N12O12S2/stable-diffusion-webui/releases/download/f/xformers-0.0.14.dev0-cp310-cp310-win_amd64.whl

python -m pip install torch==1.13.0+cu117 torchvision==0.14.0+cu117 --extra-index-url https://download.pytorch.org/whl/cu117

如果你采用的是一键安装版本，那么需要手动更新cudnn，下载链接如下：

将下载的cudnn文件替换一键安装版中目录：Libsite-torchlib下的文件。

优化前4090出图速度和3090差不多，优化后4090的出图速度比3090快400%左右。

II ——

在中输入我们的炼丹咒语就能让我们的AI开始炼丹，炼出我们的第一副作品了。

首先我们要对AI框架做基础的设置。

在中的 /grids，选择：

在中的，选择：

在中的User ，选择：

在中的，选择：

接下来就是构建我们的第一张图片。

ai炼丹软件凡人修仙路：AI绘画篇（Chapter 03）——炼丹卷（初级炼丹术01）

来到页面，分为：

区域（文生图）

分为（正面咒语）和（反面咒语）。

顾名思义，正面咒语就是我们的出图要包含的内容，反面咒语就是我们的出图不包含什么内容。

这里我介绍一下我的通用基础咒语，大家可以拿去作为自己的通用咒语使用。

咒语起手式， tag：

masterpiece, best quality, extremely-detailed, illustration, extremely detailed 8K wallpaper,

咒语起手式， tag：

bad hands, missing fingers, cropped legs, worst quality, low quality, normal quality, jpeg artifacts, blurry,missing fingers,bad hands,missing arms, long neck, Humpbacked,multiple breasts, mutated hands and fingers, long body, mutation, poorly drawn , bad anatomy,bad shadow,unnatural body, fused breasts, bad breasts, more than one person,wings on halo,small wings, 2girls, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,

如果对画面的手部有精细化要求的话，推荐手部 tag：

missing fingers, fused fingers, one hand with more than 5 fingers, one hand with less than 5 fingers, fused digit, missing digit, (bad digit:1.2), (liquid digit:1.2), (extra-long digit:1.2),

这里我们学习我们的第一个禁咒，手指禁咒 tag：

(poorly drawn hands),more than 1 left_hand, more than 1 right_hand, short_arm, (missing arms:1.2), bad_hands,missing fingers,(extradigit),(fewer digits),mutated hands,(fused fingers),(too many fingers),sharp fingers,wrong figernails,long hand,double middle finger,index fingers together,missing indexfinger,interlocked fingers,pieck fingers,sharp fingernails,(steepled fingers),x fingers,(curled fingers),(no finger gaps),interlocked fingers,fingers different thickness,cross fingers,poor outline,big fingers,finger growth,outline on body,outline on hair,out line on background,more than one hands,fuse arm,fuse elbow,more than two arm,more than two elbow

禁咒一般对系统的运行速度有影响，如果通用咒语能满足出图要求时尽量不要使用。

禁咒一般建议出高分辨率绘图时使用。

Steps（出图调参）

1）

这里是AI出图的算法选择。

一般而言，这里的算法根据全球AI的发展速度，平均每周会有新的算法更新。

对于初级炼丹师来说，一般采用Euler a和DDIM算法。

其中Euler a是非线性迭代算法。

它的结果并不会因为迭代增加而无休止地变得更加优秀。

在大于一定的迭代值之后反而质量会快速下滑。

DDIM是线性迭代算法。

质量往往依托于迭代的次数。

但也存在边际效应的问题。

当迭代大于一定程度时，再增加迭代次数也不会让画面产生显著变化。

一般而言初级炼丹师炼丹时建议采用Euler a或者DDIM算法。

2） Steps

Steps可以选择25-40之间，我一般用32。

当出草图时可以选择25。

选择了一些主流算法在各个step迭代步数出图的效果进行展示。

其中横坐标是算法，包括了Euler a、DDIM、DPM2 a，DPM2 a ，LMS，PLMS。

纵坐标是step迭代步数，分别是：5、10、15、20、25、30、40、50、90、150、200、250、300、400、500步下迭代的出图效果，如下图所示：

3）

Width是图片宽度像素，是图片高度像素。

一般而言，出草图时采用512*256左右的分辨率出图。

正式出图采用1024*512左右的分辨率出图。

高分辨率出图在正式图的基础上可以通过的算法做分辨率的放大工作。

ai炼丹软件凡人修仙路：AI绘画篇（Chapter 03）——炼丹卷（初级炼丹术01）

最大支持4*分辨率的放大，即4096*2048的分辨率出图。

放大算法建议采用R-。

4）CFG Scale

CFG是出图结构相似、内容连续变化参数。

它告诉模型应该遵循到什么程度。

0: 放飞自我，会出完全和提示词无关的图。

30: 循规蹈矩, 即过拟合。

可以理解成: 乙方听甲方的话有多认真/多死板。

我一般的参数范围在：7.5-11.5之间。

5）

训练集模型库的选用，一般默认的二次元训练集模型库有：

final-、、等。

三次元训练集模型库有官方模型：

V1.5、等。

作为二次元的忠实拥戴，非特殊说明，教程中均采用上述3个二次元训练集模型库。

6）

faces、、. fix一般情况下我们不勾选。

Batch count是出图的批次，Batch size是一批出图同时出几张图。

出草图时按照Batch count：1，Batch size：1出图即可。

我一般的设置是9宫格出图按照Batch count：3，Batch size：3的设置来出图。

seed是图片种子，主要用来控制画风和出图稳定性。

Open for Clip !的选项属于中级炼丹术中的内容。

请参考我后续的中级炼丹术的内容。

III —— your first img

以克罗索为例，她的基础构建咒语如下：

：

masterpiece, best quality, extremely-detailed, illustration, extremely detailed 8K wallpaper,

1girl, (solo:1.5), petite, aqua eyes, aqua hair,asymmetrical bangs, hair behind ear, hair over one eyebrow, braided bangs, rinka haircut, small breasts,

：

bad hands, missing fingers, cropped legs, worst quality, low quality, normal quality, jpeg artifacts, blurry,missing fingers,bad hands,missing arms, long neck, Humpbacked,multiple breasts, mutated hands and fingers, long body, mutation, poorly drawn , bad anatomy,bad shadow,unnatural body, fused breasts, bad breasts, more than one person,wings on halo,small wings, 2girls, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,

我们对如下参数进行设置：

Width：512，：1024

Steps：32

：Euler a

Batch count：3，Batch size：3（九宫图设置）

CFG Scale：7.5

点击，AI会画出我们的克罗索，九宫图出图如下：

[1]

[2] web UI .md

[3] 元素同典：确实不完全科学的魔导书，CoQ: A of (Non)，元素法典制作委员会

[4] 元素法典，The Code of ，、，元素法典制作委员会