ai会绘画软件 【AI绘画软件】invokeAI——这个精致的WebUI工具一键开箱包

默认分类1年前 (2024)发布 admin
3,031 0
ChatGPT国内版

如果你觉得有帮助,请帮忙点个【在看】,分享给有需要的好友吧!

「 无套路!文末提供下载方式 」

当AI绘画模型和平台越来越多,你是否想使用统一美观的界面来使用你所有的AI绘画模型?

——这个精致的WebUI工具可以帮助你创建一个统一美观的工作环境

#简介及原理

自 模型发布以来,一组人(从开始)一直致力于将生成高质量图像的最佳工具汇集到单个易于使用的存储库中。2022 年9月, 团队正式成立。

.Ai是一个创新的文本到图像AI平台软件,它利用尖端的深度学习模型将文本描述转换为具有视觉吸引力的图像。

通过向 .Ai 提供特定提示,用户可以生成与他们想要的概念、场景或对象相对应的独特且高质量的图像。这项革命性技术为艺术家、设计师、内容创作者和任何需要迷人视觉效果的人开启了激动人心的可能性。

#推荐理由

只是一个目前完全免费且开源的可视化绘图工具,它提供一个AI绘画的基本框架、插件接口和UI界面,具体的绘制模型和lora模型等还需要下载和导入。已经加入了、lora、动态提示词等功能,极大的提高了绘画结果的可控性、稳定性和必要时的随机性(比如想抽卡生存随机的图片时)对比类似功能的WebUI,有着更简单上手,部署条件更简单,学习成本更低的优点,并且随着开发者的更新的功能也已经逐渐追上了WebUI的步伐,如果需要安装插件或者导入新的文转图训练、模型、lora、vae等,也在操作页面有很方便快捷的可视化添加方式。支持SDXL 1.0,该模型拥有更多的参数,并且对色彩的鲜艳和准确程度做了优化,全部采用原生的 分辨率(之前只有 )。新模型只需更简单的语言就能生成更智能的图片。

丨其他功能

#自动安装:以下安装比较复杂,如果不会可进群学习

先下载安装包到本地,并解压到本地。安装包支持多环境(/MacOS/Linux)

如果是 操作系统,双击 .bat 脚本安装。

如果在苹果电脑macOS系统,支持M1,M2 系统下,打开终端窗口,将 .sh 文件从 拖到终端,然后按回车键。

Linux 操作系统执行 .sh

开始安装后会询问是否安装默认路径安装(Y为按默认路径安装,N为自定义安装路径)选择完路径后会开始安装本体,本体安装完成后会进入下一步让你选择你想下载的绘画模型(如果没有出现这一步,请把CMD窗口最大化然后等一会)选择完模型后会开始下载模型,下载完成可能会遇到错误无法正常完成安装,只需要关闭窗口即可完成安装。

您运行安装程序的文件夹现在将被许多文件填满。如果您在 上,双击 .bat 文件。在macOS 上,打开终端窗口,将 .sh 从文件夹中拖到终端中,然后按回车键。Linux 操作系统执行 .sh

我只说一下比较重要的几个选项,第1个选项是用网页启动,一般无法直接启动,可先按7下载相关组件,第3个是启动图转文训练,第5个是下载其他绘图模型,第9个是检查升级,Q选项是退出。(此处为 版3.0.版本号的内容,不同版本可能顺序有所不同,具体选项可以自己对照窗口内文本翻译一下)

打开浏览器,然后转到 :9090

在左上角的框中,单击

(安装过程需要联网,部分下载内容可能无法使用国内网络下载。)

#手动安装教程

手动安装有两种方式,第一种使用基本的 虚拟环境 venv 命令和 PIP 包管理器。第二个基于 包管理器 conda。这两种方法都需要在终端上输入命令。

需注意 conda 安装方法目前已弃用,在将来的某个时候将不受支持,因此我们也不推荐你使用该方式进行安装。

在 系统上,鼓励您安装和使用 ,它提供了与 Linux 和 Mac shell 的兼容性,以及命令行补全等不错的特性。

我们主要介绍 PIP 方式的安装:

确保您使用的是 3.9 或 3.10

克隆源源源源源源源源源源代码

git clone https://github.com/invoke-ai/InvokeAI.git

在 顶级目录中,创建并激活名为 的虚拟环境

python -mvenv invokeai
source invokeai/bin/activate

确保 PIP 安装在虚拟环境中并且是最新的

python -mensurepip --upgrade
python -mpip install --upgrade pip

为您的硬件和操作系统选择正确的需求 *.txt 文件

确保 环境处于活动状态并启动 PIP

pip install --prefer-binary -r requirements.txt

设置运行时目录

运行命令行

invoke.py --root ~/Programs/invokeai

ai会绘画软件 【AI绘画软件】invokeAI——这个精致的WebUI工具一键开箱包

选择放弃,随后重新启动脚本

项目地址

https://github.com/invoke-ai/InvokeAI

一、主要功能及特点

1、功能介绍

使用界面:比较美观的使用界面,最左侧是功能栏,分为三个已有功能和三个未上线功能;旁边是调节栏,用来输入和调节参数;中间是生成的图像展示,最右侧是你最近生成的图像库:

上面的屏幕截图显示了WebUI的文本到图像选项卡。有三个主要部分:

左侧的控制面板,其中包含从文本到图像生成的各种设置。最重要的部分是用于输入正文本提示的文本字段(目前显示 , demon),正下方的另一个文本字段用于可选的负文本提示(要排除的概念),以及用于开始图像渲染过程的调用按钮。

中间的当前图像部分,显示您当前正在处理的图像的大格式版本。顶部的一系列按钮允许您以各种方式修改和操作图像。

左侧的图库部分包含您生成的图像的历史记录。这些图像被读取并写入 /.yaml 初始化文件中指定的目录,通常是 中名为 的目录。

除了这三个元素外,右上角还有一系列用于更改全局设置、报告错误和更改主题的图标。

控制面板左侧还有一系列图标(请参阅下面屏幕截图中的突出显示区域),这些图标在一系列选项卡中进行选择,以执行不同类型的操作。

从上到下,这些是:

文本到图像-从文本生成图像

图像到图像-从上传的起始图像(绘图或照片)生成一个新的图像,由文本提示进行修改

统一画布-交互式组合多个图像,用外绘扩展它们,用内绘修改图像的内部部分,擦除起始图像的部分,并让AI从文本提示符填充擦除的区域。

节点编辑器-(实验性)此面板允许您创建常见操作的管道,并将其合并到工作流程中。

模型管理器-此面板允许您使用URL、本地路径或 导入和配置新模型。

功能栏:文字生成图片:像大多数AI图像生成工具一样,输入文字并产出图片;图片生成图片:类似于垫图功能,基于上传的图片和文字生成对应的图片;画布拓展:先生成较小的图片,然后生成可以自由地拓展你的画布,将图像延展出去。在中,若硬件合适,这一功能似乎可以延展出无穷的画布。

预计推出:节点:目前正在开发基于节点的图像生成系统。请继续关注有关此惊人功能的更新。后处理:调用 AI 提供了多种后处理功能。图像放大和面部恢复已经在WebUI中可用。您可以从“文本到图像”和“图像到图像”选项卡的“高级选项”菜单访问它们。您还可以使用当前图像显示上方或查看器中的图像操作按钮直接处理图像。不久将发布专用 UI,以促进更高级的后处理工作流程。 AI 命令行界面提供了各种其他功能,包括 。训练:一个专用的工作流程,用于从 Web 界面使用文本反转和 训练您自己的嵌入和检查点。 已经支持使用主脚本使用文本反转来训练自定义嵌入。

2.自动模型安装(需梯子):

有两种方法可以安装和管理模型:

-model-脚本将为您下载并安装它们。除了支持主要模型外,您还可以安装、LoRA和文本反转模型。

Web界面(WebUI)有一个用于导入和管理模型的GUI。

通过将模型(或模型的符号链接)放置在根目录的文件夹之一中(主要方法)。

通过安装-model-

从启动器中,选择选项[5]“下载并安装模型”。这将启动相同的脚本,提示您在安装时选择模型。您可以使用它来添加您第一次跳过的模型。可以指定之前下载的模型;脚本只会确认文件是否完整。

安装程序有不同的面板,用于安装来自的主要模型、来自和其他任意网站的模型、模型、LoRA/模型和文本反转嵌入。每个部分都有一个文本框,您可以在其中输入要安装的新模型。您可以使用其参考模型:

本地机器上.ckpt、.或扩散器文件夹的本地路径

计算机上包含多个模型的目录

指向可下载模型的URL

A repo id

以前安装的型号显示有复选框。取消选中复选框以从取消注册模型。物理安装在根目录中的模型将被删除和清除(在确认警告后)。位于根目录之外的模型将被取消注册,但不会被删除。

注意:安装程序脚本使用基于控制台的文本界面,需要大量的水平和垂直空间。如果显示器看起来乱七八糟,只需放大终端窗口和/或重新启动脚本。

3.手动安装模型

请执行以下操作:

在模型网站下载需要的模型。

放到对应的路径。

刷新模型窗口,选择对应模型即可。

模型仓库

常见的模型下载仓库为以下几种,点击可直接前往仓库地址:

ai会绘画软件 【AI绘画软件】invokeAI——这个精致的WebUI工具一键开箱包

在仓库中下载所需的模型时,将会看到各种各样格式的文件。对于一般的使用者来说,仅下载常用CKPT格式模型文件即可。

模型种类1. sdxl ( XL)2. sdxl-.SD 1.5 ( 1.5)

4.SD2.1 ( 2.1)

模型存放路径

请先确定您下载的是SD1.5还是SDXL模型,在根据不同类型存放在不同位置。

1. 大模型CKPT2. 小模型VAE ( ). 是什么?

如果说模型是一大包食材,那 LoRA 可以理解为一个调料包。通过一些简单的学习,您可以批量生成想要的图案、姿势、情境等等。

比如我们想用自己的孩子做主角生成图片,那么通过制作孩子的 LoRA,就可以在 中用一个命令调用,从而获得孩子的图片。

另外,由于有许多不同的 LoRA 可供使用,因此可以轻松地尝试各种有趣的图片生成。

LoRA 有很多种类型,看起来很复杂?

,LoHa,LoRA,LoCon,(IA)^3,LoKR,等等,是什么意思!

其实这些是微调技术的分类和其算法。

LoRA、、LoCon是一些技术项目的名称。

LoCon已被合并,过去需要的扩展 LoCon 现在不再需要,只需安装 的扩展即可。LoHa,(IA)^3,LoKR,是的学习算法之一。在算法学习时指定使用。 这些基本上在使用时不需要担心,但是如果要使用和LoCon学习的LoRA,则需要注意使用专用的扩展程序(稍后会提到)

模型后缀解析格式描述

.ckpt

的标准模型保存格式,容易遭受反序列化攻击。

.pt

的标准模型保存格式,容易遭受反序列化攻击。

.pth

的标准模型保存格式,容易遭受反序列化攻击。

.

格式可与的模型相互格式转换,内容数据无区别。

其它

webui 特殊模型保存方法:PNG、WEBP图片格式。

格式

2、特点功能

中拥有大部分的基本AI绘画生成功能,例如文生图,图生图、种子值、放大图像等等,下面拿了的一些特别的功能进行了测评。不过中的功能虽然在界面中都可以调节,但是如果当前使用的模型算法不支持,可能会不起作用。

面部修复:

其中表示修复强度:值范围从0到1,范围内值越高修复效果越强;下面两张是多组测试中效果较明显的一组,他们有相同的种子值,关键词为“A girl’s face”:第一张,没有打开面部修复时的生成效果:

打开面部修复后:

这一功能主要是略微优化脸部结构,同时图片的锐度下降,并产生一定的磨皮、平滑效果。画布拓展:几乎可以将画布无限延展,这是这个功能最吸引人的特点。你可以在这个界面里自定义延展框的大小、比例、甚至创建遮罩等,将你原来的模型进行放大:

考虑到每次图像拓展可能会产生接缝线,官方在左侧的调节栏里设置了接缝校正功能如下,但是模型不同,这个调节的效果也会不同:

二、对比其他模型的优劣势

主要是基于开源模型的界面设计,它与著名的非开源AI图像生成模型相比,有哪些优缺点呢?在进行大量的出图时,采用的是上下滚动的翻阅设计,而采用的是将图片集中放在右侧栏中的设计,在直接选取之前的图像上更加方便。将所有的图像集中右侧:

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...