技术标签: python stable diffusion 开发语言
最近看Stable Diffusion开源了,据说比Disco Diffusion更快,于是从git上拉取了项目尝试本地部署了,记录分享一下过程~
这里是官网介绍:https://stability.ai/blog/stable-diffusion-public-release
本地化部署运行虽然很好,但是也有一些基本要求
(1)需要拥有NVIDIA显卡,GT1060起,显存4G以上。(已经不需要3080起,亲民不少)
(2)操作系统需要win10或者win11的系统。
MacOS平台本地化请见《如何在mac电脑上运行stable diffusion来做AI绘画》
(3)电脑内存16G或者以上。
(4)最好会魔法上网,否则网络波动,有些网页打不开,有时下载很慢。
(5)耐心,多尝试,多搜索。这个教程我已经重复过2次,因此很多问题基本上都踩坑并写出来了。所以请放心,能跑通的。
我的电脑配置供大家参考,Win10,I7,NVIDIA GT1050 4G,16G
生成一张20step的图大概20-30s(若使用更高性能的电脑,生成速度更快。)
Stable diffusion大家都知道了,是当前最多人使用且效果最好的开源AI绘图软件之一,属于当红炸子鸡了。
不过,stable diffusion项目本地化的部署,是纯代码界面,使用起来对于非程序员没那么友好。
而stable diffusion webui,是基于stable diffusion 项目的可视化操作项目。
通过可视化的网页操作,更方便调试prompt,及各种参数。
同时也附加了很多功能,比如img2img功能,extra放大图片功能等等。
因此stable diffusion webui项目是很多人部署到本地的首选。
我们本教程就是以stable diffusion webui项目为例来操作的。
这个是用来管理python版本的,他可以实现python的多版本切换。
下载地址:https://docs.conda.io/en/latest/miniconda.html
安装时按默认的一路next就行。
执行下面
conda config --set show_channel_urls yes
生成.condarc 文件
在我的电脑/此电脑-C盘-users-你的账号名下用记事本打开并修改.condarc文件。(如我的路径是C:\Users\Administrator。)
把下面的内容全部复制进去,全部覆盖原内容,ctrl+s保存,关闭文件。
channels:
- defaults
show_channel_urls: true
default_channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
pytorch-lts: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
运行conda clean -i 清除索引缓存,以确保使用的是镜像站的地址。
运行下面语句,创建环境
conda create --name lmd python=3.10.6
系统可能会提示y/n, 输入y,按回车即可。
显示done,那就完成了。
在你的C:\ProgramData\Miniconda3\envs\lmd已经创建了一个新的项目。
输入conda activate lmd 回车。
每一行输入后回车,等执行完再输入下一行,再回车。
python -m pip install --upgrade pip
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
不报错就是完成了。
前往git官网https://git-scm.com/download/win
下载好后,一路默认安装,next即可。
开始菜单找到git cmd。
打开并输入下面指令。
git --version
查看git的版本,显示了版本号即安装成功。
cuda是NVIDIA显卡用来跑算法的依赖程序,所以我们需要它。
打开NVIDIA cuda官网,https://developer.nvidia.com/cuda-toolkit-archive
(这里有人可能会打不开网页,如果打不开,请用魔法上网。)
你会发现有很多版本,下载哪个版本呢?
回到一开始的miniconda的小窗,输入nvidia-smi,查看你的cuda版本
比如我的是12.1的版本,我就下载12.1.0的链接
下载完后安装,这个软件2个G,可以安装在c盘以外的地方。比如D盘。
好了,完成这步,电脑的基础环境设置终于完事了。
下面开始正式折腾stable diffusion了。
注意:如果提示此命令nvidia-smi,非内部命令时,按以下操作
把此路径:C:\Program Files\NVIDIA Corporation\NVIDIA NvDLISR,放入到环境变量中
显卡所在路径:
环境变量位置:
确认你的miniconda黑色小窗显示的是(把stable看成是lmd就行)
如果不是,则输入D: 按回车。
当然你也可以放在其他你想放的盘的根目录里面。
不建议放在c盘,因为这个项目里面有一些模型包,都是几个G几个G的,很容易你的C盘就满了,其他盘容量在10G以上的就都行。
再来克隆stable diffusion webui项目(下面简称sd-webui)
接着执行
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
注意,现在克隆的本地地址,就是下面经常提到的“项目根目录”。比如,我的项目根目录是D:\stable-diffusion-webui
地址:https://huggingface.co/CompVis/stable-diffusion-v-1-4-original/tree/main
点击file and versions选项卡,下载sd-v1-4.ckpt训练模型。
(需要注册且同意协议,注册并同意协议之后即可下载)
注:这个模型是用于后续生成AI绘图的绘图元素基础模型库。
后面如果要用waifuai或者novelai,其实更换模型放进去sd-webui项目的模型文件夹即可。
我们现在先用stable diffusion 1.4的模型来继续往下走。
下载好之后,请把模型更名成model.ckpt,然后放置在sd-webui的models/stable-diffusion目录下。比如我的路径是D:\stable-diffusion-webui\models\Stable-diffusion
这是腾讯旗下的一个开源项目,可以用于修复和绘制人脸,减少stable diffusion人脸的绘制扭曲变形问题
地址:https://github.com/TencentARC/GFPGAN
把网页往下拉,拉到readme.md部分,找到V1.4 model,点击蓝色的1.4就可以下载。
下载好之后,放在sd-webui项目的根目录下面即可,比如我的根目录是D:\stable-diffusion-webui
输入
cd stable-diffusion-webui
进入项目的根目录。
切记,一定要进入sd-webui的项目根目录后,才能执行下面的指令,否则会报错。
接着执行
webui-user.bat
然后回车,等待系统自动开始执行。
直到系统提示,running on local URL: http://127.0.0.1:7860
这就代表,你可以开始正式使用AI画画啦~
注意:
这一步可能经常各种报错,需要耐心和时间多次尝试。
不要关闭黑色小窗,哪怕它几分钟没有任何变化。
如果提示连接错误,可能需要开启或者关闭魔法上网,再重新执行webui-user.bat命令。
如果不小心退出了黑色窗口,则重新点击:开始菜单-程序-打开miniconda窗口,输入
conda activate lmd
并进入sd-webui项目根目录再执行
webui-user.bat
网页会显示进度条,miniconda的黑色小窗也会显示进度条。
等进度条跑满,就能看到你生成的图啦。
如果不想生成了,可以点击interrupt停止生成,就会返回你目前为止已经生成的图片。(比如你要生成10张,已经生成了3张,点击interrupt,就会返回3张图片)
如果点击skip,就会跳过本张图片的生成,比如你想生成10张图,现在生成第3张,点击skip,第三张就不生成了,直接开始生成第四张,最后返回9张图片。
默认是1,一次性生成1张。
建议一次性生成4张或者以上,这样获得满意的图片概率会大一些,可以最多一次性生成最多100张。
但写得越大,一次性生成花费的时间越长,假设一张图30秒,设置10张就是300s,5分钟,100张则是3000s,50分钟。
https://www.bilibili.com/read/cv21253533
https://gitee.com/jerrylinkun/stable-diffusion-v2-stability-ai?_from=gitee_search
文章浏览阅读211次。 没有基础想要学好web前端开发,那么该怎么样去学习呢?前端开发是创建Web页面或app等前端界面呈现给用户的过程。前端开发通过HTML,CSS及Java以及衍生出来的各种技术、框架、解决方案,来实现互联网产品的用户界面交互。它从网页制作演变而来,名称上有很明显的时代特征。想要学好web前端开发,今天给大家分享一份零基础学web前端的教程大纲。 在互联网的演化进程中,网页制作是Web1.0时代..._react web开发零基础教程
文章浏览阅读645次。http://blog.csdn.net/yangwen123/article/details/8914291版权声明:本文为博主原创文章,未经博主允许不得转载。目录(?)[+]Android 电话系统框架介绍在Android系统中rild运行在AP上,AP上的应用通过rild发送AT指令给BP,BP接收到信息后又通过rild传送_rild.libpath
文章浏览阅读833次。主要说下图片素材,分有很多类型,比如摄影图片、插画图片、设计背景图片、卡通图等等这里都能找到,图片素材全部都是高清无水印,很多都是用户实拍上传,质量非常高,注册就能获取10次免费下载次数。Nappy一个专为黑人和棕色人服务的摄影图库,可免费个人使用和商业用途,里面所有摄影都是围绕黑人拍摄高分辨率的照片,各式各样黑人生活方面的照片,如果你刚好需要这方面的资源,那么 Nappy 可以帮助到快速开启设计和广告创作。您可以使用上面任何免费照片素材,所有照片都是 CC0 许可的,但是不可用于销售。_前端找尺寸图片的网站
文章浏览阅读440次。某个人进入如下一个棋盘中,要求从左上角开始走,最后从右下角出来(要求只能前进,不能后退),作业2:给定一个10个元素的列表,请完成排序(注意,不要使用系统api)作业5:给定一个非负整数数组A,将该数组中的所有偶数都放在奇数元素之前。作业9:给定一个数组,已知数组中的元素从1到N的自然数(每次加1),1、发表文章(标题、内容、缩略内容、发表时间、修改时间、作者)作业6:将10进制数据转换为二进制,并且统计其中的0和1的数量。作业7:给定一个数组,已知数组中的元素都是成对出现,_答案:def add_list(list1,list2): result =[] for index in range(0,len(list
文章浏览阅读5.5k次,点赞7次,收藏73次。Perl读取特定行VCS编译会产生log文件,包含了Error、Warning和lint信息,特别是warning和lint的数量比较多,直接在Lint中查找比较麻烦,并且还存在大量我们不关系的Lint信息,此时可以通过Perl将我们关心的包含了Error、Warning和lint信息提取出来,进行查看会方便很多。DC综合都会产生很多log文件,使用Perl提取特定行也会很方便。1.提取包..._perl在ic中的应用
文章浏览阅读1.7w次,点赞3次,收藏16次。两种方式动态改变css_vue动态修改css样式
文章浏览阅读378次。金磊 丰色 发自 凹非寺量子位 | 公众号 QbitAI元宇宙的本质是物理和数字两个世界的融合,“铸魂”是关键。这,便是AI科学家对于元宇宙所持的最新观点。他叫田奇,是计算机视觉、多媒体信息检索专家,国际欧亚科学院院士,IEEE Fellow。而他更为大众所熟知的身份,是华为云人工智能领域首席科学家。在田奇看来,元宇宙已经实现了“盘古开天”。下一阶段,数字人将成为元宇宙的..._整芯铸魂 算力
文章浏览阅读1.7k次。闲来无事安装一个ubuntu,但遇到个问题就是wifi无论如何都打不开,最终的解决办法很简单sudo modprobe -r ideapad_laptop这样就可以连接wifi了,我使用的是公司配的联想笔记本,如果依然无法开启,那我也没办法.这个办法的缺点是每次开机都要启动一次,可以写脚本开机自动执行..._ubuntu打不开无线网 site:blog.csdn.net
文章浏览阅读1.9k次。 通过SSH访问服务器,难免会要用到压缩,解压缩,打包,解包等,这时候tar命令就是是必不可少的一个功能强大的工具。linux中最流行的tar是麻雀虽小,五脏俱全,功能强大。 tar 命令可以为linux的文件和目录创建档案。利用tar,可以为某一特定文件创建档案(备份文件),也可以在档案中改变文件,或者向档案中加入新的文件。 tar最初被用来在磁带上创建档案,现在,用户..._tar -zxvf
文章浏览阅读2.6k次。页面中如何实现背景图100%铺满全屏.box{ width:100%; background: url(../img/bg.png) no-repeat ; background-size: 100% 100%; position: absolute; z-index: -1; top: 0; left: 0; rig..._backround: url("") 撑开全部
文章浏览阅读5.3k次。作者:Yanxin Hu,Yun Liu,Shubo Lv,Mengtao Xing,Shimin Zhang,Yihui Fu,Jian Wu,Bihong Zhang, Lei Xie文末附论文地址及其开源代码地址1. 动机卷积循环网络(CRN)集成了卷积编码器-解码器(CED)结构和长短期记忆(LSTM),已被证明有助于复杂目标,为了更有效地训练复杂目标,在本文中提出了一种新的网络结构称为深度复杂卷积循环网络(DCCRN)。2. 方法..._dccrn
文章浏览阅读1.9k次,点赞2次,收藏6次。总括MATLAB和pyplot有当前的图形(figure)和当前的轴(axes)的概念,所有的作图命令都是对当前的对象作用。可以通过gca()获得当前的axes(轴),通过gcf()获得当前的图形(figure)import numpy as npimport matplotlib.pyplot as pltdef f(t):return np.exp(-t) * np.cos(2..._plt.subplot(211)