- Stable Diffusion建筑绘画基础与实战
- 章斌全 石静
- 1153字
- 2025-04-24 17:49:29
2.1 实战:现代文化建筑精细手绘稿渲染
学习目标
学习控制画面的方法:提示词和ControlNet。
知识要点
1 正向提示词,如culture building,city,tree。正向提示词是我们希望生成的图片里出现的元素,如建筑性质、环境、天气等,可根据画面需要在出图过程中适当增减。
2 反向提示词,如bad-picture-chill-75v,EasyNegative,worst quality,low quality。前两个词是模型训练者(或模型开发者)给出的参考反向提示词,后两个词是通用反向提示词。可以在生成图片的过程中填入相应的词语,以消除不需要的元素。
3 使用ControlNet的预处理模型Lineart(线稿)控制生成效果。
4 手绘建筑线稿图处理效果如左下图所示,渲染之后的效果图如右下图所示。由于AI绘画的随机性和参数的多样性,每次生成的作品都会有所不同,因此示例图片的效果仅供参考。


制作步骤
01 将手绘建筑线稿图拍照或扫描处理成图片。
手绘图稿不应过于潦草,应适当表达出建筑轮廓,体量穿插关系,门、窗、层数等信息,以供Stable Diffusion生成符合预期的图像;手绘图稿也不应过于精细,过于精细的图会导致效率不高,同时也限制了AI的发挥空间。
02 转到Stable Diffusion中,设定基础参数。
选择“文生图”选项卡,选择合适的大模型,如LW_Architecutral_MIX V0.3_V0.3.safetensors,设置“迭代步数(Steps)”为30,“采样方法(Sampler)”为Eluer a,“提示词引导系数(CFG Scale)”为7,“随机数种子(Seed)”为-1。这里未提及的参数,建议保留默认值。
提示
上面用到的大模型LW_Architecutral_MIX V0.3_V0.3.safetensors,不是软件自带的大模型,请根据7.1节中提供的方法下载及使用各种大模型。
03 填入提示词。
正向提示词:culture building,city,tree。
中文含义:文化建筑、城市、树木。
反向提示词:bad-picture-chill-75v,EasyNegative,worst quality,low quality。
中文含义:前两个词都是前面选用的大模型提供的特定反向提示词,大意是不要坏的图片。后两个词均指低质量。

注意
● 这里直接使用了模型原创者建议的反向提示词,读者也可以自行编写。
● 提示词均使用英文和半角标点符号,不要使用汉字和全角标点符号。
04 调用ControlNet。
选择ControlNet Unit 0选项卡,按下面的步骤操作。
① 导入建筑手绘稿图片文件“学习资源\Ch02\2-1.jpg”。
② 勾选“启用”“完美像素模式”“允许预览”复选框。
③ 在“控制类型”中选择“Lineart(线稿)”选项,此时“预处理器”会自动选择lineart_standard (from white bg & black line)(标准线稿提取-白底黑线反色),“模型”会自动选择control_v11p_sd15_lineart_fp16。
④ 单击“预处理器”和“模型”之间的按钮,运行预处理器,生成黑底白线的预处理结果图片,图片将显示在上方。
⑤ 设置“控制权重”为0.7,“引导终止时机”为1。

05 设置尺寸。
单击下图中右下角的按钮,把本参考图的长宽值发送到界面上部的“宽度”和“高度”中。如果尺寸过大,建议等比例缩小,否则可能导致显存不足而报错。本案例中图片尺寸为1024像素×640像素。

提示
输出图片的宽度和高度单位是像素,建议将两者的值均设置为16的整数倍,否则可能导致运行错误。
06 批量生成。
设置“总批次数”为4,单击“生成”按钮,批量生成效果图。


07 调整参数,再次批量生成。
尝试在正向提示词中加入night,以调整画面效果,再次单击“生成”按钮,批量生成效果图。
