2.1 实战:现代文化建筑精细手绘稿渲染

学习目标

学习控制画面的方法:提示词和ControlNet。

知识要点

1 正向提示词,如culture building,city,tree。正向提示词是我们希望生成的图片里出现的元素,如建筑性质、环境、天气等,可根据画面需要在出图过程中适当增减。

2 反向提示词,如bad-picture-chill-75v,EasyNegative,worst quality,low quality。前两个词是模型训练者(或模型开发者)给出的参考反向提示词,后两个词是通用反向提示词。可以在生成图片的过程中填入相应的词语,以消除不需要的元素。

3 使用ControlNet的预处理模型Lineart(线稿)控制生成效果。

4 手绘建筑线稿图处理效果如左下图所示,渲染之后的效果图如右下图所示。由于AI绘画的随机性和参数的多样性,每次生成的作品都会有所不同,因此示例图片的效果仅供参考。

制作步骤

01 将手绘建筑线稿图拍照或扫描处理成图片。

手绘图稿不应过于潦草,应适当表达出建筑轮廓,体量穿插关系,门、窗、层数等信息,以供Stable Diffusion生成符合预期的图像;手绘图稿也不应过于精细,过于精细的图会导致效率不高,同时也限制了AI的发挥空间。

02 转到Stable Diffusion中,设定基础参数。

选择“文生图”选项卡,选择合适的大模型,如LW_Architecutral_MIX V0.3_V0.3.safetensors,设置“迭代步数(Steps)”为30,“采样方法(Sampler)”为Eluer a,“提示词引导系数(CFG Scale)”为7,“随机数种子(Seed)”为-1。这里未提及的参数,建议保留默认值。

提示

上面用到的大模型LW_Architecutral_MIX V0.3_V0.3.safetensors,不是软件自带的大模型,请根据7.1节中提供的方法下载及使用各种大模型。

03 填入提示词。

正向提示词:culture building,city,tree。

中文含义:文化建筑、城市、树木。

反向提示词:bad-picture-chill-75v,EasyNegative,worst quality,low quality。

中文含义:前两个词都是前面选用的大模型提供的特定反向提示词,大意是不要坏的图片。后两个词均指低质量。

注意

● 这里直接使用了模型原创者建议的反向提示词,读者也可以自行编写。

● 提示词均使用英文和半角标点符号,不要使用汉字和全角标点符号。

04 调用ControlNet。

选择ControlNet Unit 0选项卡,按下面的步骤操作。

① 导入建筑手绘稿图片文件“学习资源\Ch02\2-1.jpg”。

② 勾选“启用”“完美像素模式”“允许预览”复选框。

③ 在“控制类型”中选择“Lineart(线稿)”选项,此时“预处理器”会自动选择lineart_standard (from white bg & black line)(标准线稿提取-白底黑线反色),“模型”会自动选择control_v11p_sd15_lineart_fp16。

④ 单击“预处理器”和“模型”之间的按钮,运行预处理器,生成黑底白线的预处理结果图片,图片将显示在上方。

⑤ 设置“控制权重”为0.7,“引导终止时机”为1。

05 设置尺寸。

单击下图中右下角的按钮,把本参考图的长宽值发送到界面上部的“宽度”和“高度”中。如果尺寸过大,建议等比例缩小,否则可能导致显存不足而报错。本案例中图片尺寸为1024像素×640像素。

提示

输出图片的宽度和高度单位是像素,建议将两者的值均设置为16的整数倍,否则可能导致运行错误。

06 批量生成。

设置“总批次数”为4,单击“生成”按钮,批量生成效果图。

07 调整参数,再次批量生成。

尝试在正向提示词中加入night,以调整画面效果,再次单击“生成”按钮,批量生成效果图。