<p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><a href="http://m.zit.org.cn/4ve43nw2" target="_blank" style="background-color:rgb(255, 255, 255); font-size:18px;">上節(jié)課</a>咱們介紹了提示詞的基本機(jī)制和書寫方式,現(xiàn)在就到了實(shí)戰(zhàn)檢驗(yàn)學(xué)習(xí)成果的時(shí)候。話說美女雖好,看太多也難免審美疲勞,咱們今天就換個(gè)口味,來生成一幅水墨山水畫吧。</p> <p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">首先要做的,依然是選擇底模,之前葫蘆叔推薦過的模型大多是基于SD1.5環(huán)境運(yùn)行的,這次,就讓我們跟隨技術(shù)發(fā)展潮流,點(diǎn)擊SDXL標(biāo)簽,選擇最近風(fēng)頭正盛的SDXL1.0模型來做個(gè)嘗試:</p> <p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">選擇完成后可以看到底模選框右下角多出了一個(gè)以前沒有的復(fù)選框SDXL Refiner,這是XL版本特有的第二模組,采用圖生圖的形式對(duì)圖像進(jìn)行二次優(yōu)化,但有時(shí)也會(huì)產(chǎn)生反效果,這里我們先不去勾它。</p> <p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">繼續(xù)往下輸入提示詞,我們這次想要的是一幅水墨山水畫,那么首先當(dāng)然要有山和水啦。由于吐司集成了提示詞補(bǔ)全插件,它對(duì)中文其實(shí)是有一定識(shí)別能力的,這里我們就輸入“山”,系統(tǒng)會(huì)自動(dòng)彈出一個(gè)下拉選框,里面羅列的都是和山有關(guān)的提示詞并在右側(cè)給出了對(duì)應(yīng)的中文解釋。點(diǎn)擊選擇我們需要的詞,也就是第一個(gè),mountain。</p> <p class="ql-block"><br></p><p class="ql-block ql-indent-1">這里需要說明的是,如果不從列表中選擇而是直接輸入中文“山”,系統(tǒng)在最后生圖的時(shí)候其實(shí)也會(huì)嘗試進(jìn)行翻譯。但比起從補(bǔ)全列表中選擇,這種硬翻譯極有可能向SD傳遞錯(cuò)誤或不準(zhǔn)確的信息,繼而導(dǎo)致成像質(zhì)量下降和圖像優(yōu)化困難,所以<span style="color:rgb(237, 35, 8);">不到萬(wàn)不得已最好不要直接使用中文輸入</span>。</p> <p class="ql-block ql-indent-1">接下來,根據(jù)水墨山水畫的常見特點(diǎn),我們依次輸入 mountain(山),water(水), tree(樹木), bridge(橋),boat(船),詞與詞之間用逗號(hào)分隔開;由于這次加載的是XL1.0版本的底模,而上節(jié)課講過的冷板凳三兄弟都是基于1.5版本運(yùn)行的,在這里并不適用,所以反向提示詞里我們還是寫一些基本的質(zhì)量控制詞,如下圖:</p> <p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">繼續(xù)向下滑動(dòng)查看其他參數(shù),會(huì)發(fā)現(xiàn)圖片大小發(fā)生了神奇的變化,雖然還是豎長(zhǎng)方、橫長(zhǎng)方和正方形三種預(yù)設(shè),但分辨率卻由原來的512*768、768*512、640*640增加到了768*1152、1152*768、1024*1024,自定義分辨率甚至可以達(dá)到1536*1536!前面的課程里咱們剛說過SD中原始圖像分辨率不能超過1024*1024,怎么一轉(zhuǎn)身就被啪啪打臉了呢?</p> <p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">原因很簡(jiǎn)單——SD升級(jí)了。和其它所有軟件一樣,雖然開源了,但作為官方的Stability AI也還在不斷的對(duì)SD進(jìn)行迭代更新,例如我們之前演示時(shí)使用的SD1.5版本,就是初代SD的最終版本(前面還有v1.0、v1.1、v1.2、v1.3、v1.4),也是流傳最廣、生態(tài)最完善的一個(gè)版本。而這次推出的SDXL系列實(shí)際上是SD的第三代產(chǎn)品——等等,怎么直接就從第一代跳到第三代了?二代去哪了?嗯…二代當(dāng)然是存在的,只不過被大家選擇性忽略掉了??</p><p class="ql-block ql-indent-1"><br></p> <p class="ql-block ql-indent-1">繼1.5版本之后,官方曾先后推出過v2.0、v2.1兩個(gè)大版本以及數(shù)個(gè)小版本的更新,成像質(zhì)量尤其是風(fēng)景和建筑類內(nèi)容的表現(xiàn)也得到了明顯改善,那為啥沒人用呢?原因很多,比如提示詞書寫體系大幅改變導(dǎo)致用戶不習(xí)慣,再比如因?yàn)榘鏅?quán)爭(zhēng)議刪除了大量?jī)?nèi)置的名人肖像和藝術(shù)家風(fēng)格,但最重要的其實(shí)只有一點(diǎn)——<span style="color:rgb(237, 35, 8);">它大砍了NSFW內(nèi)容</span>。</p><p class="ql-block ql-indent-1">NSFW,not safe for work的簡(jiǎn)寫,翻譯過來就是“不宜用于工作場(chǎng)合”,聽不懂?再換個(gè)詞兒,18禁,包括但不限于政治、色情、血腥、暴力等內(nèi)容,這回懂了吧??。為啥不直接說18禁呢,不是葫蘆叔非要整洋詞兒,而是因?yàn)椤猄D不認(rèn)識(shí)18禁,但NSFW它可是認(rèn)識(shí)的。在SD中,NSFW屬于特征描述詞中一個(gè)特殊的存在,它更像一個(gè)開關(guān),放在反向提示詞里可以讓你的成像內(nèi)容健康和諧,可要是放到正向提示詞里…咳,好像又說了什么不該說的╰(  ̄﹏ ̄)╯</p> <p class="ql-block ql-indent-1">總之,Stability AI作為親爹,既怕?lián)?zé)又覺得自己應(yīng)該把孩子向健康陽(yáng)光的方向引導(dǎo),沒想到外面這些社會(huì)人壓根不買賬,一個(gè)個(gè)滿腦子就想關(guān)上門畫個(gè)小澀圖或者拿著懂王的臉去整活兒,你不支持NSFW那我就繼續(xù)玩我的1.5版本——就這樣,第二代SD雖然在技術(shù)上取得了突破,但在社群傳播層面卻是一敗涂地。</p> <p class="ql-block ql-indent-1">于是Stability AI痛定思痛,把這次推出的第三代SD更名為SDXL,重新恢復(fù)了對(duì)NSFW內(nèi)容的支持,加上橫跨兩個(gè)世代(其實(shí)也就過了半年??)的技術(shù)架構(gòu)升級(jí)和成像表現(xiàn)優(yōu)化,除了插件、模型這些環(huán)境生態(tài)仍需時(shí)間來完善,其他方面已經(jīng)呈現(xiàn)出全面碾壓1.5版本的態(tài)勢(shì),許多業(yè)態(tài)可能也會(huì)隨之發(fā)生變化。</p> <p class="ql-block ql-indent-1">那么如何才能使用XL1.0版本的SD呢?很簡(jiǎn)單,就像剛才我們做過的一樣,<span style="color:rgb(237, 35, 8);">直接在模型分類里選擇SDXL標(biāo)簽下面的模型</span>就可以了,選完底模以后LoRA啥的都會(huì)自動(dòng)匹配,不支持XL版本的LoRA你就是想選也選不了,其它設(shè)置則和以前版本差不多,且由于目前ControlNet等高級(jí)插件的支持都還在路上,用戶只需要把關(guān)注焦點(diǎn)放在底模、LoRA和提示詞上,對(duì)新手小白的友好度直接拉滿,至于實(shí)際效果,咱們接著往下一試便知。</p> <p class="ql-block ql-indent-1">圖像大小我們?nèi)匀贿x擇第一個(gè)豎屏預(yù)設(shè),采樣方式選擇最下面的DPM++2M SDE Karras,其它保持默認(rèn),直接拉到最下面點(diǎn)擊在線生成。</p> <p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">這次等待的時(shí)間明顯比我們前兩次生圖時(shí)要長(zhǎng),SDXL在提升成像質(zhì)量的同時(shí)對(duì)硬件的要求和系統(tǒng)資源的消耗也相應(yīng)提高了(想要在本地部署的webUI上玩轉(zhuǎn)XL版本,至少需要12G以上的顯存)。圖像生成完畢后,可以看到我們輸入的元素確實(shí)都有了,整體構(gòu)圖和色調(diào)表現(xiàn)也還不錯(cuò),但這明顯更像照片而不是什么水墨畫。</p> <p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">啥原因呢?當(dāng)然是因?yàn)槲覀儧]告訴SD需要的是水墨畫啦~AI可不會(huì)玩什么猜領(lǐng)導(dǎo)心思的過家家游戲,想要什么就得老老實(shí)實(shí)說出來ψ(`?′)ψ,所以現(xiàn)在點(diǎn)擊上方的工作臺(tái)標(biāo)簽回到創(chuàng)作界面,在提示詞輸入框里增加ink painting(水墨畫),再運(yùn)用上節(jié)課學(xué)過的語(yǔ)法添加一個(gè)0.8權(quán)重的霧氣增加點(diǎn)氣氛:(fog:0.8),再來生成一次:</p> <p class="ql-block"><br></p><p class="ql-block ql-indent-1">你看,這下是不是就有內(nèi)味兒了呢?大致的效果出來了,接下來就是快樂抽卡和微調(diào)優(yōu)化的時(shí)間了,比如將采樣次數(shù)增加到30,提示詞相關(guān)性降低到5來改善整體畫質(zhì)和色調(diào),</p> <p class="ql-block"><br></p><p class="ql-block">再比如添加muted colors(柔和的顏色)來為畫面增加色彩,</p> <p class="ql-block"><br></p><p class="ql-block">或者切換成橫向畫布以增加構(gòu)圖空間。</p> <p class="ql-block"><br></p><p class="ql-block ql-indent-1">最后,再來試試SDXL的自然語(yǔ)言識(shí)別能力。我們用瀏覽器打開百度翻譯(chatGPT是更好的選擇,如果你有的話),輸入以下內(nèi)容:</p><p class="ql-block ql-indent-1">一葉扁舟泛于清澈的湖面,兩岸草木繁茂郁郁蔥蔥,周圍群山起伏層巒疊嶂</p><p class="ql-block ql-indent-1">然后把得到的翻譯結(jié)果復(fù)制粘貼到提示詞輸入框(記得先把原來的刪了),再次點(diǎn)擊生成。</p> <p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">怎么樣?是不是發(fā)現(xiàn)SD這孩子語(yǔ)文水平大有進(jìn)步呢?如果你也是英文苦手,就快去使用這種方法享受文生圖的樂趣吧~</p>