Det finns en Facebook grupp som heter Stable Diffusion Realistic Photography där medlemmarna fokuserar på att skapa AI bilder som är så naturtrogna att de lika gärna hade kunnat vara riktiga fotografier.
Om jag ska vara helt ärlig så är de flesta bilderna på kvinnor som inte sällan lättklädda (dock inte nakna såklart), något som vissa medlemmar i gruppen tagit upp vid ett flertal tillfällen. Jag kan förstå att många väljer att skapa bilder av kvinnor, dels för att de är estisiskt vackra och dels för att de ofta är ganska enkla att skapa.
Jag ville därför skapa något helt annat, och valde att fokusera på kattungar. Bilden jag ville skapa hade jag helt klar för mig, men det var svårt att få till och jag lyckades tyvärr inte få det exakt som jag ville.
Bilden jag hade i mitt huvud vad en kattunge som nyfiket luktar på en maskros (när den är i stadiet av en vit boll). Även fast jag inte fick till det exakt som jag ville, så är jag ändå ganska nöjd. Resultaten ser du här nedan.
För att få fram dessa 10 bilder jag var nöjd med, så skapade jag hundratals bilder. De flesta som jag inte var nöjd med hade endast några små fel, men som var tillräckligt för att man skulle förstå att det inte var ett riktigt fotografi.
Ett exempel är bilden nedan där kattungen har fått en extra tass som den håller maskrosen i.
En hel del bilder som inte blev bra när jag testade olika inställningar ser däremot ut att komma från någons mardröm. Vissa av dem är så hemska att jag själv mår lite illa av att se dem. Den enda skillnaden i inställningarna mellan de lyckade och de minst lyckade bilderna är texten soft lightning.
Nedan är ett urval av de bilderna som absolut inte blev bra.
Den tredje bilden tycker jag personligen är värst, där det ser ut som att en maskros vuxit inuti huvudet på kattungen och nu försöker bryta sig ut.
Vill du skapa dina egna AI bilder?
Jag har tidigare skrivit några guider som steg för steg visar hur du kan installera AI program på din egen dator. Fördelen med att köra programmen från egen dator är att det är gratis, det finns inga begränsningar och det är inga väntetider eller kösystem.
Stable Diffusion På Datorn
En guide som visar hur du installerar den mest grundläggande formen av AI på datorn. Allt sker textbaserat i kommandotolken, och kan därför vara svårt att förstå och bli bra på. Guiden kan du läsa här: Stable Diffusion På Datorn
Skapa AI Bilder Med ComfyUI
Den här guiden visar hur du kan installera ComfyUI, vilket är ett enkelt gränssnitt som gör skapandet mycket enklare än för den i texten ovanför. Den fungerar bra till att skapa enklare bilder, men det är svårt att använda de mer komplicerade verktygen.
Guiden finns här: Skapa Dina Egna AI Bilder
Automatic1111
Automatic1111 har blivit det gränssnittet jag själv oftast använder. Den är mycket mer användarvänlig än de tidigare två, och därför rekommenderar jag denna oavsett om man är nybörjare eller redan kan en del.
Länk till guiden: Automatic1111 – Alternativet Till ComfyUI
Inställningar för skapandet av (de lyckade) kattungarna
Program/UI: Automatic1111
AI Modell: 0001softrealistic_v154xxx
Text promt:
Raw photo, kitten examining a dandelion, high detailed fur, clear weather, wind, 8k uhd, soft lighting, high quality, film grain, Fujifilm XT3
Negativ text prompt:
(deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.4), (bad-hands-5, worse hands, worst hands, extra fingers, deformed hands:1.5), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing limbs, disfigured limbs, extra legs, long neck
Sampling method: DPM++ 2M Karras
Steps: 28
CFG scale: 4
Seed: 52546789168
Face restoration: CodeFormer
Size: 512×768
Denoising strength: 0.7
ControlNet 0: Module: lineart_standard (from white bg & black line), Model: t2i-adapter_diffusers_xl_lineart, Weight: 1, Resize Mode: Crop and Resize, Low Vram: False, Processor Res: 512, Guidance Start: 0, Guidance End: 1, Pixel Perfect: False, Control Mode: Balanced, Save Detected Map: True
ControlNet 1: Module: openpose_full, Model: control_v11p_sd15_openpose, Weight: 1, Resize Mode: Crop and Resize, Low Vram: False, Processor Res: 512, Guidance Start: 0, Guidance End: 1, Pixel Perfect: False, Control Mode: Balanced, Save Detected Map: True
Hires upscale: 1.5, Hires steps: 20, Hires upscaler: R-ESRGAN 4x+, Version: v1.6.0