Purytańskie Stable Diffusion 2.0

Wydano nową wersję Stable Diffusion 2.0, która jest nieco gorsza od poprzedniej, bo ograniczono dane służące do jej zbudowania.
1. Użytkownicy, którzy testują nową wersję narzekają na to, że część popularnych elementów promptów nie działa tak jak w poprzedniej wersji.
  1. Jednym z ze sposobów tworzenia obrazów o wysokim poziomie detalu w SD jest nazwisko polskiego artysty cyfrowego Grega Rutkowskiego. W SD 1.4 gdy dodamy do dowolnego prompta “Greg Rutkowski” to dostajemy obraz o większej ilości detali i wyższej jakości. Nie działa tak samo w SD 2.0.
  2. Podobnie jest z inną popularną artystką cyfrową Mandy Jurgens.
  3. SD 2.0 zostało “oczyszczone” z nazwisk żyjących artystów digitalowych. Prawdopodobnie z obawy przed konsekwencjami prawnymi.
2. Inni testujący piszą o tym, że SD 2.0 nie reaguje na prompty z nazwiskami znanych aktorek (Emma Watson, Scarlet Johanson).
3. Do tego baza treningowa SD 2.0 została wyczyszczona ze zdjęć z nagością co sprawia, że obrazy związane z ciałem ludzkim są niższej jakości.
  1. Już nie tylko dłonie nie działają ale całe ciała są jakieś dziwne.
    1. Dla porównania ten sam prompt w SD1.5
4. Pojawili się już pierwsi chętni, żeby odpalić konkurencyjny dla SD projekt w którym są wszystkie dane bez filtrów.
5. Można oczywiście dodać swoje dane do modelu przy użyciu DreamBooth ale to wymaga więcej pracy niż użycie gotowca SD.
6. Są też przykłady naprawdę dobrej jakości, realistycznych obrazów wygenerowanych przy użyciu “czystego” SD2.0.
  1. Podobno duże znaczenie w nowym SD2.0 mają negatywne prompty.
7. Nie dziwie się twórcom SD, że czyszczą dane służące do budowania modelu. Rozumiem to, że chcą zbudować odporną na pozwy, dojrzałą, niekontrowersyjną organizację. Boje się jednak, że przy okazji degradują swój produkt.
  1. Ryzyko generowania obrazów NSFW z twarzami znanych aktorek, oraz tworzenia imitacji prac żyjących artystów digitalowych jest realne.
  2. Pozostali dostawcy generatorów obrazów cenzurują je od samego początku i nikt nie narzeka.
  3. Jednak siłą SD jest to, że jest open source i że daje duże możliwości za darmo i bez filtrów twórcy API. Obiecuje wolność i swobodę.
    1. Tę swobodę dalej dostajemy ale odpowiedzialność jest przesunięta dalej. Musimy “doszkolić” model SD2.0 na własną rękę.
    2. Ale z jakiegoś powodu poczucie jest takie, że produkt jest gorszy. Chyba dlatego, że obietnica marki SD jest w pewnym sensie złamana.
  4. Poprawne odwzorowanie ludzkiego ciała wydaje się fundamentalnym aspektem sztuki. Purytanizm to przeszkoda do dobrej jakości obrazu.
  5. To ironiczne, że najnowsze AI jest tak samo ograniczane jak artyści wczesnego średniowiecza. Gdzie jest progress? Kiedy renesans?

Kuba Filipowski

Purytańskie Stable Diffusion 2.0 /November 28, 2022 by Kuba Filipowski