Jak generować obrazy z AI

Gościnnie – Pak4

Krótka odpowiedź: wejść na stronę wyszukiwarki BING, przejść do obrazów i sekcji utwórz*. A potem napisać co się chce. I już.

A w długiej wersji — tak, ale:

– Dall-e (bo to on kryje się w Bingu) został nauczony kojarzyć mowę w z obrazami i tworzyć „semantykę wizualną” (to pierwszy etap jego działania). I nie został tego nauczony po polsku. Działa to więc tak, że AI tłumaczy zlecenie na angielski, a potem dopiero generuje obraz. I czasem to widać — np. Św. Paweł sprzedający namioty stał przy szyldzie „TENTS”, a „Vademecum odchudzania” miało wypisane „weight loss”, choć oba zapytania zrobiłem po polsku.

– Uwaga na marginesie uwagi: AI ma wyraźną dysleksję. Bardzo często przerabia napisy na coś o podobnym układzie liter. To pokazuje słabość tkwiącą w tej mocy — AI nie rozumie, co pisze, wie tylko że „jakoś tak” to powinno wyglądać. Trochę jakby komputer był konkretniejszy od człowieka, a człowiek konkretniejszy od AI.

Ilustracja powyżej, to jedna z przymiarek AI do „feministy” — hasła podała po angielsku sama z siebie. Z błędem.

– Wracając do angielszczyzny — dla lepszego wyrozumienia warto samodzielnie przetłumaczyć zlecenie na angielski, by uniknąć nieporozumień. Najczęstszym jest gubienie końcówki gramatycznej określającej płeć postaci portretowanej — angielski tego nie ma i maszyna nie dopisuje, czy dana persona jest męska, czy żeńska.

– Rada serio: uczący obsługi AI (nie tylko Dall-e) mówią: doprecyzowywać**. W tym przypadku zwłaszcza określić jak ma wyglądać obraz. Sam z tego akurat nie korzystałem, ale AI ma mieć całkiem rozbudowane możliwości udawania konkretnej optyki aparatu fotograficznego. Ja prosiłem by zrobiła według danego malarza, epoki, producenta filmów animowanych, albo właśnie „fotorealistycznie”.

– Całkiem sporej rzeczy AI nie wie, a przynajmniej mnie nie udało się z niej tego wyciągnąć. Poproszona o Rembrandta nawiązała do „Dziewczyny z perłą” Vermeera. Poproszona o wygenerowanie Fairey Battle w barwach polskiego lotnictwa (cóż niby prostszego, wziąć zarys samolotu A i zastosowań kolory B?) wygenerowała pseudodrugowojenny samolot w pseudopolskich barwach. Bo AI nie wie, że polskie znaki to szachownice, ale wie, że w wielu krajach są kokardy. Namalowała więc biało-czerwone kokardy… Albo poproszona o Godzillę atakującą opactwo w Tyńcu (cóż, lokalsi z domu kultury zrobili konkurs na portret smoka, pomyślałem, że to ciekawy kontrapunkt), orientowała się generalnie, że opactwo to coś między Cluny a Downton Abbey, ale samego Tyńca nie znała.

Godzilla i opactwo w Tyńcu zdaniem AI…

„Fairey Battle w barwach polskich z 1939 roku”.

– W odpowiedzi na pytani dostaniemy: a) nic, b) 4 obrazki, c) 3 obrazki, d) 2 obrazki, e) 1 obrazek. Przy czym nic możemy dostać zarówno przed generowaniem, jak i po generowaniu obrazów. Przed, bo AI sprawdza, czy zapytanie mogłoby naruszyć REGUŁY***. Po (dużo rzadziej), bo AI sprawdza, czy wynik nie naruszył REGUŁ. (Ja nawet podejrzewam, że czasem mniej niż 3 obrazki, to też mogą być wynikać z naruszonej REGUŁY, ale z czterech prób coś się ostało.) Reguły są poprawne politycznie: bez przemocy, golizny i nawiązywania do realnych postaci, bo mogą się obrazić. Czyli żadne „chcę Tuska zabijającego smoka”, ani „namaluj noc poślubną Napoleona i Józefiny”.

– Jak już jesteśmy przy politycznej poprawności, to ja mam wątpliwości. Bo ludzie tam tworzą nierealne wzorce piękna. A bardziej serio: jeśli chcę portrety Gości, no to jasne, że miło mi, że ich ładnie portretuje, jako przystojnych kawalerów i śliczne dziewoje, ale jak tak robi raz po raz to taka powtarzalność robi się irytująca. I do tego panowie najczęściej z zarostem, panie zaś często z ustami napompowanymi jak bicepsy Schwarzeneggera za najlepszych lat. I najczęściej osoby białe, vel kaukaskie. W zasadzie nie dziwiła mnie różnorodność etniczna na poziomie klientów lokalnej Żabki, dopóki AI poproszona o Judytę z głową Holofernesa (żadnych aluzji do obcięcia — patrz: REGUŁY) poczęstowała dwoma Judytami kaukaskimi i dwoma afrykańskimi… No… w sumie dlaczego nie? I to bywa problem, bo jak taktownie powiedzieć AI, że tu może sobie wybierać dowolną grupę etniczną za wzór, a tam jej wara?

Judyta z głową Holofernesa.

– A propos „panowie z zarostem” — mimo usilnych starań, nie udało mi się uzyskać od AI średniowiecznego bądź starożytnego króla bez brody… Może ktoś spróbuje?

Bolesław Chrobry.

– Ciałopozytywność ma ograniczenie — mamy bardzo ładne portrety, bohaterowie są śliczni, o ile są bohaterami. Bo już grafika, gdzie bohaterem jest zbiorowość i mamy kilka-kilkanaście twarzy zawiera jakieś dziwne grymasy, przy których restauracja obrazu Jezusa z Borji jest wzorem poprawności ludzkiej twarzy.

Jedna z prób — twarze są zniekształcone.

– Czego jeszcze AI nie zna? Cóż, nie udało mi się wymusić choćby greckiego malarstwa wazowego, albo nawiązań do sztuki egipskiej. Generalnie epoka/styl to okazja do doprecyzowań, bo AI często myli zamierzony styl malowania, ze stylizowaniem sceny.

– No i takie pytanie: po co to? Ale tak serio, nie że zabawa? Moje pierwsze skojarzenia, to że gdybym po kosztach własnych wydawał fantastykę, to mógłbym ją ilustrować. W końcu tam nikt nie zwróci uwagi, że Bolesław Chrobry nie był brodaty. Ale to nisza. Znacznie większe zastosowanie to generowanie grafik stockowych — potrzebujesz ilustracji „polska rodzina nad Bałtykiem” do artykułu? Albo „model do sklejania” jako reklamy sklepu****? Proszę bardzo — sam wymyślasz co i jak, i to dostajesz bez praw autorskich!

„Polska rodzina nad Bałtykiem”.


*) Bing daje Dall-e i jest to generator darmowy. Uważam, że póki chodzi o zabawę, to nie ma za co płacić. Choć i w Bing można płacić za plany, umożliwiające generowanie większej liczby obrazów.
**) Dokładniej: zapytać – zobaczyć co nie tak – doprecyzować pytanie. I tak do skutku. Podobno przy Chat GPT często pomaga poproszenie o uzasadnienie, jak wynik wynika z pytania. Dla Dall-e takiej rady nie znam, ale doprecyzowywać — jak najbardziej!
***) Przed, teoretycznie, można się od wyroku łamania reguł odwołać.
****) Właśnie migała mi reklama sklepu z modelami, w której coś mi nie pasowało… No tak, sklejony samolot był jak ten Fairey Battle — nigdy nie istniał — był zlepkiem kilku różnych form. Nie było to więc zdjęcie, a produkt AI.


Jako bonus z wpadek AI — Debora śpiewająca pieśń. Nie dość, że ktoś w tle ma gitarę, to ona ma nuty. (Ale dwa inne obrazki dały Deborze mikrofony…)

Komentarzy 41 to “Jak generować obrazy z AI”

  1. pak4 Says:

    Basia mnie pyta, czy dla AI nie byłoby wyzwaniem zrobienie obrazu pięknej… czterdziestolatki? Poprosiłem AI, prosz:

    No to pięćdziesięciolatki — AI postarzyła tę samą panią:

    I jeszcze wersja Debory, która mi się zgubiła — piękna… powinna być epoka żelaza, ale ja zmyliłem AI i powiedziałem, że epoka brązu:

    I z cyklu próby ilustrowania Biblii — przejście przez Morze Czerwone. Co te statki, czy łodzie w tle robią?

  2. basiaacappella Says:

    😀 😀 😀

    Tylko dodam, iż tekst powstał w odpowiedzi na tak zwane zapotrzebowanie społeczne 😎 😎 😎 i niejako stanowi uzupełnienie galerii, jaka pojawiła się spontanicznie i wciąż jest uzupełniana pod wpisem „Pag na Pagu po czterech latach ➡
    Wczorajsze dzieła pani sztucznej pod komendą Paka4:
    https://basiaacappella.wordpress.com/2023/11/08/pag-na-pagu-po-czterech-latach/#comment-102000 – zapraszam wszystkich i dziękuję Autorowi!!!

    😀 😀 😀 😀 😀 😀 😀

  3. basiaacappella Says:

    Pięęękne panie… 🙄 😆 😎 ❗

  4. pak4 Says:

    To jeszcze parę — steampunkowa „Zgoda Narodów” na baktryjskiej rzece:

    Przy jednym z nicków dało mi tak:

    Klasyczna Słowacja, zdaniem AI:

    „Naprawiający rower” — rzeźba:

  5. Kanadol Says:

    Szczęka opada… 😉

  6. basiaacappella Says:

    😀 😀

    „Klasyczna Słowacja” przypomina mi troszkę nieklasyczną Bawarię (tę od Ludwika II zwanego też Szalonym… 🙄 )

  7. Sceptyk Says:

    Super jestem tam w waszej galerii naszej, prawda… 😆

    Jak będę miał czas – to spróbuję się pobawić z tą całą AI!

  8. Sceptyk Says:

    P.S., „postarzyło tą samą panią”,
    a kolor oczu się zmienia z wiekiem w krainie AI? 😆

  9. Kasia Says:

    Tak Wam powiem:
    Wolę zdjęcia Wasze i inne, nawet gdy mało w nich Osób. 🙂

    (A Chorwację obejrzę dopiero po N. Roku, niestety.)

  10. pak4 Says:

    @Kasia:
    Zapewniam, że nie planujemy robić wirtualnych wycieczek z AI — jakby co, to tylko realne 🙂

    Natomiast mnie to generowanie bawi. No i ciągle odkrywam pewne odmienności w widzeniu świata — własnym i AI. Stąd ten wpis, jako podsumowanie uwag i spostrzeżeń.

    I, o ile, nie zapowiadam wirtualnych wycieczek zamiast realnych, to nie wykluczam, że jak przyjdzie mi jakaś śmieszna kombinacja pojęć do głowy, to poproszę AI o doilustrowanie.

    @Sceptyk:
    Masz oko!

    PS.
    Jeden z „ogonków” wg AI. Co ona zrozumiała ze słowa „ogonek”? Albo z czym połączyła, czy na co przetłumaczyła (i z czego?):

  11. Asia Says:

    Obejrzałam i ja, wiele się dowiedziałam, a „pomysły” sztucznej inteligencji przyprawiły mnie o ból przepony, dzięki Pak4! 😀

  12. pak4 Says:

    Całkiem regularna Godzilla x 2:

    Oraz kunf-fu-królik:

  13. Sceptyk Says:

    Pak4, staram się 😉

  14. Robert Says:

    😀
    Galeria się rozrasta, smaczki przywoływane.
    Nawiasem dzięki za Zawadę. 🙂

    Tymczasem w naturze…

  15. basiaacappella Says:

    Sceptyku, Kasiu, Paku4, Asiu, Robercie 😀 😀 😀 😀 😀 😀 😀 😀 😀

    Tak, zabawa z AI przednia… i nawet dość kształcąca… w porywach… 🙄

    A ten kangur to sobie da radę podczas słowackiej zimy?… 😮 😯 …

  16. pak4 Says:

    Że Nana jako Afroamerykańska babcia ciekawi? To proszę:

    Poprosiłem AI, by narysowało nas na wycieczce, bo skoro pogoda taka sobie:

    Noale jak widać, AI nie zadbało o banana (gdzie plecak?) ani o w ogóle jakieś porządne ubranie w góry… Ech… Dodałem jej, że z plecakami:

    A potem zasugerowałem, że ma być wśród łąk górskich:

  17. pak4 Says:

    Powyżej łąk:

    I nad górskim jeziorem:

    PS.
    Niestety, czym wyżej sugerowałem, tym bardziej AI sugerowała parę dwóch mężczyzn, aż musiałem zaznaczyć, że „we dwoje” oznacza z żoną. A nawet i to nie do końca pomagało…

  18. basiaacappella Says:

    🙄 … 🙄

    Niedługo określenie „z żoną” będzie niepoprawne politycznie… trzeba wybiegać do przodu i się uczyć przed wszystkimi, nawet przed sztucznom yntelygencjom!… 🙄

  19. pak4 Says:

    Basia mówi, żeby używać „hills” a nie „mountains”, i że mogą być rysunkowe. No to proszę: mężczyzna i jego żona idący po wzgórzach:

    OK, dodałem, że z plecakami:

    No i Basia pyta, jak nazwać kategorię generacji przez AI. No to pytam AI, a ona odpowiada:

    Możesz nazwać kategorię związana z obrazami generowanymi przez sztuczną inteligencję w blogu różnymi kreatywnymi i opisowymi nazwami. Oto kilka sugestii:

    „Sztuka Algorytmów” – podkreśla, że obrazy są rezultatem algorytmów generatywnych.

    „Wirtuozja Kodu” – nawiązanie do kreatywnego aspektu tworzenia poprzez kodowanie.

    „Pixelowe Wizje” – skupia się na generowaniu obrazów w cyfrowym środowisku pikselowym.

    „Algorytmiczna Paleta” – podkreśla, że używane są algorytmy do tworzenia różnorodnych obrazów.

    „Wizualne Bitwy Kodu” – sugestia, że proces generowania obrazów to pewna forma walki czy eksploracji w świecie kodu.

    „Generowane Obrazy: Sztuka Wirtualna” – akcentuje aspekt wirtualny i artystyczny generowanych obrazów.

    „Kodowanie Piękna” – łączy programowanie z aspektem estetycznym.

    „Wirtualna Kreatywność” – podkreśla kreatywny charakter generowanych obrazów w wirtualnym środowisku.

    „Eteryczne Algoritmy” – używa słowa „eteryczne” w kontekście abstrakcyjności i niematerialności generowanych obrazów.

    „Wizje Kodowane” – łączy pojęcie wizji z kodem jako narzędziem jej realizacji.

    Wybierz taką nazwę, która najlepiej oddaje charakter i atmosferę Twoich generowanych obrazów, a jednocześnie będzie zachęcała czytelników do odkrywania tej fascynującej dziedziny sztuki.

  20. basiaacappella Says:

    Zaiste, fascynujące… 🙄 😆 😥

    A ja i tak (wcześniej! 😛 ) nazwałam kategorię po mojemu – pogwarki z AI a mogłam jeszcze lepiej, np: strużynki geniuszu AI lub cóś w podobie… 🙄

    Kategoria jest na razie dwuelementowa, ale gdyby się miała rozróść – lepiej mieć te wykwity geniuszu ludzko-maszynowego w kupie… O!

    https://basiaacappella.wordpress.com/category/pogwarki-z-ai/

    …I że zarost zawsze musi być… nerdy jedne, zbajasowane… 😛 😛 😛

    😉 😈

  21. pak4 Says:

    No… ja się bawię, ale generalnie, to czekamy na okazję do rozrostu wycieczek 😉

    W ramach zadatku — „Łasiczka na wycieczce w górach z plecakiem” — z różnymi dodatkami stylu:

  22. basiaacappella Says:

    Faaantastyczne – bajki już mógłby Szanowny ilustrować… 😎 ❗ 😀 ❗ 😎

  23. pak4 Says:

    Basia zadała pytanie o oleodruk z aniołem stróżem, chroniącym dzieci, bawiące się wstążką.

    Dodałem, że anioł stróż ma być polski:

    Chyba niezbyt zrozumiała gramatykę, bo to anioł stróż bawi się, a nie opiekuje… A tu w ogóle…

    Doprecyzowywanie skończyło się brązownictwem…

  24. basiaacappella Says:

    Te pomysły…
    Lecz najwyraźniej AI nie ma jeszcze w systemie polskiego (niekiedy lekko prerafaelickiego) anioła stróża nad rzeczką/strumyczkiem, gdzie chłopczyk z piłką a dziewczynka z czymś wstążko- czy skakankopodobnym… ślicznie odziani, ona obowiązkowo z kokardą we włosach… 🙄 😮 😀

  25. pak4 Says:

    Ja bym za ten chwyt nie dał dużo punktów aniołowi:

    Albo za ten:

    Tu jakoś sens zachowany:

  26. pak4 Says:

    A tu nie dość, że AI wypaczyła aniołowi twarz, to chyba jakąś alegorię pietyzmu zrobiła — inni giną, a ty się módl:

  27. basiaacappella Says:

    🙄 🙄 🙄 … … …

  28. pak4 Says:

    Próbowałem lepiej opisać scenę, choć AI ma trudność ze zrozumieniem, że to most jest dziurawy, a nie potok…

  29. pak4 Says:

    To 4 obrazki. Bo jakoś naszło mnie, przy lekturze „Pompei”, że chętnie bym sobie powyobrażał sceny mitologiczne. A potem na to przyszedł Monteverdi. No i zadałem pytanie AI, czy nie wygenerowałaby pojedynku Tankreda z Kloryndą.

    Zaraz… czy nie są tu oni oboje na jednym koniu? Choć cielesności są tu w ogóle dziwaczne (patrz dolny, lewy róg):

    Po dodaniu, że Klorynda to Saracenka, wygenerowało mi to…

    PS.
    A Kolega pasjonuje się rowerami typu Penny Farthing, nawet ogląda ofertę (noale taki rower to prawie 20 tys. PLN…), więc poprosiłem AI o grecką boginię na takim rowerze. Jak widać, boginie mają rowery bez pedałów:

  30. basiaacappella Says:

    Powyobrażał… ❓ …AI poszerza(łabyż) wyobraźnię?… 😮

    😆 😎 😆

  31. pak4 Says:

    Poprosiłem AI o „wiszące ogrody Semiramidy” (w nawiązaniu do lektury rozdziału z „Siedmiu cudów świata” Romerów):

    AI rywalizuje na wyobraźnię z Koledeweyem, trzeba jej przyznać…

  32. basiaacappella Says:

    Taaakkk… 😎 😎 😎

    https://pl.wikipedia.org/wiki/Wiszące_ogrody_Semiramidy

    A te odczyty wieczorno-poranne wzięły się stąd, iż w od-oglądaniach „80-ciu ogrodów” Monty Dona [ #Around the World in 80 Gardens yt] wczoraj byłam w Bangkoku, Singapurze i na Bali…

    A dziś…

  33. pak4 Says:

    Polskie stroje góralskie by AI:

  34. pak4 Says:

    Poprosiłem AI o klocko-legowe wersje obrazów:

    (Matejki, patrz wyżej, nie zna. Ale z Velasquezem miała też problemy O_O)

  35. basiaacappella Says:

    Pięęękne (dawno się tak nie uśmiałem przed ekranem, jak wczoraj, zobaczywszy 😀 )
    Nb, czytamy właśnie „Życie po duńsku” Helen Russell i jest tam bohater Ludzik Lego (przechrzczony przeze mnie na Ludwik Lego)… Zatem wszystko się składa… — wyśmienicie!!! 😉 😀 😎

  36. pak4 Says:

  37. pak4 Says:

  38. pak4 Says:

    Poprosiłem AI o Twardowskiego, na kogucie, lecącego na Księżyc:

    Spodobało mi się, to wysłałem Twardowskiego na Jowisza:

    Natomiast idea pokazania ducha Barbary Radziwiłłówny Zygmuntowi Augustowi przez Twardowskiego napotkała pewne trudności…

    Z innej beczki — poprosiłem o Beatlesów u króla Ćwieczka:

  39. basiaacappella Says:

    Jak dla mnie oczywiście bezkonkurencyjny słoń w clematisach… 😆 😆 😆

  40. pak4 Says:

    Poprosiłem AI o polski pancernik. Że wyszło nudno, to poprosiłem o polski pancernik pod pędzlem Rubensa i szczena mi opadła:

  41. basiaacappella Says:

    W istocie szczena opada… 😮

    🙄

Dodaj komentarz