Sztuczna inteligencja narysowała mi Putina z niedźwiedziem w lesie
System generowania obrazów na podstawie tekstowego opisu już działa. To jednocześnie bawi, przeraża i rodzi pytania.

O systemie Dall-E słyszymy od jakiegoś czasu i w końcu dostaliśmy do rąk testową wersję programu. Każdy może sam ją wypróbować. Wystarczy wejść na stronę i znać absolutne podstawy angielskiego. Po wpisaniu w pole tekstowe naszego opisu strona będzie myślała jakieś 30-40 sekund, a potem wyrzuci nam dziewięć obrazków.
Oczywiście pierwsze eksperymenty, jakie poczyniliśmy w redakcji były przede wszystkim zabawne i duża część z nich nie nadaje się do pokazywania publicznie. Co zrobić, jesteśmy tylko ludźmi. Ja na przykład zacząłem od wpisania frazy: „putin on the bear in the woods”. Obrazki wyglądają jak halucynacje po zażyciu substancji powstałej w wyniku nieudanego eksperymentu gdzieś pod Solikamskiem.

Później zaczęły się eksperymenty z popkulturą i znanymi stylami graficznymi. Kolega Maciek wygenerował twarz Geralta z Rivii w jakichś siedemnastu różnych wariantach. Twarze produkowane przez Dall-E sprawiają wrażenie jak coś, co mogłoby wywołać u sześciolatka koszmary senne. Za to program potrafi tworzyć bardzo ładne kompozycje, jeśli użyjemy frazy „Beksinski style”. Tak wyglądają potraktowane w ten sposób Gwiezdne wojny:

Poważne testy wymagają jednak poważnego podejścia. Postanowiłem sprawdzić, jak algorytm poradzi sobie z rosnącą liczbą szczegółów w opisie. Dlatego wygenerowałem po kolei sześć następujących opisów.
- Japanese watercolor dog
- Japanese watercolor small black pintscher dog
- Japanese watercolor small black pintscher dog sitting on the floor
- Small black pintscher dog sitting on the floor
- Japanese watercolor small black pintscher dog sitting on the floor with bone
- Japanese watercolor small black pintscher dog sitting on the floor with huge bone
Jak widzicie, kontrolnie w numerze 4 zrezygnowałem ze słów „japońska akwarela”, żeby sprawdzić, jaki wpływ mają one na generowaną grafikę. Wtedy z jakiegoś powodu na grafice pojawiła się trawa i żółte kwiaty.
To ciekawe, słowo „japoński” sprawiło, że pierwszy wygenerowany pies to akita. Dodanie słowa pinczer wiele zmienia i faktycznie od drugiego obrazka zaczynamy dostawać na obrazkach kopię mojej Szyszki jak żywą. Na piątym obrazku, gdy w opisie pojawia się słowo kość styl także się zmienia. Nasz piesek zaczyna przypominać od tego momentu faktycznie starojapońskie malowidło z dodatkowym napisem obok samego zwierzaka.
Co interesujące, określenie rozmiaru kości znowu doprowadziło do zmiany stylu. Za to kość faktycznie stała się duża.
Oczywiście możemy wypróbować też małego czarnego pinczera w stylu Beksińskiego, efekt jest co najmniej niepokojący, ale dokładnie takie były prace polskiego artysty, więc chyba o to chodzi, prawda? Zwłaszcza kiedy uświadomimy sobie, że ten obrazek został stworzony przez matematyczną formułkę, która przekopała się przez wyniki Google’a i skleiła piksele w to, co jak jej się wydaje jest pieskiem.

Doskonale widzimy, że efekty pracy wersji pokazowej to jeszcze nie jest poziom profesjonalny. Dall-E jeszcze nie zastąpi profesjonalnego grafika, tworzącego storyboardy do następnego hitu Marvela. Przy czym „jeszcze” to słowo klucz, a nasze wczorajsze zabawy w redakcji to element większego planu. Miliony ludzi będą teraz przez parę tygodni bawić się programem, tworzyć różne dziwaczne obrazki, a algorytm będzie zbierał doświadczenie.

Szkolenie sztucznej inteligencji potrafi zająć czas i wymaga wiele informacji. Nic nie jest w stanie dostarczyć jej tyle co internet i internauci, a my właśnie weszliśmy w kolejną fazę. Teraz twórcy Dall-E i innych podobnych programów nie tylko karmią swoje AI danymi z sieci, ale także informacjami o naszych reakcjach. Który z wygenerowanych obrazków użytkownik powiększył? Który zapisał na dysku? Który wrzucił do sieci społecznościowej? Ile było like’ów? Algorytm nie wie, co nam się podoba, ale może się dowiedzieć i zapamiętać.
Nie zdziwiłbym się, gdybyśmy teraz pobawili się tym systemem dwa-trzy tygodnie, potem zapomnieli o nim, a za cztery lata zobaczymy w wiadomościach fake-newsa opartego na zdjęciu wygenerowanym na podstawie pisemnego opisu. Najważniejsze pytanie brzmi, czy wtedy będziemy wiedzieli, że to grafika, generowana przez SI?
Komentarze czytelników
MarshallPL44 Chorąży
DALL-E Mini jest open-source, więc nie ma mowy o sponsorowaniu.
-eca- Konsul

Dziękuję za pozytywne odp. Właśnie wróciłem po melanżach, kaca mam w ten pon. okropnego . Przegrałem 1500 w Sizzla Hot na bani - mogę się centralnie przyanać: Sztuczna inteligencja wygrała(oczywiście był wcześniej człowiek, który to poustawiał)
CJzSanAndreas Pretorianin

profilowe właśnie z tej aplikacji sobie ustawiłem
BartekTenMagik Senator

Słabe wam wyszło. Ja mam kolekcję swoich. Pośród nich taki: