System generowania obrazów na podstawie tekstowego opisu już działa. To jednocześnie bawi, przeraża i rodzi pytania.
O systemie Dall-E słyszymy od jakiegoś czasu i w końcu dostaliśmy do rąk testową wersję programu. Każdy może sam ją wypróbować. Wystarczy wejść na stronę i znać absolutne podstawy angielskiego. Po wpisaniu w pole tekstowe naszego opisu strona będzie myślała jakieś 30-40 sekund, a potem wyrzuci nam dziewięć obrazków.
Oczywiście pierwsze eksperymenty, jakie poczyniliśmy w redakcji były przede wszystkim zabawne i duża część z nich nie nadaje się do pokazywania publicznie. Co zrobić, jesteśmy tylko ludźmi. Ja na przykład zacząłem od wpisania frazy: „putin on the bear in the woods”. Obrazki wyglądają jak halucynacje po zażyciu substancji powstałej w wyniku nieudanego eksperymentu gdzieś pod Solikamskiem.

Później zaczęły się eksperymenty z popkulturą i znanymi stylami graficznymi. Kolega Maciek wygenerował twarz Geralta z Rivii w jakichś siedemnastu różnych wariantach. Twarze produkowane przez Dall-E sprawiają wrażenie jak coś, co mogłoby wywołać u sześciolatka koszmary senne. Za to program potrafi tworzyć bardzo ładne kompozycje, jeśli użyjemy frazy „Beksinski style”. Tak wyglądają potraktowane w ten sposób Gwiezdne wojny:

Poważne testy wymagają jednak poważnego podejścia. Postanowiłem sprawdzić, jak algorytm poradzi sobie z rosnącą liczbą szczegółów w opisie. Dlatego wygenerowałem po kolei sześć następujących opisów.
Jak widzicie, kontrolnie w numerze 4 zrezygnowałem ze słów „japońska akwarela”, żeby sprawdzić, jaki wpływ mają one na generowaną grafikę. Wtedy z jakiegoś powodu na grafice pojawiła się trawa i żółte kwiaty.
To ciekawe, słowo „japoński” sprawiło, że pierwszy wygenerowany pies to akita. Dodanie słowa pinczer wiele zmienia i faktycznie od drugiego obrazka zaczynamy dostawać na obrazkach kopię mojej Szyszki jak żywą. Na piątym obrazku, gdy w opisie pojawia się słowo kość styl także się zmienia. Nasz piesek zaczyna przypominać od tego momentu faktycznie starojapońskie malowidło z dodatkowym napisem obok samego zwierzaka.
Co interesujące, określenie rozmiaru kości znowu doprowadziło do zmiany stylu. Za to kość faktycznie stała się duża.
Oczywiście możemy wypróbować też małego czarnego pinczera w stylu Beksińskiego, efekt jest co najmniej niepokojący, ale dokładnie takie były prace polskiego artysty, więc chyba o to chodzi, prawda? Zwłaszcza kiedy uświadomimy sobie, że ten obrazek został stworzony przez matematyczną formułkę, która przekopała się przez wyniki Google’a i skleiła piksele w to, co jak jej się wydaje jest pieskiem.

Doskonale widzimy, że efekty pracy wersji pokazowej to jeszcze nie jest poziom profesjonalny. Dall-E jeszcze nie zastąpi profesjonalnego grafika, tworzącego storyboardy do następnego hitu Marvela. Przy czym „jeszcze” to słowo klucz, a nasze wczorajsze zabawy w redakcji to element większego planu. Miliony ludzi będą teraz przez parę tygodni bawić się programem, tworzyć różne dziwaczne obrazki, a algorytm będzie zbierał doświadczenie.

Szkolenie sztucznej inteligencji potrafi zająć czas i wymaga wiele informacji. Nic nie jest w stanie dostarczyć jej tyle co internet i internauci, a my właśnie weszliśmy w kolejną fazę. Teraz twórcy Dall-E i innych podobnych programów nie tylko karmią swoje AI danymi z sieci, ale także informacjami o naszych reakcjach. Który z wygenerowanych obrazków użytkownik powiększył? Który zapisał na dysku? Który wrzucił do sieci społecznościowej? Ile było like’ów? Algorytm nie wie, co nam się podoba, ale może się dowiedzieć i zapamiętać.
Nie zdziwiłbym się, gdybyśmy teraz pobawili się tym systemem dwa-trzy tygodnie, potem zapomnieli o nim, a za cztery lata zobaczymy w wiadomościach fake-newsa opartego na zdjęciu wygenerowanym na podstawie pisemnego opisu. Najważniejsze pytanie brzmi, czy wtedy będziemy wiedzieli, że to grafika, generowana przez SI?
17

Autor: Marcin Strzyżewski
W GRYOnline.pl zaczynał w dziale publicystyki, później był kierownikiem działu technologii, co obejmowało zarówno newsy oraz publicystykę, jak i kanał tvtech. Wcześniej pracował w wielu miejscach, m.in. w redakcji portalu Onet. Z wykształcenia rusycysta. Od lat planuje, żeby wrócić do nurkowania, ale na razie jest zajęty głównie psem, królikiem i kanałem youtube’owym, na którym opowiada o krajach byłego ZSRR.