Sztuczna inteligencja narysowała mi Putina z niedźwiedziem w lesie

System generowania obrazów na podstawie tekstowego opisu już działa. To jednocześnie bawi, przeraża i rodzi pytania.

tech

Marcin Strzyżewski24 czerwca 2022

O systemie Dall-E słyszymy od jakiegoś czasu i w końcu dostaliśmy do rąk testową wersję programu. Każdy może sam ją wypróbować. Wystarczy wejść na stronę i znać absolutne podstawy angielskiego. Po wpisaniu w pole tekstowe naszego opisu strona będzie myślała jakieś 30-40 sekund, a potem wyrzuci nam dziewięć obrazków.

Oczywiście pierwsze eksperymenty, jakie poczyniliśmy w redakcji były przede wszystkim zabawne i duża część z nich nie nadaje się do pokazywania publicznie. Co zrobić, jesteśmy tylko ludźmi. Ja na przykład zacząłem od wpisania frazy: „putin on the bear in the woods”. Obrazki wyglądają jak halucynacje po zażyciu substancji powstałej w wyniku nieudanego eksperymentu gdzieś pod Solikamskiem.

Sztuczna inteligencja narysowała mi Putina z niedźwiedziem w lesie - ilustracja #1

To wygląda naprawdę źle

Później zaczęły się eksperymenty z popkulturą i znanymi stylami graficznymi. Kolega Maciek wygenerował twarz Geralta z Rivii w jakichś siedemnastu różnych wariantach. Twarze produkowane przez Dall-E sprawiają wrażenie jak coś, co mogłoby wywołać u sześciolatka koszmary senne. Za to program potrafi tworzyć bardzo ładne kompozycje, jeśli użyjemy frazy „Beksinski style”. Tak wyglądają potraktowane w ten sposób Gwiezdne wojny:

Sztuczna inteligencja narysowała mi Putina z niedźwiedziem w lesie - ilustracja #2

Poszedłbym do kina na taki film.

Poważne testy wymagają jednak poważnego podejścia. Postanowiłem sprawdzić, jak algorytm poradzi sobie z rosnącą liczbą szczegółów w opisie. Dlatego wygenerowałem po kolei sześć następujących opisów.

Japanese watercolor dog
Japanese watercolor small black pintscher dog
Japanese watercolor small black pintscher dog sitting on the floor
Small black pintscher dog sitting on the floor
Japanese watercolor small black pintscher dog sitting on the floor with bone
Japanese watercolor small black pintscher dog sitting on the floor with huge bone

Jak widzicie, kontrolnie w numerze 4 zrezygnowałem ze słów „japońska akwarela”, żeby sprawdzić, jaki wpływ mają one na generowaną grafikę. Wtedy z jakiegoś powodu na grafice pojawiła się trawa i żółte kwiaty.

Obrazki ułożone są od góry i od lewej do prawej

To ciekawe, słowo „japoński” sprawiło, że pierwszy wygenerowany pies to akita. Dodanie słowa pinczer wiele zmienia i faktycznie od drugiego obrazka zaczynamy dostawać na obrazkach kopię mojej Szyszki jak żywą. Na piątym obrazku, gdy w opisie pojawia się słowo kość styl także się zmienia. Nasz piesek zaczyna przypominać od tego momentu faktycznie starojapońskie malowidło z dodatkowym napisem obok samego zwierzaka.

Co interesujące, określenie rozmiaru kości znowu doprowadziło do zmiany stylu. Za to kość faktycznie stała się duża.

Oczywiście możemy wypróbować też małego czarnego pinczera w stylu Beksińskiego, efekt jest co najmniej niepokojący, ale dokładnie takie były prace polskiego artysty, więc chyba o to chodzi, prawda? Zwłaszcza kiedy uświadomimy sobie, że ten obrazek został stworzony przez matematyczną formułkę, która przekopała się przez wyniki Google’a i skleiła piksele w to, co jak jej się wydaje jest pieskiem.

Sztuczna inteligencja narysowała mi Putina z niedźwiedziem w lesie - ilustracja #4

Pinczer Beksińskiego nie urwie Ci głowy, będzie za to patrzył na Ciebie bez ruchu tak długo, aż stracisz zmysły.

Doskonale widzimy, że efekty pracy wersji pokazowej to jeszcze nie jest poziom profesjonalny. Dall-E jeszcze nie zastąpi profesjonalnego grafika, tworzącego storyboardy do następnego hitu Marvela. Przy czym „jeszcze” to słowo klucz, a nasze wczorajsze zabawy w redakcji to element większego planu. Miliony ludzi będą teraz przez parę tygodni bawić się programem, tworzyć różne dziwaczne obrazki, a algorytm będzie zbierał doświadczenie.

Sztuczna inteligencja narysowała mi Putina z niedźwiedziem w lesie - ilustracja #5

To jeszcze nie jest poziom profesjonalny.

Szkolenie sztucznej inteligencji potrafi zająć czas i wymaga wiele informacji. Nic nie jest w stanie dostarczyć jej tyle co internet i internauci, a my właśnie weszliśmy w kolejną fazę. Teraz twórcy Dall-E i innych podobnych programów nie tylko karmią swoje AI danymi z sieci, ale także informacjami o naszych reakcjach. Który z wygenerowanych obrazków użytkownik powiększył? Który zapisał na dysku? Który wrzucił do sieci społecznościowej? Ile było like’ów? Algorytm nie wie, co nam się podoba, ale może się dowiedzieć i zapamiętać.

Nie zdziwiłbym się, gdybyśmy teraz pobawili się tym systemem dwa-trzy tygodnie, potem zapomnieli o nim, a za cztery lata zobaczymy w wiadomościach fake-newsa opartego na zdjęciu wygenerowanym na podstawie pisemnego opisu. Najważniejsze pytanie brzmi, czy wtedy będziemy wiedzieli, że to grafika, generowana przez SI?

Czytaj więcej:Zakładka Mapy znika z wyszukiwarki Google. Technologiczny gigant wywiązuje się z nakazów UE

POWIĄZANE TEMATY: tech Internet AI / sztuczna inteligencja

Marcin Strzyżewski

W GRYOnline.pl zaczynał w dziale publicystyki, później był kierownikiem działu technologii, co obejmowało zarówno newsy oraz publicystykę, jak i kanał tvtech. Wcześniej pracował w wielu miejscach, m.in. w redakcji portalu Onet. Z wykształcenia rusycysta. Od lat planuje, żeby wrócić do nurkowania, ale na razie jest zajęty głównie psem, królikiem i kanałem youtube’owym, na którym opowiada o krajach byłego ZSRR.

Patrząc na cenę i specyfikację tego modelu, nie dziwi mnie, że Motorola jest królową smartfonów

ASUS ROG Ally dostał bardzo ważną aktualizację, nowa funkcja może dodać sporo klatek w grach

Nowe karty graficzne AMD użyją „wolnej” pamięci, to spore rozczarowanie

Lepsze celowanie w strzelankach: to powinieneś robić z każdym gamepadem

O co chodzi z darmowym dronem z Temu i dlaczego łatwiej znaleźć igłę w stogu siana