Technologie Tanie i polecane Porady PC Windows Konsole Telefony Technika
Wiadomość sprzęt i soft 24 czerwca 2022, 10:51

Sztuczna inteligencja narysowała mi Putina z niedźwiedziem w lesie

System generowania obrazów na podstawie tekstowego opisu już działa. To jednocześnie bawi, przeraża i rodzi pytania.

O systemie Dall-E słyszymy od jakiegoś czasu i w końcu dostaliśmy do rąk testową wersję programu. Każdy może sam ją wypróbować. Wystarczy wejść na stronę i znać absolutne podstawy angielskiego. Po wpisaniu w pole tekstowe naszego opisu strona będzie myślała jakieś 30-40 sekund, a potem wyrzuci nam dziewięć obrazków.

Oczywiście pierwsze eksperymenty, jakie poczyniliśmy w redakcji były przede wszystkim zabawne i duża część z nich nie nadaje się do pokazywania publicznie. Co zrobić, jesteśmy tylko ludźmi. Ja na przykład zacząłem od wpisania frazy: „putin on the bear in the woods”. Obrazki wyglądają jak halucynacje po zażyciu substancji powstałej w wyniku nieudanego eksperymentu gdzieś pod Solikamskiem.

Sztuczna inteligencja narysowała mi Putina z niedźwiedziem w lesie - ilustracja #1
To wygląda naprawdę źle

Później zaczęły się eksperymenty z popkulturą i znanymi stylami graficznymi. Kolega Maciek wygenerował twarz Geralta z Rivii w jakichś siedemnastu różnych wariantach. Twarze produkowane przez Dall-E sprawiają wrażenie jak coś, co mogłoby wywołać u sześciolatka koszmary senne. Za to program potrafi tworzyć bardzo ładne kompozycje, jeśli użyjemy frazy „Beksinski style”. Tak wyglądają potraktowane w ten sposób Gwiezdne wojny:

Sztuczna inteligencja narysowała mi Putina z niedźwiedziem w lesie - ilustracja #2
Poszedłbym do kina na taki film.

Poważne testy wymagają jednak poważnego podejścia. Postanowiłem sprawdzić, jak algorytm poradzi sobie z rosnącą liczbą szczegółów w opisie. Dlatego wygenerowałem po kolei sześć następujących opisów.

  1. Japanese watercolor dog
  2. Japanese watercolor small black pintscher dog
  3. Japanese watercolor small black pintscher dog sitting on the floor
  4. Small black pintscher dog sitting on the floor
  5. Japanese watercolor small black pintscher dog sitting on the floor with bone
  6. Japanese watercolor small black pintscher dog sitting on the floor with huge bone

Jak widzicie, kontrolnie w numerze 4 zrezygnowałem ze słów „japońska akwarela”, żeby sprawdzić, jaki wpływ mają one na generowaną grafikę. Wtedy z jakiegoś powodu na grafice pojawiła się trawa i żółte kwiaty.

Obrazki ułożone są od góry i od lewej do prawej

To ciekawe, słowo „japoński” sprawiło, że pierwszy wygenerowany pies to akita. Dodanie słowa pinczer wiele zmienia i faktycznie od drugiego obrazka zaczynamy dostawać na obrazkach kopię mojej Szyszki jak żywą. Na piątym obrazku, gdy w opisie pojawia się słowo kość styl także się zmienia. Nasz piesek zaczyna przypominać od tego momentu faktycznie starojapońskie malowidło z dodatkowym napisem obok samego zwierzaka.

Co interesujące, określenie rozmiaru kości znowu doprowadziło do zmiany stylu. Za to kość faktycznie stała się duża.

Oczywiście możemy wypróbować też małego czarnego pinczera w stylu Beksińskiego, efekt jest co najmniej niepokojący, ale dokładnie takie były prace polskiego artysty, więc chyba o to chodzi, prawda? Zwłaszcza kiedy uświadomimy sobie, że ten obrazek został stworzony przez matematyczną formułkę, która przekopała się przez wyniki Google’a i skleiła piksele w to, co jak jej się wydaje jest pieskiem.

Sztuczna inteligencja narysowała mi Putina z niedźwiedziem w lesie - ilustracja #4
Pinczer Beksińskiego nie urwie Ci głowy, będzie za to patrzył na Ciebie bez ruchu tak długo, aż stracisz zmysły.

Doskonale widzimy, że efekty pracy wersji pokazowej to jeszcze nie jest poziom profesjonalny. Dall-E jeszcze nie zastąpi profesjonalnego grafika, tworzącego storyboardy do następnego hitu Marvela. Przy czym „jeszcze” to słowo klucz, a nasze wczorajsze zabawy w redakcji to element większego planu. Miliony ludzi będą teraz przez parę tygodni bawić się programem, tworzyć różne dziwaczne obrazki, a algorytm będzie zbierał doświadczenie.

Sztuczna inteligencja narysowała mi Putina z niedźwiedziem w lesie - ilustracja #5
To jeszcze nie jest poziom profesjonalny.

Szkolenie sztucznej inteligencji potrafi zająć czas i wymaga wiele informacji. Nic nie jest w stanie dostarczyć jej tyle co internet i internauci, a my właśnie weszliśmy w kolejną fazę. Teraz twórcy Dall-E i innych podobnych programów nie tylko karmią swoje AI danymi z sieci, ale także informacjami o naszych reakcjach. Który z wygenerowanych obrazków użytkownik powiększył? Który zapisał na dysku? Który wrzucił do sieci społecznościowej? Ile było like’ów? Algorytm nie wie, co nam się podoba, ale może się dowiedzieć i zapamiętać.

Nie zdziwiłbym się, gdybyśmy teraz pobawili się tym systemem dwa-trzy tygodnie, potem zapomnieli o nim, a za cztery lata zobaczymy w wiadomościach fake-newsa opartego na zdjęciu wygenerowanym na podstawie pisemnego opisu. Najważniejsze pytanie brzmi, czy wtedy będziemy wiedzieli, że to grafika, generowana przez SI?