AI, Discord i krótki tekst - tylko tyle potrzebujesz do tworzenia naprawdę zdumiewających materiałów wideo. Umożliwia to oparty na sztucznej inteligencji bot Runway-Gen 2, który właśnie znajduje się w fazie beta-testów.
Wielki bum na AI nieprzerwanie trwa, a jego możliwości z każdym dniem rosną. Pamiętacie przerażającą reklamę pizzerii? Wygląda na to, że funkcja text-to-video przykuwa coraz większą uwagę. Na podstawie krótkiego zapytania złożonego z kilku słów kluczowych jesteśmy w stanie stworzyć niewyczerpanie różnorodne materiały filmowe.
Wygenerowana jakiś czas temu w całości przez sztuczną inteligencję reklama Pepperoni Hugspot, choć wzbudza niepokój, to mimo wszystko wprawia także w zachwyt. Do stworzenia tego projektu wykorzystano narzędzia takie jak ChatGPT, Midjourney czy Eleven Labs. My dzisiaj skupimy się jednak na AI o nazwie Runway-Gen2, które tworzy ruchome obrazy na bazie zaledwie kilku słów kluczowych, dzięki zastosowaniu mechanizmu text-to-video.
O swojej przygodzie z publiczną betą Runway Gen-2 opowiada Avram Piltch z Tom’s Hardware. Dostęp do bota uzyskać można za pomocą serwera Discord Runway ML. Tak, do tworzenia materiałów filmowych w XXI wieku potrzebujecie tylko Discorda. O ile do serwera może dołączyć każdy, to niestety dostęp do samego programu jest póki co ograniczony. Lista oczekujących cały czas rośnie.

Wysyłając kilka słów tekstu do bota @Gen-2, byłem w stanie uzyskać krótkie, fotorealistyczne (lub kreskówkowe) klipy dosłownie wszystkiego, od rodziny cieszącej się kolacją z sushi, po robota z poważnym problemem alkoholowym. – opowiada Avram Plitch
Aby wygenerować wideo, musimy wydać polecenie dla bota. Redaktor poprosił AI o stworzenie filmu na podstawie fragmentu tekstu: "@Gen-2 Pijany humanoidalny robot, który patrzy w kamerę i wymiotuje małymi śrubkami z ust". Zaledwie chwilę później otrzymał kilkusekundowy materiał z pijanym robotem w roli głównej. Autor przyznał, że nie otrzymał dokładnie tego, o co prosił. Zabrakło m.in. wylatujących z ust robota śrubek.

Podczas zabawy z AI nie musimy poprzestawać na samym tekście. Do tworzenia filmików użytkownicy Runway-Gen 2 używają także różnego rodzaju grafiki, zdjęcia czy nawet innych materiałów wideo. Sztuczna inteligencja nie posłuży się tego typu źródłem bezpośrednio, ale wykorzysta go jako inspirację. Oznacza to, że kiedy wrzucimy fotografię konkretnej osoby, w końcowym projekcie nie pojawi się ona, tylko jej interpretacja.
Na wspomnianym wcześniej Discordzie nie brakuje również projektów opierających się o inne boty AI. Użytkownicy chwalą się m.in. filmikami stworzonymi na podstawie wcześniej wygenerowanych obrazów za pomocą Midjourney, Stable Diffusion czy CLIP Interrogator 2.1.

Jest jeszcze wiele kwestii, z którymi AI nie radzi sobie najlepiej podczas tworzenia filmów. Sztuczna inteligencja ma problemy z odtwarzaniem konkretnych osób, miejsc, produktów czy marek. Kiedy Avram Plitch poprosił o boksujących się ze sobą kultowych Mario i Luigi albo o Godzillę, otrzymał zaledwie ich marne podróbki.
Ciężko jest też uzyskać zadowalający poziom ruchu w klipach. Postacie i inne elementy w większości materiałów są dosyć mocno statyczne. Kluczem do sukcesu jest szczegółowość – im więcej danych dostarczymy botowi, tym bardziej adekwatny obraz otrzymamy. Wciąż jednak wiele brakuje do ideału narzędziom takim jak Runway.
Z całą pewnością Runway Gen-2 jest dobrym narzędziem dla fanów absurdu i surrealizmu. Jeśli jesteście ciekawi, jak prezentuje się kreatywność AI w pełnej krasie, to warto zajrzeć na YouTube lub Twittera, gdzie wielu użytkowników Runway-Gen 2 dzieli się swoimi wynikami.
Więcej:Czasem cztery koła, czasem dziesięć; internauci policzyli błędy w reklamie AI Coca-Coli
3

Autor: Sandra Kicińska
Współpracę z GRYOnline.pl rozpoczęła w listopadzie 2021 roku jako autorka newsów. Obecnie redaguje teksty w dziale Sales, od czasu do czasu pisząc dla newsroomu technologicznego. Wcześniej zajmowała się copywritingiem i tworzeniem tekstów popularnonaukowych. Po raz pierwszy do komputera dorwała się w wieku zaledwie trzech lat. Parę lat później, po zanurzeniu się w magiczny świat książek, pojawiła się u niej również fascynacja słowem pisanym. Do jej ulubionych gatunków gier należą różnego rodzaju strategie, symulatory oraz RPG. Poza tym uwielbia literaturę piękną, filozofię, surrealizm, anime i czarny humor. Po godzinach trenuje kontorsję, redefiniując ograniczenia ludzkiego ciała.