AI na Discordzie stworzy Ci dowolne wideo na podstawie tekstu

AI, Discord i krótki tekst - tylko tyle potrzebujesz do tworzenia naprawdę zdumiewających materiałów wideo. Umożliwia to oparty na sztucznej inteligencji bot Runway-Gen 2, który właśnie znajduje się w fazie beta-testów.

nauka
Sandra Kicińska8 maja 2023
3
Źrodło fot. Unsplash | ELLA DON
i

Wielki bum na AI nieprzerwanie trwa, a jego możliwości z każdym dniem rosną. Pamiętacie przerażającą reklamę pizzerii? Wygląda na to, że funkcja text-to-video przykuwa coraz większą uwagę. Na podstawie krótkiego zapytania złożonego z kilku słów kluczowych jesteśmy w stanie stworzyć niewyczerpanie różnorodne materiały filmowe.

W Runway-Gen 2 ogranicza cię tylko wyobraźnia

Wygenerowana jakiś czas temu w całości przez sztuczną inteligencję reklama Pepperoni Hugspot, choć wzbudza niepokój, to mimo wszystko wprawia także w zachwyt. Do stworzenia tego projektu wykorzystano narzędzia takie jak ChatGPT, Midjourney czy Eleven Labs. My dzisiaj skupimy się jednak na AI o nazwie Runway-Gen2, które tworzy ruchome obrazy na bazie zaledwie kilku słów kluczowych, dzięki zastosowaniu mechanizmu text-to-video.

Nie tylko reklama pizzerii, ale także pijane roboty

O swojej przygodzie z publiczną betą Runway Gen-2 opowiada Avram Piltch z Tom’s Hardware. Dostęp do bota uzyskać można za pomocą serwera Discord Runway ML. Tak, do tworzenia materiałów filmowych w XXI wieku potrzebujecie tylko Discorda. O ile do serwera może dołączyć każdy, to niestety dostęp do samego programu jest póki co ograniczony. Lista oczekujących cały czas rośnie.

AI na Discordzie stworzy Ci dowolne wideo na podstawie tekstu - ilustracja #1

Wysyłając kilka słów tekstu do bota @Gen-2, byłem w stanie uzyskać krótkie, fotorealistyczne (lub kreskówkowe) klipy dosłownie wszystkiego, od rodziny cieszącej się kolacją z sushi, po robota z poważnym problemem alkoholowym. – opowiada Avram Plitch

Aby wygenerować wideo, musimy wydać polecenie dla bota. Redaktor poprosił AI o stworzenie filmu na podstawie fragmentu tekstu: "@Gen-2 Pijany humanoidalny robot, który patrzy w kamerę i wymiotuje małymi śrubkami z ust". Zaledwie chwilę później otrzymał kilkusekundowy materiał z pijanym robotem w roli głównej. Autor przyznał, że nie otrzymał dokładnie tego, o co prosił. Zabrakło m.in. wylatujących z ust robota śrubek.

AI na Discordzie stworzy Ci dowolne wideo na podstawie tekstu - ilustracja #2
Tak wygląda interpretacja „pijanego robota” stworzona przez czatbot Runway-Gen 2. (Źródło: serwis Tom’s Hardware / Avram Piltch)

Do generowania wideo możemy użyć również grafik i innych narzędzi AI

Podczas zabawy z AI nie musimy poprzestawać na samym tekście. Do tworzenia filmików użytkownicy Runway-Gen 2 używają także różnego rodzaju grafiki, zdjęcia czy nawet innych materiałów wideo. Sztuczna inteligencja nie posłuży się tego typu źródłem bezpośrednio, ale wykorzysta go jako inspirację. Oznacza to, że kiedy wrzucimy fotografię konkretnej osoby, w końcowym projekcie nie pojawi się ona, tylko jej interpretacja.

Na wspomnianym wcześniej Discordzie nie brakuje również projektów opierających się o inne boty AI. Użytkownicy chwalą się m.in. filmikami stworzonymi na podstawie wcześniej wygenerowanych obrazów za pomocą Midjourney, Stable Diffusion czy CLIP Interrogator 2.1.

AI na Discordzie stworzy Ci dowolne wideo na podstawie tekstu - ilustracja #3
Proces tworzenia ruchomych obrazów na serwerze Discord Runway ML. (Źródło: serwis Tom’s Hardware / Avram Piltch)

Runway-Gen 2 – hit czy kit?

Jest jeszcze wiele kwestii, z którymi AI nie radzi sobie najlepiej podczas tworzenia filmów. Sztuczna inteligencja ma problemy z odtwarzaniem konkretnych osób, miejsc, produktów czy marek. Kiedy Avram Plitch poprosił o boksujących się ze sobą kultowych Mario i Luigi albo o Godzillę, otrzymał zaledwie ich marne podróbki.

Ciężko jest też uzyskać zadowalający poziom ruchu w klipach. Postacie i inne elementy w większości materiałów są dosyć mocno statyczne. Kluczem do sukcesu jest szczegółowość – im więcej danych dostarczymy botowi, tym bardziej adekwatny obraz otrzymamy. Wciąż jednak wiele brakuje do ideału narzędziom takim jak Runway.

Z całą pewnością Runway Gen-2 jest dobrym narzędziem dla fanów absurdu i surrealizmu. Jeśli jesteście ciekawi, jak prezentuje się kreatywność AI w pełnej krasie, to warto zajrzeć na YouTube lub Twittera, gdzie wielu użytkowników Runway-Gen 2 dzieli się swoimi wynikami.

Sandra Kicińska

Sandra Kicińska

Współpracę z GRYOnline.pl rozpoczęła w listopadzie 2021 roku jako autorka newsów. Obecnie redaguje teksty w dziale Paid Products, od czasu do czasu pisząc dla newsroomu technologicznego. Wcześniej zajmowała się copywritingiem i tworzeniem tekstów popularnonaukowych. Po raz pierwszy do komputera dorwała się w wieku zaledwie trzech lat. Parę lat później, po zanurzeniu się w magiczny świat książek, pojawiła się u niej również fascynacja słowem pisanym. Do jej ulubionych gatunków gier należą różnego rodzaju strategie, symulatory oraz RPG. Poza tym uwielbia literaturę piękną, filozofię, surrealizm, anime i czarny humor. Po godzinach trenuje kontorsję, redefiniując ograniczenia ludzkiego ciała.

Pozycja Google zagrożona? OpenAI planuje stworzyć własną wyszukiwarkę

Pozycja Google zagrożona? OpenAI planuje stworzyć własną wyszukiwarkę

Według Microsoftu 61 proc. pracowników w Polsce wykorzystuje AI w codziennej pracy

Według Microsoftu 61 proc. pracowników w Polsce wykorzystuje AI w codziennej pracy

Ex-flagowa Motorola w tej promocji to prawdopodobnie najbardziej opłacalny smartfon na świecie. Ona wręcz pożera konkurencję

Ex-flagowa Motorola w tej promocji to prawdopodobnie najbardziej opłacalny smartfon na świecie. Ona wręcz pożera konkurencję

Gracz spełnia marzenie o własnej kafejce internetowej; wspiera go społeczność i otrzymuje darowizny oraz kierownicę wyścigową w prezencie

Gracz spełnia marzenie o własnej kafejce internetowej; wspiera go społeczność i otrzymuje darowizny oraz kierownicę wyścigową w prezencie

To pierwszy głośnik Manty, który mnie zaskoczył (pozytywnie)

To pierwszy głośnik Manty, który mnie zaskoczył (pozytywnie)