Nie tylko obrazy i tekst, AI generuje też muzykę

Sztuczna inteligencja zaczyna coraz lepiej radzić sobie z tworzeniem treści. Nie ogranicza się jednak do generowania obrazów, artykułów oraz książek. Zaczyna bowiem także produkować muzykę.

futurebeat.pl

Marek Pluta

Nie tylko obrazy i tekst, AI generuje też muzykę, źródło grafiki: Unsplash | Possessed Photography.
Nie tylko obrazy i tekst, AI generuje też muzykę Źródło: Unsplash | Possessed Photography.

Przyzwyczailiśmy się już do tego, że sztuczna inteligencja potrafi tworzyć obrazy i staje się w tym coraz lepsza. Jej możliwości w zakresie tworzenia treści stają się jednak coraz szersze, gdyż okazuje się, że może również generować muzykę.

Na pomysł przekształcenia AI w kompozytora muzyki wpadli Seth Forsgren i Hayk Martiros, którzy do nowego zadania dostosowali algorytm Stable Diffusion, tworząc własne narzędzie o nazwie Riffusion. Działa ono na zbliżonej zasadzie jak wspomniany Stable Diffusion, generując treść na podstawie opisu tekstowego. Algorym przeszkolono jednak w zakresie obsługi spektogramu, czyli wizualizacji sygnału dźwiękowego.

Riffusion wykorzystuje algorytm wizualny Stable Diffusion w wersji 1.5 bez żadnych dodatkowych modyfikacji. Pomysłodawcy jedynie trochę go dostroili, aby lepiej przetwarzał obrazy spektrogramów audio w połączeniu z tekstem.

Po wygenerowaniu nowego spektrogramu Riffusion zamienia obraz na dźwięk, wykorzystując w tym celu Torchadio. Algorytm przeszkolono za pomocą spektrogramów przedstawiających dźwięki oraz piosenki należące do różnych gatunków muzycznych, co pozwala mu generowanie nowych klipów audio na podstawie wszelkiego rodzaju podpowiedzi tekstowych.

Nie tylko obrazy i tekst, AI generuje też muzykę - ilustracja #1
Źródło: Riffusion

AI kompozytorem muzyki

Po dopracowaniu pomysłu, twórcy połączyli wszystkie jego elementy w interaktywną aplikację internetową, którą każdy może wypróbować. Riffusion po wpisaniu opisu tekstowego zaczyna w czasie rzeczywistym generować nieskończoną zawartość, jednocześnie wizualizując oś czasu spektrogramu w 3D.

Nie tylko obrazy i tekst, AI generuje też muzykę - ilustracja #2
Źródło: Riffusion

Gdybyście również chcielibyście sprawdzić się w roli kompozytora wykorzystującego AI, to zapraszam na stronę narzędzia. Znajdziecie tam również kilka próbek audio stworzonych przez sztuczną inteligencję, które o dziwno brzmią całkiem nieźle i gdybyśmy nie wiedzieli, że stworzył je algorytm, można by pomyśleć, że są dziełem człowieka. W komentarzach możecie natomiast podzielić się własnymi wrażeniami z testów opisanego algorytmu.

Podobało się?

2

Marek Pluta

Autor: Marek Pluta

Od lat związany z serwisami internetowymi zajmującymi się tematyką gier oraz nowoczesnych technologii. Przez wiele lat współpracował m.in. z portalami Onet i Wirtualna Polska, a także innymi serwisami oraz czasopismami, gdzie zajmował się m.in. pisaniem newsów i recenzowaniem popularnych gier, jak również testowaniem najnowszych akcesoriów komputerowych. Wolne chwile lubi spędzać na rowerze, zaś podczas złej pogody rozrywkę zapewnia mu dobra książka z gatunku sci-fi. Do jego ulubionych gatunków należą strzelanki oraz produkcje MMO.

Kalendarz Wiadomości

Nie
Pon
Wto
Śro
Czw
Pią
Sob

GRYOnline.pl:

Facebook GRYOnline.pl Instagram GRYOnline.pl X GRYOnline.pl Discord GRYOnline.pl TikTok GRYOnline.pl Podcast GRYOnline.pl WhatsApp GRYOnline.pl LinkedIn GRYOnline.pl Forum GRYOnline.pl

tvgry.pl:

YouTube tvgry.pl TikTok tvgry.pl Instagram tvgry.pl Discord tvgry.pl Facebook tvgry.pl