Dzięki nowemu modelowi AI firmy Stability AI, tworzenie muzyki oraz efektów dźwiękowych, stanie się znacznie prostsze. Narzędzie o nazwie Stable Audio, jest w stanie generować je na podstawie dostarczonego opisu.
Muzyka oraz efekty dźwiękowe to niezwykle ważny element filmu lub gry, który pomaga stworzyć odpowiedni klimat. Producenci dbają więc o to, aby były dopasowane do toczących się na ekranie wydarzeń, co nie jest łatwe. Firma Stability AI opracowała jednak nowy model SI o nazwie Stable Audio, który znacznie to ułatwi. Umożliwia generowanie muzyki oraz efektów dźwiękowych na podstawie tekstowego opisu.
Stable Audio, opracowane wspólnie przez Stability AI oraz firmę Harmonai, może zrewolucjonizować proces tworzenia ścieżki dźwiękowej do filmów i seriali, nie tylko go przyspieszając, ale również obniżając koszty. Technologia nie tylko oferuje wysoką jakość dostarczanych dźwięków, znacznie lepszą w porównaniu do wcześniejszych generatorów audio wykorzystujących AI, ale też jest w stanie lepiej dopasować je do określonych potrzeb.
Na oficjalnej stronie firmy, możemy znaleźć próbki przygotowanej w ten sposób muzyki oraz efektów dźwiękowych. Wśród nich są m.in. odgłosy zatłoczonej restauracji, a także głos pilota mówiącego przez interkom, które brzmią bardzo realistycznie.
Producent twierdzi, że dzięki współpracy z firmą AudioSparx, w czasie szkolenia modelu, dostarczono mu ponad 800 tys. próbek audio zawierających muzykę, efekty dźwiękowe oraz ścieżki pojedynczych instrumentów, a także odpowiadające im metadane. Dzięki temu technologia doskonale wie, jak naśladować określone dźwięki, ponieważ zostały powiązane z ich opisami tekstowymi w sieci neuronowej.
Sztuczna inteligencja potrafi nie tylko generować szeroką gamę dźwięków, ale też robi to bardzo szybko. Według producenta, renderowanie 95 sekund dźwięku stereo, przy częstotliwości próbkowania 44,1 kHz zapewniającej jakość CD, na procesorze Nvidia A100 zajmuje zaledwie jedną sekundę.
Producent twierdzi, że Stable Audio będzie dostępne dla użytkowników za darmo, z ograniczonymi funkcjami, a także w wersji Pro kosztującej 12 dolarów miesięcznie. Pierwszy wariant umożliwi wygenerowanie jedynie 20 ścieżek miesięcznie, każda o maksymalnej długości 20 sekund. Subskrypcja pozwala wygenerować do 500 utworów, trwających do 90 sekund.
Nowa technologia może więc znacznie skrócić czas potrzebny na przygotowanie efektów dźwiękowych do filmu lub audiobooka, w porównaniu z dotychczas stosowanymi rozwiązaniami. Nie oznacza to oczywiście, że muzycy, którzy zajmują się tworzeniem ścieżek dźwiękowych w dużych produkcjach, będą musieli poszukać nowego zajęcia, gdyż człowiek nadal wykona to lepiej. Z pewnością przyda się natomiast w mniejszych projektach z ograniczonym budżetem, których producentów nie stać na zatrudnienie muzyków. Nie tylko obniży koszty, ale także skróci czas potrzebny na ich realizację.
0

Autor: Marek Pluta
Od lat związany z serwisami internetowymi zajmującymi się tematyką gier oraz nowoczesnych technologii. Przez wiele lat współpracował m.in. z portalami Onet i Wirtualna Polska, a także innymi serwisami oraz czasopismami, gdzie zajmował się m.in. pisaniem newsów i recenzowaniem popularnych gier, jak również testowaniem najnowszych akcesoriów komputerowych. Wolne chwile lubi spędzać na rowerze, zaś podczas złej pogody rozrywkę zapewnia mu dobra książka z gatunku sci-fi. Do jego ulubionych gatunków należą strzelanki oraz produkcje MMO.