Meta wytrenowała swój nowy generator obrazów AI na podstawie miliarda postów na Facebooku i Instagramie
Meta zdradza szczegóły prac nad własnym generatorem obrazów AI. Spółka potwierdza, że do szkolenia narzędzia wykorzystała ponad miliard zdjęć, opublikowanych przez użytkowników Facebooka oraz Instagrama.

Amerykańska spółka Meta chwali się swoim własnym generatorem obrazów Meta AI. Jak wyjaśnia Nick Clegg, prezes ds. spraw globalnych, do przeszkolenia narzędzia wykorzystano gigantyczną liczbę zdjęć opublikowanych przez użytkowników Facebooka oraz Instagrama. Baza liczyła łącznie 1,1 mld fotografii, które pochodziły z publicznie dostępnych postów.
Meta AI przeszkolone na ponad miliardzie zdjęć
Do szkolenia generatorów AI wykorzystuje się istniejące już obrazy, więc firmy pracujące nad takimi narzędziami, muszą skądś je brać. Tego problemu nie ma jednak spółka Meta, która również pracuje nad podobnym narzędziem. Do jego szkolenia wykorzystano bowiem zdjęcia udostępniane przez użytkowników dwóch popularnych usług, mianowicie Facebooka oraz Instagrama.
Meta wyjaśnia, że wykorzystano łącznie 1,1 mld zdjęć, przy czym użyto wyłącznie fotografii publikowanych w publicznie dostępnych postach. Firma zapewnia, że starała się szanować prywatność swoich użytkowników, dlatego ze szkolenia wyłączono prywatne posty udostępniane tylko rodzinie oraz znajomym. Nie wykorzystywano również prywatnych czatów do szkolenia modeli, a także podjęto kroki w celu odfiltrowania prywatnych danych z publicznych zbiorów danych, które użyto do trenowania AI. Użytkownicy nie muszą więc martwić się tym, że elementy z ich osobistych zdjęć, mogą się kiedyś pojawić w generowanych obrazach.

Meta stworzyła własnego asystenta Meta AI, wykorzystując niestandardowy model oparty na potężnym modelu językowym Llama 2, który w lipcu tego roku udostępniono do komercyjnego użytku. Zastosowano także nowy model Emu, który generuje obrazy na podstawie podpowiedzi tekstowych. Gotowy produkt będzie w stanie generować tekst, dźwięk i obrazy, a dzięki współpracy z wyszukiwarką Bing firmy Microsoft, otrzyma dostęp do informacji w czasie rzeczywistym.
Sztuczna inteligencja stworzy obrazy, dźwięk i tekst
Opublikowane przez użytkowników posty, posłużyły do szkolenia Emu w zakresie elementów generowania obrazu w produkcie. Natomiast funkcje czatu opierały się na Llama 2, z dodanymi publicznie dostępnymi zbiorami danych z adnotacjami.

Oczywiście zadbano również o ograniczenia dotyczące tworzonych treści, a więc nie można m.in. generować fotorealistycznych obrazów osób publicznych. W planach jest również dodanie niewidocznego znaku wodnego, co ułatwi odróżnienie treści stworzonych przez ludzi, od materiałów generowanych przez AI. Bot jest odporny na typowe manipulacje obrazem, takie jak kadrowanie, zmiana kolorów (jasność, kontrast itp.), zrzuty ekranu i inne, więc ciężko będzie go usunąć.
Jeżeli chcecie poznać więcej szczegółów, dotyczących Meta AI, to zapraszam na oficjalną stronę nowego narzędzia. Na razie jest ono wciąż w fazie rozwoju i będzie można w pełni z niego korzystać dopiero za jakiś czas.