futurebeat.pl News Tech Mobile Gaming Nauka Moto Rozrywka Promocje
Wiadomość sprzęt i soft 27 sierpnia 2025, 10:55

AI Gemini ma nowy system generacji obrazków i wygląda nawet imponująco

Google zaprezentowało nowy model do generowania i edycji obrazów. Firma chwali się, że sztuczna inteligencja lepiej radzi sobie z zachowywaniem pewnych szczegółów.

Źródło fot. GeminiAI
i

Google DeepMind nie tylko zajmuje się generowaniem interaktywnych światów, ale odpowiada także za nowy model „nano banana”, z którego korzysta Gemini 2.5 Flash. Usprawnienie sztucznej inteligencji ma pomóc w generowaniu lepszych obrazów i w ich edycji. Wspomniano między innymi o zapamiętywaniu przez AI pewnych szczegółów, więc modyfikowanie zdjęć jest prostsze (vide Ars Technica).

Gemini 2.5 Flash ma ułatwić edycję zdjęć

Największym problemem podczas edycji zdjęć przy użyciu AI jest nieprzewidywalność. Nigdy nie wiemy, które elementy zostaną niepotrzebnie zmienione. Google chwali się, że model „nano banana” działa w sposób bardziej precyzyjny, a edycji poddawane są tylko te elementy, które chcemy. W ten sposób można na przykład zmienić całą stylistykę fotografii przy zachowaniu wyglądu danej osoby.

Dodatkowo Gemini 2.5 Flash ma być zdolne do łączenia kilku fotografii w jeden obraz. Jako przykład pokazano niepowiązane ze sobą zdjęcia kobiety i psa. Następnie wykorzystano prompt, nakazujący sztucznej inteligencji wygenerowanie obrazu, na którym kobieta przytula psa na boisku. Pokazuje to spore możliwości, jakie daje „nano banana”, chociaż prawdopodobnie są one zarezerwowane dla płatnych wersji modelu.

Każdy stworzony obraz ma znak wodny z symbolem Gemini AI w prawym dolnym rogu. Jak informuje Ars Technica, to jednak nie wszystko, bo system umieszcza również niewidzialny znak wodny SynthID, który nie znika nawet po znacznej edycji danego obrazu. Dlatego nie tak łatwo będzie udawać, że samodzielnie stworzyło się grafikę, podczas gdy realnie za całość odpowiada sztuczna inteligencja.

Nowy model jest dostępny do przetestowania już teraz, a wkrótce ma trafić w ręce deweloperów. Nie wszystko jednak możemy zrobić przy pomocy Gemini 2.5 Flash – np. edycja zdjęć przedstawiających dzieci jest obecnie zablokowana, przynajmniej na ten moment, ponieważ Google użyło sformułowania „currently”.

Zbigniew Woźnicki

Zbigniew Woźnicki

Przygodę z publicystyką i pisaniem zaczął w serwisie Allegro, gdzie publikował newsy związane z grami, technologią oraz mediami społecznościowymi. Wkrótce zawitał na GRYOnline.pl i Filmomaniaka, pisząc o nowościach związanych z branżą filmową. Mimo związku z serialami, jego serce należy do gier wszelakiego typu. Żaden gatunek mu nie straszny, a przygoda z Tibią nauczyła go, że niebo i muzyka w grach są całkowicie zbędne. Przed laty dzielił się swoimi doświadczeniami, moderując forum mmorpg.org.pl. Uwielbia ponarzekać, ale oczywiście konstruktywnie i z umiarem. Na forum pisze pod ksywką Canaton.

więcej