AI Gemini ma nowy system generacji obrazków i wygląda nawet imponująco

Google zaprezentowało nowy model do generowania i edycji obrazów. Firma chwali się, że sztuczna inteligencja lepiej radzi sobie z zachowywaniem pewnych szczegółów.

futurebeat.pl

Zbigniew Woźnicki

AI Gemini ma nowy system generacji obrazków i wygląda nawet imponująco, źródło grafiki: GeminiAI.
AI Gemini ma nowy system generacji obrazków i wygląda nawet imponująco Źródło: GeminiAI.

Google DeepMind nie tylko zajmuje się generowaniem interaktywnych światów, ale odpowiada także za nowy model „nano banana”, z którego korzysta Gemini 2.5 Flash. Usprawnienie sztucznej inteligencji ma pomóc w generowaniu lepszych obrazów i w ich edycji. Wspomniano między innymi o zapamiętywaniu przez AI pewnych szczegółów, więc modyfikowanie zdjęć jest prostsze (vide Ars Technica).

Gemini 2.5 Flash ma ułatwić edycję zdjęć

Największym problemem podczas edycji zdjęć przy użyciu AI jest nieprzewidywalność. Nigdy nie wiemy, które elementy zostaną niepotrzebnie zmienione. Google chwali się, że model „nano banana” działa w sposób bardziej precyzyjny, a edycji poddawane są tylko te elementy, które chcemy. W ten sposób można na przykład zmienić całą stylistykę fotografii przy zachowaniu wyglądu danej osoby.

Dodatkowo Gemini 2.5 Flash ma być zdolne do łączenia kilku fotografii w jeden obraz. Jako przykład pokazano niepowiązane ze sobą zdjęcia kobiety i psa. Następnie wykorzystano prompt, nakazujący sztucznej inteligencji wygenerowanie obrazu, na którym kobieta przytula psa na boisku. Pokazuje to spore możliwości, jakie daje „nano banana”, chociaż prawdopodobnie są one zarezerwowane dla płatnych wersji modelu.

Każdy stworzony obraz ma znak wodny z symbolem Gemini AI w prawym dolnym rogu. Jak informuje Ars Technica, to jednak nie wszystko, bo system umieszcza również niewidzialny znak wodny SynthID, który nie znika nawet po znacznej edycji danego obrazu. Dlatego nie tak łatwo będzie udawać, że samodzielnie stworzyło się grafikę, podczas gdy realnie za całość odpowiada sztuczna inteligencja.

Nowy model jest dostępny do przetestowania już teraz, a wkrótce ma trafić w ręce deweloperów. Nie wszystko jednak możemy zrobić przy pomocy Gemini 2.5 Flash – np. edycja zdjęć przedstawiających dzieci jest obecnie zablokowana, przynajmniej na ten moment, ponieważ Google użyło sformułowania „currently”.

Podobało się?

2

Zbigniew Woźnicki

Autor: Zbigniew Woźnicki

Przygodę z publicystyką i pisaniem zaczął w serwisie Allegro, gdzie publikował newsy związane z grami, technologią oraz mediami społecznościowymi. Wkrótce zawitał na GRYOnline.pl i Filmomaniaka, pisząc o nowościach związanych z branżą filmową. Mimo związku z serialami, jego serce należy do gier wszelakiego typu. Żaden gatunek mu nie straszny, a przygoda z Tibią nauczyła go, że niebo i muzyka w grach są całkowicie zbędne. Przed laty dzielił się swoimi doświadczeniami, moderując forum mmorpg.org.pl. Uwielbia ponarzekać, ale oczywiście konstruktywnie i z umiarem. Na forum pisze pod ksywką Canaton.

Komentarze czytelników

Dodaj komentarz
Forum Technologiczne
2025-08-28
08:22

NightGeisha Generał

Ciekawe, aż sprawdzę.

Komentarz: NightGeisha
2025-08-28
08:14

Wronski Senator

Wronski

Wyglada jak model oparty na Flux'ie. Polecam to jednak robic offline.

Komentarz: Wronski
2025-08-27
15:31

JakisChlop Chorąży

😂

I dalej ten sam problem z dłońmi, więc wciąż czekamy na poprawę w tym aspekcie xD

Komentarz: JakisChlop

GRYOnline.pl:

Facebook GRYOnline.pl Instagram GRYOnline.pl X GRYOnline.pl Discord GRYOnline.pl TikTok GRYOnline.pl Podcast GRYOnline.pl WhatsApp GRYOnline.pl LinkedIn GRYOnline.pl Forum GRYOnline.pl

tvgry.pl:

YouTube tvgry.pl TikTok tvgry.pl Instagram tvgry.pl Discord tvgry.pl Facebook tvgry.pl