ChatGPT generuje teraz obrazy jeszcze szybciej, ale wciąż brakuje mu dokładności oferowanej przez Gemini Nano Banana. Lider wyścigu AI zaczyna przegrywać z doganiającą go konkurencją.
Premiera modelu Gemini 3 sprawiła, że w OpenAI doszło do mobilizacji, a Sam Altman ogłosił „kod czerwony”. Ma to doprowadzić przynajmniej do dogonienia największej konkurencji, jaką obecnie jest Gemini od Google. Pierwszy efekt tych zmian właśnie się pojawił w postaci nowego modelu do generowania obrazów, który jednak wciąż ustępuje rywalowi.
GPT Image 1.5 to nowy model do generowania obrazów od OpenAI. Według zapowiedzi sztuczna inteligencja ma teraz tworzyć grafiki cztery razy szybciej, ale najistotniejszą zmianą jest poprawne generowanie napisów. Ma to wyeliminować literówki oraz losowe, pozbawione sensu ciągi znaków. Internauci zdążyli już porównać GPT Image 1.5 z Nano Banana od Google.
Wniosek jest jeden: OpenAI nie jest w stanie dogonić konkurencji. Obrazy generowane przez GPT Image 1.5 wyglądają jak zdjęcia promocyjne z reklam i brakuje im naturalności, dopóki nie wymusi się jej przy pomocy odpowiedniego prompta. Jeden z internautów podsumował sytuację jednym zdaniem:
Widać, kto ma dostęp do bazyliona obrazów.
Ogromna biblioteka zdjęć, grafik i obrazków daje przewagę Google, które potrzebowało tylko czasu, żeby nadgonić OpenAI, a teraz wyprzedza swojego rywala. Pojawia się jednak pewna obawa związana z dostępem do danych posiadanych przez giganta z Mountain View. W żartobliwym tonie zwrócono uwagę, że wkrótce na wygenerowanych obrazach znajdziemy swoje twarze, ponieważ AI mogło trenować na naszych zdjęciach dostępnych w usługach Google.
Przed OpenAI dużo pracy, a generowanie obrazów nie jest jedynym obszarem, z którym firma musi sobie poradzić. Gemini 3 spotkało się z uznaniem w branży ze względu na zdolności logicznego myślenia i tworzenie tekstu. Wydaje się, że ChatGPT przegrywa teraz w prawie każdym aspekcie. Pewnym zwiastunem zmian było chłodne przyjęcie ChatGPT-5, gdy okazało się, że zamiast rewolucji mamy do czynienia z krokiem wstecz lub jedynie drobnymi ulepszeniami.
Przeprowadziliśmy własny test używając prostego prompta:
Fiat 126p stojący na parkingu na zaśnieżonym parkingu szarego blokowiska lat 90. w Polsce.
GPT Image 1.5 wypełnił polecenie prawie poprawnie. Samochód przypomina „Malucha”, ale przód pojazdu nie jest dokładnie odwzorowany, a wieżowiec w tle wygląda, jakby każdy jego element został wykonany przy pomocy techniki „kopiuj-wklej”. Cały obraz wygląda sterylnie.


Natomiast Nano Banana Pro uchwyciło klimat lat 90. z szarymi blokami i samochodami w tle z epoki, wraz z poprawnie wygenerowanym Fiatem 126p. Od tego zdjęcia można dostać depresji, ponieważ bliżej mu do fotografii, którą ktoś mógł wykonać około 30 lat temu wychodząc na ulicę w grudniu.
Dziękujemy za przeczytanie artykułu.
Ustaw GRYOnline.pl jako preferowane źródło wiadomości w Google
Więcej:Messenger został zamknięty na dwóch platformach. Aplikacja już nie działa

Autor: Zbigniew Woźnicki
Przygodę z publicystyką i pisaniem zaczął w serwisie Allegro, gdzie publikował newsy związane z grami, technologią oraz mediami społecznościowymi. Wkrótce zawitał na GRYOnline.pl i Filmomaniaka, pisząc o nowościach związanych z branżą filmową. Mimo związku z serialami, jego serce należy do gier wszelakiego typu. Żaden gatunek mu nie straszny, a przygoda z Tibią nauczyła go, że niebo i muzyka w grach są całkowicie zbędne. Przed laty dzielił się swoimi doświadczeniami, moderując forum mmorpg.org.pl. Uwielbia ponarzekać, ale oczywiście konstruktywnie i z umiarem. Na forum pisze pod ksywką Canaton.