Claude ogłasza Opus 4.8, ale fani AI są sceptyczni co do jego realnych możliwości

Anthropic chwali się nowym modelem Claude Opus 4.8. Wyniki benchmarków są obiecujące, ale internauci udowadniają, że AI radzi sobie gorzej od poprzedników i do tego szybciej wyczerpuje tokeny.

Zbigniew Woźnicki

29 maja 2026 15:30

6

Claude ogłasza Opus 4.8, ale fani AI są sceptyczni co do jego realnych możliwości, źródło grafiki: Anthropic. — Claude ogłasza Opus 4.8, ale fani AI są sceptyczni co do jego realnych możliwości *Źródło: Anthropic*.

Każdy nowy model sztucznej inteligencji jest prezentowany jako ogromny postęp względem poprzednika. Tak było w przypadku ChatGPT-5 w sierpniu zeszłego roku, co spotkało się z krytyką użytkowników. Powtórkę mamy obecnie, gdy Anthropic udostępnił Claude’a Opus 4.8. Głosy społeczności są negatywne mimo „większej prędkości i niższych wydatków”.

Claude Opus 4.8 jest najgorszą wersją modelu od dawna

Publikując nową wersję modelu sztucznej inteligencji, Anthropic obiecywał większą prędkość, dokładność oraz możliwość wyboru, jak dużo „myślenia” Claude ma wykonać przed podaniem odpowiedzi. Już w tym miejscu sztuczna inteligencja zdaje się nie spełniać oczekiwań, ponieważ użytkownicy zgłaszają, że AI ignoruje ustawienia rozumowania, domyślnie wybierając jak najniższe.

Podobnie w przypadku benchmarków zapewnienia Anthropica rozmijają się z tym, czego doświadczyli internauci. W oficjalnym ogłoszeniu firma pokazała, że Claude Opus 4.8 dominuje prawie w każdej konkurencji, przegrywając wyłącznie z ChatemGPT-5.5 w kategorii agentowego kodowania w terminalu.

Inne realia przedstawił użytkownik Reddita Rent_South, który wykonał kilka benchmarków i w każdym z nich Claude Opus 4.8 znajduje w drugiej połowie stawki. Dla przykładu w tabeli dotyczącej logicznego myślenia pierwsze miejsce zajął ChatGPT-5.4 z wynikiem 69%, drugi był Claude Opus 4.6 z wynikiem 66%, a trzeci Gemini 3.1 Flash-Lite zdobywając 63%, gdy Claude Opus 4.8 zdobył 44%.

Claude 4.8 nie jest także tak tani w użytkowaniu, jak informuje o tym Anthropic. Z zebranych w wątku na subreddicie komentarzy wynika, że tokeny wyczerpują się jeszcze szybciej, niż w przypadku wersji 4.7:

Jednym z głównych zarzutów wobec wersji 4.7 było absurdalne wręcz zużycie tokenów, a pierwsze doniesienia wskazują, że 4.8 wypada pod tym względem jeszcze gorzej. Jeden z użytkowników wyczerpał 45% swojego pięciogodzinnego limitu po zadaniu zaledwie trzech pytań.

Problematyczna stała się także większa „szczerość” AI, którą chwali się Anthropic. W opinii internautów Claude stał się bardziej protekcjonalny, co irytuje i zniechęca do pracy z modelem sztucznej inteligencji. Tak zły start to dobra informacja dla konkurencji, ponieważ na początku tego roku Claude zyskiwał na popularności, gdy OpenAI znalazło się w centrum kontrowersji związanej ze współpracą z rządem Stanów Zjednoczonych.

Najważniejsze informacje o Claude Opus 4.8

Czym jest Claude Opus 4.8?

Claude Opus 4.8 to nowa wersja flagowego modelu AI firmy Anthropic. Firma opisuje go jako model szybszy, bardziej dokładny i bardziej „uczciwy” w sygnalizowaniu niepewności.

Co Anthropic obiecuje w Claude Opus 4.8?

Anthropic deklaruje poprawę szybkości, dokładności, transparentności oraz możliwość wyboru poziomu „wysiłku” / rozumowania modelu. Firma wskazuje też na lepszą kontrolę kosztów i tokenów.

Dlaczego użytkownicy krytykują Claude Opus 4.8?

Część internautów twierdzi, że model wypada gorzej od poprzedników w ich testach, ignoruje ustawienia rozumowania, szybciej zużywa tokeny i bywa bardziej protekcjonalny w odpowiedziach.

Dziękujemy za przeczytanie artykułu.

Ustaw GRYOnline.pl jako preferowane źródło wiadomości w Google

Więcej:Plotki o likwidacji działu sprzętowego Xboxa były mocno przesadzone. Znany informator dementuje



Autor: Zbigniew Woźnicki

Przygodę z publicystyką i pisaniem zaczął w serwisie Allegro, gdzie publikował newsy związane z grami, technologią oraz mediami społecznościowymi. Wkrótce zawitał na GRYOnline.pl i Filmomaniaka, pisząc o nowościach związanych z branżą filmową. Mimo związku z serialami, jego serce należy do gier wszelakiego typu. Żaden gatunek mu nie straszny, a przygoda z Tibią nauczyła go, że niebo i muzyka w grach są całkowicie zbędne. Przed laty dzielił się swoimi doświadczeniami, moderując forum mmorpg.org.pl. Uwielbia ponarzekać, ale oczywiście konstruktywnie i z umiarem. Na forum pisze pod ksywką Canaton.

Twórcy popularnej postapokaliptycznej gry survivalowej wycofują się z kontrowersyjnej decyzji. Gracze Project Zomboid są do nie zastąpienia w delikatnej sprawie

Następny

Po 5 latach i 47 odcinkach dziś kończy się jeden z najlepszych współczesnych seriali HBO Max. Polecany przez 100% krytyków finałowy sezon idealny na weekendowy maraton

Poprzedni

Po 5 latach i 47 odcinkach dziś kończy się jeden z najlepszych współczesnych seriali HBO Max. Polecany przez 100% krytyków finałowy sezon idealny na weekendowy maraton

Najnowsze Wiadomości

Polecamy

Czy Valve może usunąć moje konto Steam, jeśli nie grałem przez długi czas? To różni PC od PlayStation

15-letnia dziewczyna skonstruowała generator za 12 euro, który zasila odizolowane domy; inżynierowie potwierdzili jego sprawność

1000 litrów pitnej wody za 23 centy. Chińscy naukowcy bez prądu zmieniają wodę morską w zdatną do picia

Zapominał wystawić śmieci, więc zbudował gadżet, który robi z tego mały rytuał. „Może pokazywać, kto w tym tygodniu jest odpowiedzialny za ich wystawienie”

Szwajcarzy przykręcili 5000 paneli słonecznych do ściany zapory. Zimą wynik zaskoczył sceptyków

Windows 11: niewidoczny plik systemowy może zająć aż 500 GB miejsca na dysku; Microsoft przyznał to po cichu

Dlaczego samochody z ręczną skrzynią biegów są lepsze dla waszego mózgu niż te z automatyczną? Profesor z gry Nintendo dobrze to wyjaśnił

GRYOnline.pl:

tvgry.pl: