Anthropic chwali się nowym modelem Claude Opus 4.8. Wyniki benchmarków są obiecujące, ale internauci udowadniają, że AI radzi sobie gorzej od poprzedników i do tego szybciej wyczerpuje tokeny.
Każdy nowy model sztucznej inteligencji jest prezentowany jako ogromny postęp względem poprzednika. Tak było w przypadku ChatGPT-5 w sierpniu zeszłego roku, co spotkało się z krytyką użytkowników. Powtórkę mamy obecnie, gdy Anthropic udostępnił Claude’a Opus 4.8. Głosy społeczności są negatywne mimo „większej prędkości i niższych wydatków”.
Publikując nową wersję modelu sztucznej inteligencji, Anthropic obiecywał większą prędkość, dokładność oraz możliwość wyboru, jak dużo „myślenia” Claude ma wykonać przed podaniem odpowiedzi. Już w tym miejscu sztuczna inteligencja zdaje się nie spełniać oczekiwań, ponieważ użytkownicy zgłaszają, że AI ignoruje ustawienia rozumowania, domyślnie wybierając jak najniższe.
Podobnie w przypadku benchmarków zapewnienia Anthropica rozmijają się z tym, czego doświadczyli internauci. W oficjalnym ogłoszeniu firma pokazała, że Claude Opus 4.8 dominuje prawie w każdej konkurencji, przegrywając wyłącznie z ChatemGPT-5.5 w kategorii agentowego kodowania w terminalu.
Inne realia przedstawił użytkownik Reddita Rent_South, który wykonał kilka benchmarków i w każdym z nich Claude Opus 4.8 znajduje w drugiej połowie stawki. Dla przykładu w tabeli dotyczącej logicznego myślenia pierwsze miejsce zajął ChatGPT-5.4 z wynikiem 69%, drugi był Claude Opus 4.6 z wynikiem 66%, a trzeci Gemini 3.1 Flash-Lite zdobywając 63%, gdy Claude Opus 4.8 zdobył 44%.
Claude 4.8 nie jest także tak tani w użytkowaniu, jak informuje o tym Anthropic. Z zebranych w wątku na subreddicie komentarzy wynika, że tokeny wyczerpują się jeszcze szybciej, niż w przypadku wersji 4.7:
Jednym z głównych zarzutów wobec wersji 4.7 było absurdalne wręcz zużycie tokenów, a pierwsze doniesienia wskazują, że 4.8 wypada pod tym względem jeszcze gorzej. Jeden z użytkowników wyczerpał 45% swojego pięciogodzinnego limitu po zadaniu zaledwie trzech pytań.
Problematyczna stała się także większa „szczerość” AI, którą chwali się Anthropic. W opinii internautów Claude stał się bardziej protekcjonalny, co irytuje i zniechęca do pracy z modelem sztucznej inteligencji. Tak zły start to dobra informacja dla konkurencji, ponieważ na początku tego roku Claude zyskiwał na popularności, gdy OpenAI znalazło się w centrum kontrowersji związanej ze współpracą z rządem Stanów Zjednoczonych.
Czym jest Claude Opus 4.8?
Claude Opus 4.8 to nowa wersja flagowego modelu AI firmy Anthropic. Firma opisuje go jako model szybszy, bardziej dokładny i bardziej „uczciwy” w sygnalizowaniu niepewności.
Co Anthropic obiecuje w Claude Opus 4.8?
Anthropic deklaruje poprawę szybkości, dokładności, transparentności oraz możliwość wyboru poziomu „wysiłku” / rozumowania modelu. Firma wskazuje też na lepszą kontrolę kosztów i tokenów.
Dlaczego użytkownicy krytykują Claude Opus 4.8?
Część internautów twierdzi, że model wypada gorzej od poprzedników w ich testach, ignoruje ustawienia rozumowania, szybciej zużywa tokeny i bywa bardziej protekcjonalny w odpowiedziach.
Dziękujemy za przeczytanie artykułu.
Ustaw GRYOnline.pl jako preferowane źródło wiadomości w Google
1

Autor: Zbigniew Woźnicki
Przygodę z publicystyką i pisaniem zaczął w serwisie Allegro, gdzie publikował newsy związane z grami, technologią oraz mediami społecznościowymi. Wkrótce zawitał na GRYOnline.pl i Filmomaniaka, pisząc o nowościach związanych z branżą filmową. Mimo związku z serialami, jego serce należy do gier wszelakiego typu. Żaden gatunek mu nie straszny, a przygoda z Tibią nauczyła go, że niebo i muzyka w grach są całkowicie zbędne. Przed laty dzielił się swoimi doświadczeniami, moderując forum mmorpg.org.pl. Uwielbia ponarzekać, ale oczywiście konstruktywnie i z umiarem. Na forum pisze pod ksywką Canaton.