Claude ogłasza Opus 4.8, ale fani AI są sceptyczni co do jego realnych możliwości

Anthropic chwali się nowym modelem Claude Opus 4.8. Wyniki benchmarków są obiecujące, ale internauci udowadniają, że AI radzi sobie gorzej od poprzedników i do tego szybciej wyczerpuje tokeny.

futurebeat.pl
Claude ogłasza Opus 4.8, ale fani AI są sceptyczni co do jego realnych możliwości, źródło grafiki: Anthropic.
Claude ogłasza Opus 4.8, ale fani AI są sceptyczni co do jego realnych możliwości Źródło: Anthropic.

Każdy nowy model sztucznej inteligencji jest prezentowany jako ogromny postęp względem poprzednika. Tak było w przypadku ChatGPT-5 w sierpniu zeszłego roku, co spotkało się z krytyką użytkowników. Powtórkę mamy obecnie, gdy Anthropic udostępnił Claude’a Opus 4.8. Głosy społeczności są negatywne mimo „większej prędkości i niższych wydatków”.

Claude Opus 4.8 jest najgorszą wersją modelu od dawna

Publikując nową wersję modelu sztucznej inteligencji, Anthropic obiecywał większą prędkość, dokładność oraz możliwość wyboru, jak dużo „myślenia” Claude ma wykonać przed podaniem odpowiedzi. Już w tym miejscu sztuczna inteligencja zdaje się nie spełniać oczekiwań, ponieważ użytkownicy zgłaszają, że AI ignoruje ustawienia rozumowania, domyślnie wybierając jak najniższe.

Podobnie w przypadku benchmarków zapewnienia Anthropica rozmijają się z tym, czego doświadczyli internauci. W oficjalnym ogłoszeniu firma pokazała, że Claude Opus 4.8 dominuje prawie w każdej konkurencji, przegrywając wyłącznie z ChatemGPT-5.5 w kategorii agentowego kodowania w terminalu.

Inne realia przedstawił użytkownik Reddita Rent_South, który wykonał kilka benchmarków i w każdym z nich Claude Opus 4.8 znajduje w drugiej połowie stawki. Dla przykładu w tabeli dotyczącej logicznego myślenia pierwsze miejsce zajął ChatGPT-5.4 z wynikiem 69%, drugi był Claude Opus 4.6 z wynikiem 66%, a trzeci Gemini 3.1 Flash-Lite zdobywając 63%, gdy Claude Opus 4.8 zdobył 44%.

Claude 4.8 nie jest także tak tani w użytkowaniu, jak informuje o tym Anthropic. Z zebranych w wątku na subreddicie komentarzy wynika, że tokeny wyczerpują się jeszcze szybciej, niż w przypadku wersji 4.7:

Jednym z głównych zarzutów wobec wersji 4.7 było absurdalne wręcz zużycie tokenów, a pierwsze doniesienia wskazują, że 4.8 wypada pod tym względem jeszcze gorzej. Jeden z użytkowników wyczerpał 45% swojego pięciogodzinnego limitu po zadaniu zaledwie trzech pytań.

Problematyczna stała się także większa „szczerość” AI, którą chwali się Anthropic. W opinii internautów Claude stał się bardziej protekcjonalny, co irytuje i zniechęca do pracy z modelem sztucznej inteligencji. Tak zły start to dobra informacja dla konkurencji, ponieważ na początku tego roku Claude zyskiwał na popularności, gdy OpenAI znalazło się w centrum kontrowersji związanej ze współpracą z rządem Stanów Zjednoczonych.

Najważniejsze informacje o Claude Opus 4.8

Czym jest Claude Opus 4.8?

Claude Opus 4.8 to nowa wersja flagowego modelu AI firmy Anthropic. Firma opisuje go jako model szybszy, bardziej dokładny i bardziej „uczciwy” w sygnalizowaniu niepewności.

Co Anthropic obiecuje w Claude Opus 4.8?

Anthropic deklaruje poprawę szybkości, dokładności, transparentności oraz możliwość wyboru poziomu „wysiłku” / rozumowania modelu. Firma wskazuje też na lepszą kontrolę kosztów i tokenów.

Dlaczego użytkownicy krytykują Claude Opus 4.8?

Część internautów twierdzi, że model wypada gorzej od poprzedników w ich testach, ignoruje ustawienia rozumowania, szybciej zużywa tokeny i bywa bardziej protekcjonalny w odpowiedziach.

1

Zbigniew Woźnicki

Autor: Zbigniew Woźnicki

Przygodę z publicystyką i pisaniem zaczął w serwisie Allegro, gdzie publikował newsy związane z grami, technologią oraz mediami społecznościowymi. Wkrótce zawitał na GRYOnline.pl i Filmomaniaka, pisząc o nowościach związanych z branżą filmową. Mimo związku z serialami, jego serce należy do gier wszelakiego typu. Żaden gatunek mu nie straszny, a przygoda z Tibią nauczyła go, że niebo i muzyka w grach są całkowicie zbędne. Przed laty dzielił się swoimi doświadczeniami, moderując forum mmorpg.org.pl. Uwielbia ponarzekać, ale oczywiście konstruktywnie i z umiarem. Na forum pisze pod ksywką Canaton.

Twórcy popularnej postapokaliptycznej gry survivalowej wycofują się z kontrowersyjnej decyzji. Gracze Project Zomboid są do nie zastąpienia w delikatnej sprawie

Następny
Twórcy popularnej postapokaliptycznej gry survivalowej wycofują się z kontrowersyjnej decyzji. Gracze Project Zomboid są do nie zastąpienia w delikatnej sprawie

Po 5 latach i 47 odcinkach dziś kończy się jeden z najlepszych współczesnych seriali HBO Max. Polecany przez 100% krytyków finałowy sezon idealny na weekendowy maraton

Poprzedni
Po 5 latach i 47 odcinkach dziś kończy się jeden z najlepszych współczesnych seriali HBO Max. Polecany przez 100% krytyków finałowy sezon idealny na weekendowy maraton

GRYOnline.pl:

Facebook GRYOnline.pl Instagram GRYOnline.pl X GRYOnline.pl Discord GRYOnline.pl TikTok GRYOnline.pl Podcast GRYOnline.pl WhatsApp GRYOnline.pl LinkedIn GRYOnline.pl Forum GRYOnline.pl

tvgry.pl:

YouTube tvgry.pl TikTok tvgry.pl Instagram tvgry.pl Discord tvgry.pl Facebook tvgry.pl