CriticGPT wyłapuje błędy, krytykuje, punktuje nieścisłości i jest bezwzględne dla ChatGPT. W OpenAI stworzyli AI do kontroli AI

OpenAI zaprezentowało CriticGPT, model AI analizujący i wykrywający błędy w kodzie generowanym przez ChatGPT.

28 czerwca 2024 14:40

CriticGPT wyłapuje błędy, krytykuje, punktuje nieścisłości i jest bezwzględne dla ChatGPT. W OpenAI stworzyli AI do kontroli AI, źródło grafiki: Andrew Neel, Unsplash. — CriticGPT wyłapuje błędy, krytykuje, punktuje nieścisłości i jest bezwzględne dla ChatGPT. W OpenAI stworzyli AI do kontroli AI *Źródło: Andrew Neel, Unsplash*.

Spis treści:

Cel powstania CriticGPT
Proces nauki nowego AI
Limity CriticGPT
Następne kroki

W czwartek OpenAI zaprezentowało CriticGPT, model badawczy zajmujący się identyfikowaniem błędów w kodzie generowanym przez ChatGPT. Głównym celem nowego AI jest sprawienie, aby sztuczna inteligencja zachowywała się w sposób bardziej ludzki, zgodny z oczekiwaniami użytkowników. Pomóc ma w tym „Reinforcement Learning from Human Feedback” (RLHF), czyli sposób nauki na podstawie informacji zwrotnej od ludzi.

Cel powstania CriticGPT

Jak opisano w artykule badawczym OpenAI, zatytułowanym „LLM Critics Help Catch LLM Bugs”, CriticGPT ma być asystentem AI dla osób, które korzystają z kodów generowanych przez ChatGPT. Oparty na GPT-4 LLMS CriticGPT analizuje kod i wskazuje znajdujące się w nim błędy, które mogły wcześniej pozostać niezauważone.

Proces nauki nowego AI

Rozwój CriticGPT polegał na szkoleniu sztucznej inteligencji na dużej liczbie danych zawierających kody źródłowe z błędami. Trenerzy byli odpowiedzialni za modyfikowanie kodów generowanych przez ChatGPT i celowe wprowadzanie do nich błędów, a następnie przekazywanie CriticGPT informacji o tym, jak je odkryli i wyeliminowali. Dzięki takiemu szkoleniu, model AI nauczył się identyfikować i naprawiać różne problemy pojawiające się podczas kodowania.

Źródło: OpenAI

Podczas testów, CriticGPT potrafił wyłapywać zarówno błędy celowo wstawione przez badaczy, jak i te występujące naturalnie w kodach generowanych przez ChatGPT. Oba modele od OpenAI mogą wykrywać błędy generowane przez człowieka, jednak badacze zauważyli, że w 63% przypadków CriticGPT robi to znacznie lepiej i generuje mniej fałszywych alarmów.

Naukowcy opracowali również nową technikę nazwaną „Force Sampling Beam Search”, która pomaga CriticGPT pisać bardziej szczegółowe recenzje kodu. Badacze mogli dostosować dokładność AI w zależności od swoich oczekiwań.

Źródło: OpenAI

Największym zaskoczeniem dla badaczy był fakt, że CriticGPT potrafił znaleźć błędy w próbkach kodów, które wcześniej zostały ocenione przez testerów jako bezbłędne. Wszystkie poprawki sugerowane przez AI zostały przyjęte, co idealnie obrazuje możliwości programu w wyłapywaniu nawet najmniejszych, normalnie niezauważalnych błędów.

Limity CriticGPT

Podobnie jak wszystkie modele sztucznej inteligencji, CriticGPT ma swoje ograniczenia. W oficjalnym oświadczeniu OpenAI zaznaczyło najważniejsze problemy, z jakimi boryka się ich nowy program.

CriticGPT został wytrenowany na krótkich odpowiedziach, dawanych przez ChatGPT. Nowe AI nie radzi sobie obecnie z dłuższymi, bardziej skomplikowanymi zadaniami.
Program jest najbardziej skuteczny w identyfikowaniu prostych błędów i ma problem z poprawnym rozpoznaniem tych rozproszonych po całym kodzie.
Program ma czasami „halucynacje” i wprowadza poprawki do kodu, który jest poprawnie napisany.
Jeśli zadanie jest złożone, CriticGPT nie będzie w stanie poprawnie ocenić, jaki jest dokładnie problem.

Następne kroki

OpenAI ma w planach zintegrowanie innych modeli, podobnych do CriticGPT, z „Reinforcement Learning from Human Feedback”. Twórcy uważają, że taki kierunek pozwoli w przyszłości na tworzenie lepszych i bardziej rozbudowanych narzędzi.

Dziękujemy za przeczytanie artykułu.

Ustaw GRYOnline.pl jako preferowane źródło wiadomości w Google

Więcej:Wzrost zużycia energii będzie gigantyczny. Serwery AI będą pożerać jej więcej niż cały konwencjonalny sprzęt w centrach danych



Autor: Andrzej Krzemiński

Do GRYOnline.pl dołączył w maju 2024 roku, rozpoczynając swoją przygodę z profesjonalnym pisaniem w dziale technologicznym. Jest miłośnikiem eksperymentalnego hip-hopu oraz książek psychologicznych i filozoficznych, które kolekcjonuje. W wieku 7 lat kuzyn wprowadził go w świat gier i od tego czasu nie może się od nich oderwać. W przeszłości spędzał długie godziny na grach multiplayer, takich jak League of Legends, Valorant i Rainbow Six: Siege. Obecnie skupia się na strategiach, produkcjach indie i j-RPG. Jest największym fanem japońskich gier, w szczególności twórczości studia Atlus z serią gier Persona na czele oraz gry Nier: Automata. W tym roku planuje rozpocząć studia na Uniwersytecie Jagiellońskim.

Steam Summer Sale 2024 - najlepsze promocje na gry RPG do 20 zł

Następny

Steam Summer Sale 2024 - najlepsze promocje na gry RPG do 20 zł

Nieziemska promocja na kosmiczną myszkę komputerową. Cougar 700M EVO to gryzoń, którego warto kupić nie tylko dla samego wyglądu

Poprzedni

Nieziemska promocja na kosmiczną myszkę komputerową. Cougar 700M EVO to gryzoń, którego warto kupić nie tylko dla samego wyglądu