OpenAI zaprezentowało CriticGPT, model AI analizujący i wykrywający błędy w kodzie generowanym przez ChatGPT.
W czwartek OpenAI zaprezentowało CriticGPT, model badawczy zajmujący się identyfikowaniem błędów w kodzie generowanym przez ChatGPT. Głównym celem nowego AI jest sprawienie, aby sztuczna inteligencja zachowywała się w sposób bardziej ludzki, zgodny z oczekiwaniami użytkowników. Pomóc ma w tym „Reinforcement Learning from Human Feedback” (RLHF), czyli sposób nauki na podstawie informacji zwrotnej od ludzi.
Jak opisano w artykule badawczym OpenAI, zatytułowanym „LLM Critics Help Catch LLM Bugs”, CriticGPT ma być asystentem AI dla osób, które korzystają z kodów generowanych przez ChatGPT. Oparty na GPT-4 LLMS CriticGPT analizuje kod i wskazuje znajdujące się w nim błędy, które mogły wcześniej pozostać niezauważone.
Rozwój CriticGPT polegał na szkoleniu sztucznej inteligencji na dużej liczbie danych zawierających kody źródłowe z błędami. Trenerzy byli odpowiedzialni za modyfikowanie kodów generowanych przez ChatGPT i celowe wprowadzanie do nich błędów, a następnie przekazywanie CriticGPT informacji o tym, jak je odkryli i wyeliminowali. Dzięki takiemu szkoleniu, model AI nauczył się identyfikować i naprawiać różne problemy pojawiające się podczas kodowania.

Podczas testów, CriticGPT potrafił wyłapywać zarówno błędy celowo wstawione przez badaczy, jak i te występujące naturalnie w kodach generowanych przez ChatGPT. Oba modele od OpenAI mogą wykrywać błędy generowane przez człowieka, jednak badacze zauważyli, że w 63% przypadków CriticGPT robi to znacznie lepiej i generuje mniej fałszywych alarmów.
Naukowcy opracowali również nową technikę nazwaną „Force Sampling Beam Search”, która pomaga CriticGPT pisać bardziej szczegółowe recenzje kodu. Badacze mogli dostosować dokładność AI w zależności od swoich oczekiwań.

Największym zaskoczeniem dla badaczy był fakt, że CriticGPT potrafił znaleźć błędy w próbkach kodów, które wcześniej zostały ocenione przez testerów jako bezbłędne. Wszystkie poprawki sugerowane przez AI zostały przyjęte, co idealnie obrazuje możliwości programu w wyłapywaniu nawet najmniejszych, normalnie niezauważalnych błędów.
Podobnie jak wszystkie modele sztucznej inteligencji, CriticGPT ma swoje ograniczenia. W oficjalnym oświadczeniu OpenAI zaznaczyło najważniejsze problemy, z jakimi boryka się ich nowy program.
OpenAI ma w planach zintegrowanie innych modeli, podobnych do CriticGPT, z „Reinforcement Learning from Human Feedback”. Twórcy uważają, że taki kierunek pozwoli w przyszłości na tworzenie lepszych i bardziej rozbudowanych narzędzi.
0

Autor: Andrzej Krzemiński
Do GRYOnline.pl dołączył w maju 2024 roku, rozpoczynając swoją przygodę z profesjonalnym pisaniem w dziale technologicznym. Jest miłośnikiem eksperymentalnego hip-hopu oraz książek psychologicznych i filozoficznych, które kolekcjonuje. W wieku 7 lat kuzyn wprowadził go w świat gier i od tego czasu nie może się od nich oderwać. W przeszłości spędzał długie godziny na grach multiplayer, takich jak League of Legends, Valorant i Rainbow Six: Siege. Obecnie skupia się na strategiach, produkcjach indie i j-RPG. Jest największym fanem japońskich gier, w szczególności twórczości studia Atlus z serią gier Persona na czele oraz gry Nier: Automata. W tym roku planuje rozpocząć studia na Uniwersytecie Jagiellońskim.