Pracownicy uniwersytetu postanowili przetestować umiejętności programistyczne ChatGPT. Zadali mu wiele pytań związanych z dziedziną i otrzymali tylko 48% poprawnych odpowiedzi.
Generatywne sztuczne inteligencje powoli przyzwyczajają nas do efektownych rezultatów swojej pracy. Nietypowe ilości palców i tzw. „stawy rzekome” postaci na obrazach autorstwa AI powoli odchodzą w zapomnienie. Ale jak wygląda rzetelność modeli językowych? Okazuje się, że w niektórych dziedzinach wygląda to słabo. Przeprowadzono badanie, w którym ChatGPT odpowiadał na pytania związane z programowaniem i niestety poradził sobie zdumiewająco źle.
Doświadczenie Uniwersytetu Purdue polegało na zadaniu ChatGPT 517 pytań z forum Stack Overflow. Potem jego odpowiedzi weryfikował zespół wolontariuszy. Okazało się, że 52% odpowiedzi udzielonych przez ChatGPT było błędnych. Uczestnicy badania określili 40% odpowiedzi AI jako preferowane, jednak wśród tych wybranych przez nich aż 77% było błędnych.

Dzieje się tak, ponieważ dobry styl i językowa poprawność wypowiedzi ChatGPT potrafią utwierdzić w przekonaniu, że jednak ma on rację. W niektórych przypadkach stosunkowo trudno jest udowodnić błąd AI i wymaga to sięgania po dodatkową wiedzę i metody weryfikacji.
Podczas naszego badania zaobserwowaliśmy, że tylko wtedy, gdy błąd w odpowiedzi ChatGPT jest oczywisty, użytkownicy mogą go zidentyfikować – praca badawcza zespołu Uniwersytetu Purdue.
To nieco podkopuje mit o umiejętnościach programistycznych ChatGPT. Można z niego korzystać podczas pracy, jednak w tej dziedzinie działania AI muszą być dodatkowo i wnikliwie weryfikowane przez specjalistów. Niepewne efekty twórczości obecnych generatywnych sztucznych inteligencji nie budzą zaufania i dowodzą, że nie powinniśmy się na razie zbytnio obawiać bezrobocia. AI są tylko narzędziem, które może zwiększyć produktywność, ale trzeba je kontrolować.
Więcej:„Moczowy filtr” jest zmorą generatorów AI. Dlaczego tworzone obrazki są takie pożółkłe?
0

Autor: Arkadiusz Strzała
Swoją przygodę z pisaniem zaczynał od własnego bloga i jednego z wczesnych forum (stworzonego jeszcze w technologii WAP). Z wykształcenia jest elektrotechnikiem, posiada zamiłowanie do technologii, konstruowania różnych rzeczy i rzecz jasna – grania w gry komputerowe. Obecnie na GOL-u jest newsmanem i autorem publicystyki, a współpracę z serwisem rozpoczął w kwietniu 2020 roku. Specjalizuje się w tekstach o energetyce i kosmosie. Nie stroni jednak od tematów luźniejszych lub z innych dziedzin. Uwielbia oglądać filmy science fiction i motoryzacyjne vlogi na YouTube. Gry uruchamia głównie na komputerze PC, aczkolwiek posiada krótki staż konsolowy. Preferuje strategie czasu rzeczywistego, FPS-y i wszelkie symulatory.