ChatGPT udzielił ponad połowy złych odpowiedzi na pytania związane z programowaniem

Pracownicy uniwersytetu postanowili przetestować umiejętności programistyczne ChatGPT. Zadali mu wiele pytań związanych z dziedziną i otrzymali tylko 48% poprawnych odpowiedzi.

futurebeat.pl

Arkadiusz Strzała

ChatGPT udzielił ponad połowy złych odpowiedzi na pytania związane z programowaniem, źródło grafiki: Midjourney.
ChatGPT udzielił ponad połowy złych odpowiedzi na pytania związane z programowaniem Źródło: Midjourney.

Generatywne sztuczne inteligencje powoli przyzwyczajają nas do efektownych rezultatów swojej pracy. Nietypowe ilości palców i tzw. „stawy rzekome” postaci na obrazach autorstwa AI powoli odchodzą w zapomnienie. Ale jak wygląda rzetelność modeli językowych? Okazuje się, że w niektórych dziedzinach wygląda to słabo. Przeprowadzono badanie, w którym ChatGPT odpowiadał na pytania związane z programowaniem i niestety poradził sobie zdumiewająco źle.

ChatGPT nie taki dobry w programowaniu

Doświadczenie Uniwersytetu Purdue polegało na zadaniu ChatGPT 517 pytań z forum Stack Overflow. Potem jego odpowiedzi weryfikował zespół wolontariuszy. Okazało się, że 52% odpowiedzi udzielonych przez ChatGPT było błędnych. Uczestnicy badania określili 40% odpowiedzi AI jako preferowane, jednak wśród tych wybranych przez nich aż 77% było błędnych.

ChatGPT udzielił ponad połowy złych odpowiedzi na pytania związane z programowaniem - ilustracja #1
Miejmy na uwadze, że AI potrafi się mylić. Źródło: DALL-E

Dzieje się tak, ponieważ dobry styl i językowa poprawność wypowiedzi ChatGPT potrafią utwierdzić w przekonaniu, że jednak ma on rację. W niektórych przypadkach stosunkowo trudno jest udowodnić błąd AI i wymaga to sięgania po dodatkową wiedzę i metody weryfikacji.

Podczas naszego badania zaobserwowaliśmy, że tylko wtedy, gdy błąd w odpowiedzi ChatGPT jest oczywisty, użytkownicy mogą go zidentyfikować – praca badawcza zespołu Uniwersytetu Purdue.

To nieco podkopuje mit o umiejętnościach programistycznych ChatGPT. Można z niego korzystać podczas pracy, jednak w tej dziedzinie działania AI muszą być dodatkowo i wnikliwie weryfikowane przez specjalistów. Niepewne efekty twórczości obecnych generatywnych sztucznych inteligencji nie budzą zaufania i dowodzą, że nie powinniśmy się na razie zbytnio obawiać bezrobocia. AI są tylko narzędziem, które może zwiększyć produktywność, ale trzeba je kontrolować.

Podobało się?

0

Arkadiusz Strzała

Autor: Arkadiusz Strzała

Swoją przygodę z pisaniem zaczynał od własnego bloga i jednego z wczesnych forum (stworzonego jeszcze w technologii WAP). Z wykształcenia jest elektrotechnikiem, posiada zamiłowanie do technologii, konstruowania różnych rzeczy i rzecz jasna – grania w gry komputerowe. Obecnie na GOL-u jest newsmanem i autorem publicystyki, a współpracę z serwisem rozpoczął w kwietniu 2020 roku. Specjalizuje się w tekstach o energetyce i kosmosie. Nie stroni jednak od tematów luźniejszych lub z innych dziedzin. Uwielbia oglądać filmy science fiction i motoryzacyjne vlogi na YouTube. Gry uruchamia głównie na komputerze PC, aczkolwiek posiada krótki staż konsolowy. Preferuje strategie czasu rzeczywistego, FPS-y i wszelkie symulatory.

Zdobądź za darmo strategię w realiach II wojny światowej

Następny
Zdobądź za darmo strategię w realiach II wojny światowej

Diablo 4 traci uwagę graczy szybciej niż WoW i Overwatch 2

Poprzedni
Diablo 4 traci uwagę graczy szybciej niż WoW i Overwatch 2

Kalendarz Wiadomości

Nie
Pon
Wto
Śro
Czw
Pią
Sob

GRYOnline.pl:

Facebook GRYOnline.pl Instagram GRYOnline.pl X GRYOnline.pl Discord GRYOnline.pl TikTok GRYOnline.pl Podcast GRYOnline.pl WhatsApp GRYOnline.pl LinkedIn GRYOnline.pl Forum GRYOnline.pl

tvgry.pl:

YouTube tvgry.pl TikTok tvgry.pl Instagram tvgry.pl Discord tvgry.pl Facebook tvgry.pl