AI rozpoznaje obrazy gorzej niż człowiek

Sztuczna inteligencja robi wiele rzeczy lepiej od człowieka, ale do ludzkich możliwości rozpoznawania obiektów jeszcze sporo jej brakuje.

nauka
Adam Adamczyk28 września 2022
15
Źrodło fot. Unsplash | Amanda Dalbjorn
i

Ostatnio głośno było na temat sztucznej inteligencji, która jest w stanie generować obrazy, podkładać głos w grach, a nawet je tworzyć. Można zatem dojść do wniosku, że niebawem nie będziemy mieli wiele do roboty, skoro AI jest w stanie zastąpić nas w tylu różnych dziedzinach. Jeśli jednak chodzi o rozpoznawanie obiektów, to sztuczna inteligencja musi przejść jeszcze długą drogę, aby mogła zbliżyć się do możliwości ludzkiego oka.

AI nie rozpoznaje obiektów tak dobrze jak człowiek

Naukowcy z HSE University i Moscow Polytechnic University odkryli, że modele AI nie są w stanie (na razie) odwzorować cech naszego wzroku z powodu braku powiązania funkcji widzenia z ludzką wyobraźnią, dlatego gorzej radzą sobie z rozpoznawaniem obrazów.

Wspominani wcześniej badacze przesłali przykłady klasycznych iluzji optycznych do internetowego serwisu IBM Watson Visual Recognition. Większość z nich stanowiły obiekty, które zostały częściowo ukryte przez geometryczne kształty w takim samym kolorze jak tło. Okazało się, że sztuczna inteligencja nie jest w stanie rozpoznać żadnej figury! Jedyny wyjątek stanowił kolorowy trójkąt, który został odróżniony jedynie ze względu na wysoki kontrast z kolorem tła.

Dlaczego ludzkie oko ma przewagę?

Skoro ustaliliśmy na wstępie, że AI prezentuje się coraz bardziej imponująco, to dlaczego w takim razie przegrywa z naszymi oczami (nierzadko zmęczonymi i wspomaganymi okularami)? Odpowiedź nie jest taka prosta, ale wszystko rozbija się podobno o naszą wyobraźnię oraz charakterystyczną budowę ludzkiego oka. Eksperci z HSE University tłumaczą to tak:

Ludzkie oko mimowolnie stale porusza się, a światłoczuła powierzchnia jego siatkówki ma kształt półkuli. Człowiek jest w stanie dostrzec iluzję, jeśli obraz jest wektorem, czyli zawiera punkty odniesienia i łączące je krzywe. Ludzka wyobraźnia uzupełni obraz dzięki ciągłym ruchom oczu, co stanowi fizjologiczną cechę widzenia.

W optycznych układach elektronicznych wszystko działa nieco inaczej. Ich matryca światłoczuła ma płaski, zwykle prostokątny kształt, a sam układ soczewek nie porusza się aż tak swobodnie jak ludzkie oko. Dlatego sztuczna inteligencja nie potrafi uzupełnić wyimaginowanych linii łączących fragmenty geometrycznej iluzji. Widzenie maszynowe rozpoznaje zatem tylko to, co jest rzeczywiście przedstawione, podczas gdy ludzie uzupełniają obraz w myślach na podstawie jego konturów.

Nie oznacza to jednak, że AI nie może poprawić się w przyszłości. Naukowcy podkreślają, że w przyszłości mogą powstać rozwiązania pomagające sztucznej inteligencji identyfikować różne obiekty. Jest to o tyle istotne, że algorytmy rozpoznawania obrazu już teraz towarzyszą nam w wielu aspektach życia (np. w autopilocie samochodu czy samolotu), a już niedługo mogą być jeszcze powszechniejsze.

POWIĄZANE TEMATY: nauka AI / sztuczna inteligencja

Adam Adamczyk

Adam Adamczyk

Pisaniem zajmuje się zawodowo od 2013 roku. W 2021 roku dołączył do GRYOnline.pl, gdzie poza tematyką gamingową zajmuje się informacjami stricte technologicznymi. Współpracował z największymi sklepami muzycznymi w Polsce, tworząc artykuły związane z instrumentami i ogólnie pojętym udźwiękowieniem. Grami komputerowymi interesuje się od dziecka. Poza tym jego zainteresowania obejmują grę na gitarze, komponowanie muzyki oraz sporty siłowe.

AMD traci kolejnego partnera? Nadchodzący Exynos ma korzystać z GPU Samsunga

AMD traci kolejnego partnera? Nadchodzący Exynos ma korzystać z GPU Samsunga

Najnowsza aktualizacja Windowsa 10 i 11 psuje VPN i nie ma na to na razie rozwiązania

Najnowsza aktualizacja Windowsa 10 i 11 psuje VPN i nie ma na to na razie rozwiązania

AMD ma już 55 lat i radzi sobie bardzo dobrze. W przyszłości może rozwijać więcej technologii powiązanych ze sztuczną inteligencją

AMD ma już 55 lat i radzi sobie bardzo dobrze. W przyszłości może rozwijać więcej technologii powiązanych ze sztuczną inteligencją

Ile zarabia się na TikToku?

Ile zarabia się na TikToku?

W kwietniowej ankiecie Steam wciąż królował Windows 10, choć następca depcze już po piętach, pojawiły się też nowe karty Nvidii RTX 40 Super

W kwietniowej ankiecie Steam wciąż królował Windows 10, choć następca depcze już po piętach, pojawiły się też nowe karty Nvidii RTX 40 Super