Perplexity pozwane przez Reddita; sprawa dotyczy nielegalnego pozyskania danych do trenowania AI

Reddit pozwał Perplexity i inne firmy za kradzież danych ze swojego portalu. Zebrane informacje miały zostać wykorzystane do szkolenia AI bez porozumienia z Redditem.

Zbigniew Woźnicki

23 października 2025 10:35

Komentarze

Perplexity pozwane przez Reddita; sprawa dotyczy nielegalnego pozyskania danych do trenowania AI, źródło grafiki: Brett Jordan; Unsplash.com; 2021. — Perplexity pozwane przez Reddita; sprawa dotyczy nielegalnego pozyskania danych do trenowania AI *Źródło: Brett Jordan; Unsplash.com; 2021*.

Reddit pozwał Perplexity AI za bezprawne zbieranie komentarzy użytkowników platformy społecznościowej. Na celowniku Reddita znalazły się także inne firmy, niektóre będące klientami Perplexity. To kolejny przykład problemu, jakim jest pozyskiwanie danych do szkolenia AI. Pozwany gigant stwierdził, że będzie „walczył o wolność klientów do wolnego i równego dostępu do bezpłatnych informacji”.

Reddit pozywa Perplexity

W środę do sądu federalnego stanu Nowy Jork wpłynął pozew Reddita przeciw Perplexity, Oxylabs UAB, domenie AWMProxy i SerpApi (ta ostatnia firma jest klientem Perplexity). W swoim oświadczeniu Reddit wyjaśnił, dlaczego platforma miała być celem:

Scrapery omijają technologiczne bariery, żeby kraść dane i sprzedać je do klientów głodnych materiałów treningowych. Reddit jest głównym celem, ponieważ to jedna z największych i najbardziej dynamicznych kolekcji ludzkich konwersacji.

Z działaniami Reddita nie zgadzają się pozwani, a wypowiedź Perplexity sugeruje, że platforma stawia siebie w roli obrońcy społeczności internetowej:

Nasze podejście wciąż opiera się na tych samych zasadach i odpowiedzialności, że udostępniamy faktyczne odpowiedzi dzięki dokładnemu AI i nie będziemy tolerować gróźb przeciwko otwartości i interesowi publicznemu.

Natomiast Oxylabs zwraca uwagę, że żadna firma nie powinna zarządzać publicznymi danymi i oskarża firmy, które tak robią, że prawdopodobnie robią to, aby je następnie odsprzedać po zawyżonej cenie.

Zdaniem Reddita korporacje zajmujące się scrapowaniem danych z portalu robią to między innymi, omijając zabezpieczenia Google, a następnie korzystają z rekordów wyszukiwarki, aby zebrać potrzebne informacje, co porównano do „napadu na konwój, gdy nie ma się dostępu do skarbca”. Przypomnijmy, że wcześniej Google i OpenAI podpisały umowy z Redditem na dostęp do bazy danych, aby szkolić sztuczną inteligencję. Google płaci 60 milionów dolarów rocznie za tę możliwość. Nie każda firma może sobie na to pozwolić.

W czerwcu z podobnego powodu Reddit pozwał Anthropic.

Dziękujemy za przeczytanie artykułu.

Ustaw GRYOnline.pl jako preferowane źródło wiadomości w Google

Więcej:„Gdybyśmy powiedzieli nie, to już nigdy by z nami nie rozmawiali”. Valve ujawnia brutalne kulisy walki o RAM w Steam Machine



Autor: Zbigniew Woźnicki

Przygodę z publicystyką i pisaniem zaczął w serwisie Allegro, gdzie publikował newsy związane z grami, technologią oraz mediami społecznościowymi. Wkrótce zawitał na GRYOnline.pl i Filmomaniaka, pisząc o nowościach związanych z branżą filmową. Mimo związku z serialami, jego serce należy do gier wszelakiego typu. Żaden gatunek mu nie straszny, a przygoda z Tibią nauczyła go, że niebo i muzyka w grach są całkowicie zbędne. Przed laty dzielił się swoimi doświadczeniami, moderując forum mmorpg.org.pl. Uwielbia ponarzekać, ale oczywiście konstruktywnie i z umiarem. Na forum pisze pod ksywką Canaton.

Sequel Jujutsu Kaisen mógł przygotować grunt pod największy rewanż w historii serii

Następny

Sequel Jujutsu Kaisen mógł przygotować grunt pod największy rewanż w historii serii

Youtuber w ciągu trzech miesięcy całkowicie przekonał sztuczną inteligencję Google, że GTA 6 otrzyma przycisk twerkowania

Poprzedni

Youtuber w ciągu trzech miesięcy całkowicie przekonał sztuczną inteligencję Google, że GTA 6 otrzyma przycisk twerkowania