Zarchiwizowanie historii internetu staje się coraz większym wyzwaniem. Przed problemem stoi Wayback Machine, ponieważ wydawnictwa blokują dostęp botom Internet Archive.
Mniej stron internetowych będzie dostępnych w Wayback Machine, ponieważ 23 portale, w tym konglomerat medialny mający pod sobą około 200 różnych serwisów, zablokowały dostęp dla botów. Jedną z przyczyn ma być problem nielegalnego zbierania danych przez branżę AI, ale zwrócono uwagę, że celowo dostęp ograniczono także dla „crawlerów” Internet Archive.
Zajmująca się skanowaniem i wykrywaniem treści AI firma Originality AI przekazała, że 23 główne amerykańskie portale informacyjne zablokowały bota ia_archiverbot, którego używa Internet Archive w ramach projektu Wayback Machine. Powołujący się na te dane serwis Wired zwrócił uwagę, że dotyczy to nie tylko zwykłych portali, ponieważ dostęp zablokował również Reddit, o czym władze firmy informowały jeszcze w 2025 roku.
Inaczej działa The Guardian, który wykluczył zawartość z API Internet Archive, co pozwala odfiltrować dane z Wayback Machine. Rzeczniczka prasowa USA Today Lark-Marie Anton przekazała, że Internet Archive otrzymało rykoszetem ze względu na politykę firmy dotyczącą blokady wszystkich crawlerów.
Natomiast dyrektor ds. relacji biznesowych i licencji The Guardian Robert Hahn dodał, że problemem są firmy zajmujące się trenowaniem modeli AI. To one w dużej mierze wykorzystują Wayback Machine, żeby wejść w posiadanie zarchiwizowanych treści bez zezwolenia portali internetowych.
Tym działaniom sprzeciwiają się jednak sami dziennikarze, których setka podpisała się pod apelem wsparcia dla Internet Archive, o czym donosi Wired. Apel zaznacza istotność portalu dla pracy dziennikarskiej, ponieważ serwis jest tym, czym dla prasy są fizyczne archiwa. Jeśli dostęp zostanie zablokowany, praca niektórych zostanie zablokowana.
Redakcje będą mogły bez żadnych adnotacji modyfikować lub usuwać treści, ponieważ nie będzie można im nic udowodnić. Jako przykład podano sytuację z 2016 roku, gdy to dzięki Wayback Machine odkryto, że The New York Times usuwał fragmenty tekstów z artykułów o senatorze Berniem Sandersie. Dyrektor Internet Archive Mark Graham uważa, że Wayback Machine jest potrzebne, ponieważ bez niego „ludzie będą mieli większy problem ze zrozumieniem tego, co dzieje się na świecie”.
Dziękujemy za przeczytanie artykułu.
Ustaw GRYOnline.pl jako preferowane źródło wiadomości w Google
Więcej:Na rynku pamięci nie brakuje towaru, ale ceny odstraszają. Gracze apelują o „głosowanie portfelem”

Autor: Zbigniew Woźnicki
Przygodę z publicystyką i pisaniem zaczął w serwisie Allegro, gdzie publikował newsy związane z grami, technologią oraz mediami społecznościowymi. Wkrótce zawitał na GRYOnline.pl i Filmomaniaka, pisząc o nowościach związanych z branżą filmową. Mimo związku z serialami, jego serce należy do gier wszelakiego typu. Żaden gatunek mu nie straszny, a przygoda z Tibią nauczyła go, że niebo i muzyka w grach są całkowicie zbędne. Przed laty dzielił się swoimi doświadczeniami, moderując forum mmorpg.org.pl. Uwielbia ponarzekać, ale oczywiście konstruktywnie i z umiarem. Na forum pisze pod ksywką Canaton.