Jeste li se ikada pitali kako možete potražiti stare stranice? Baš vas zanima nešto što je jako staro, Google pretraga ne vraća ništa konkretno, a vi znate da je postojala dobra stranica s podacima koji vas zanimaju, ali je vrijeme pregazilo tu stranicu. Iz nekog bizarnog razloga trebate neki softver ili driver za Windows XP ili, ne daj bože, još nešto starije, a ti podaci se ne nalaze na aktualnim, živim stranicama (jer zašto bi). Tada u priču ulazi Internet Archive.
Internet Archive je neprofitna organizacija kojoj je cilj spremanje internetske prošlosti – i lijepih stvari, i onih možda manje lijepih, ali definitivno dijela prošlosti. Spremaju se, recimo, snimke zaslona stranica po datumima, stari filmovi, glazba, edukacijski sadržaji i razni softver.
Zamislite scenarij u kojem istražujete neku vijest ili informaciju za koju ste sigurni da je postojala na nekoj stranici, a sada kada provjeravate tu stranicu, nema sadržaja koji vas zanima ili je on drukčiji. Moguće je, naravno, da ste krivo zapamtili, ali isto tako je moguće da je sadržaj uklonjen ili izmijenjen od strane autora. No, vi ste, naravno, kao i svi, sigurni u svoje sjećanje i možete ga provjeriti ako odete na Wayback Machine stranicu i provjerite to. Wayback Machine je projekt od Internet Archivea koji vam omogućuje da se vratite u vrijeme i vidite stranicu kakva je bila jučer, prije mjesec dana ili nekoliko godina. Time možete provjeriti sjećate li se ispravno, ali isto tako vidjeti je li, na primjer, neki portal prenosio lažne informacije od kojih se kasnije pokušava ograditi.
Slična situacija je sa znanstvenim radovima, knjigama ili bilo kakvim dokumentima – sadržaj se čuva na nekim stranicama, ali jednom kada ta stranica prestane raditi, taj sadržaj se gubi i ne postoji način da ga pronađete osim da pribavite fizičku kopiju.
Internet Archive, iako ima plemenitu misiju, posljednjih se nekoliko godina bori s brojnim izazovima.
Jedan od najvećih problema je sudski spor u kojem nekoliko velikih izdavača knjiga tuži Internet Archive radi kršenja autorskih prava. Sve je počelo 2020. godine kada je Internet Archive pokrenuo projekt NEL (National Emergency Library) kao odgovor na COVID pandemiju i zatvaranje knjižnica. Cilj je bio omogućiti studentima, istraživačima i ostalima da neometano pristupaju milijunima knjiga. Iako se Internet Archive bavio sličnim projektom zvanim Open Library, koji je skenirao radove i dozvoljavao da u svakom trenutku samo jedna osoba ima digitalnu kopiju dokumenta, NEL je bio drukčiji. Internet Archive u NEL projektu nije vodio računa o tom omjeru i izdavao je više kopija nego što je smio. To se izuzetno nije svidjelo izdavačima knjiga (možemo vidjeti i zašto), pa su ih odveli na sudski spor gdje su na kraju izdavači dobili presudu. Plemenita misija, ali loša egzekucija mogla je jako skupo koštati Internet Archive i potencijalno dovesti do gašenja projekta.
Nakon nekoliko mjeseci mira i oporavka od sudskog spora, pojavili su se potpuno drukčiji problemi. Iako je Internet Archive navikao na brojne DDoS napade od kojih se mora stalno braniti, nedavno je to otišlo korak dalje. Posjetitelji stranice bili su "pozdravljeni" sljedećom popup porukom: “Have you ever felt like the Internet Archive runs on sticks and is constantly on the verge of suffering a catastrophic security breach? It just happened. See 31 million of you on HIBP!”. HIBP se odnosi na stranicu "Have I Been Pwned", gdje možete unijeti svoj email ili čak lozinku da provjerite jesu li vaši email ili lozinka zahvaćeni nekim sigurnosnim incidentom. Stranica je legitiman projekt koji prikuplja podatke sa svih strana interneta i pomaže vam barem na način da vam javi da promijenite svoju lozinku na nekoj stranici (ili na više njih) ako su vaši osjetljivi podaci u rukama hakera. Upravo to se dogodilo s Internet Archiveom i nedugo nakon toga je potvrđeno da je informacija istinita i da su korisnička imena, emailovi i hashovi lozinki postali dostupni na internetu. Prilično crn scenarij za neprofitnu organizaciju koja se u posljednje vrijeme nosi s brojnim problemima.
Srećom, Internet Archive je ponovo podignut i stvari funkcioniraju koliko-toliko normalno, a najveća je sreća da arhivirani podaci nisu izgubljeni ili uništeni. Internet Archive je mali projekt koji pokušava arhivirati sve nama drage i potrebne stvari kako ih nikada ne bismo izgubili i kako bi znanje ostalo sačuvano za naredne generacije. Kao takav, trebamo ga štititi i nadati se da će uspjeti u svojim naumima.