Internetowa maszyna czasu

Udostępnij

Są takie sytuacje w życiu każdego internauty, a co dopiero powiedzieć o tropicielu dezinformacji, że chciałby zobaczyć, jak wyglądały wcześniejsze wersje strony internetowej. Dzięki temu można na przykład sprawdzić, jakie fragmenty strony zostały zmienione czy dodane. Narzędziem, które to umożliwi, jest serwis Wayback Machine – ulubione narzędzie m.in. dziennikarzy śledczych, naukowców i oczywiście fact checkerów.

Jest rok 1996. To co może wydać się Wam nieprawdopodobne, to nie istnieje jeszcze Google (został utworzony dwa lata później), a jego założyciele są pilnymi studentami. W San Francisco Brewster Kahle zakłada Internet Archive, instytucje non-profit, której celem jest archiwizacja zawartości internetu dla potomnych.

Kahle, co potwierdziło się później wielokrotnie, uważał, że jeśli nie będą zapisywane najważniejsze rzeczy w internecie, to w większości przypadków później przepadną. Nie mylił się. Bardzo dużo serwisów, w których nieraz publikowane były cenne materiały, zniknęło bezpowrotnie z internetu. Obiecał też, że po 5 latach archiwum zostanie publicznie udostępnione. Słowa dotrzymał i w 2001 roku pojawiła się na stronie https://archive.org/web/ usługa „Wayback Machine”, co można w wolnym tłumaczeniu rozumieć jako „maszyna czasu”. Działa bardzo prosto: wpisujemy adres interesującej nas strony i po chwili pojawi się widok kalendarza z zaznaczonymi dniami, w których zapisane były tzw. snapshoty – czyli aktualne w danym momencie wersje strony. Zobaczmy to na przykładzie oficjalnego serwisu polskiego rządu. Po otworzeniu strony https://archive.org/web/ wpisujemy adres (w naszym przypadku www.gov.pl) i po chwili zobaczymy kalendarz z zaznaczonymi dniami.

Kółeczko przy każdym dniu oznacza, że strona była zapisana. Jego kolor ma znaczenie:
• niebieski – strona została pobrana bez problemu,
• zielony – w trakcie pobierania pojawiły się jakieś przekierowania (np. na inną stronę lub z innej strony),
• czerwony – wystąpił błąd w pobraniu.

Kalendarz pozwala na wybór strony z danego dnia. Tu mała uwaga: wybrałem stronę, która jest często zapisywana, a to oznacza, że jest ważna i aktywna. Wówczas, podobnie jak Google, specjalny program stworzony przez programistów Internet Archive odwiedza ją codziennie, a w przypadku bardzo ważnych stron lub często aktualizowanych, kilka czy kilkanaście razy dziennie. Dzięki temu możemy obejrzeć kilka snapshotów z tego samego dnia, co jest niekiedy kluczowe w przypadku poszukiwania ściśle określonej wersji strony lub zmian na stronie. Możemy też zobaczyć, jak zmieniały się strony popularnych serwisów w różnym okresie. Poniżej strona Google z marca 2000 roku i 2020 roku.

Strona Google z marca 2000 r. Źródło: Internet Archive
Strona Google z marca 2020 r. Źródło: Internet Archive

Ponieważ jedną z częściej wykorzystywanych funkcji Wayback Machine jest właśnie znajdowanie zmian, to serwis udostępnia specjalną funkcję „Changes”, która umożliwia wyświetlenie dwóch snapshotów z różnych okresów i podkreśla miejsca, w których nastąpiła zmiana. Zobaczmy to na przykładzie naszej strony, poświęconej organizowanym przez Centrum Edukacji Medialnej webinarom. W Wayback Machine wpisujemy „cempolska.pl/konferencje” – czyli wyszukujemy różne wersje tej konkretnej strony. Następnie klikamy w zakładkę „Changes” i wybieramy w kalendarzu najpierw najstarszą wersję strony (3 grudnia 2022) i najnowszą (16 lutego 2022), a następnie klikamy w przycisk „Compare”. Kolorem żółtym zaznaczone są elementy, które zostały usunięte ze strony, a niebieskim te, które zostały dodane.

Używając Wayback Machine z pewnością szybko zauważycie, że niektóre strony są zapisywane nawet kilkanaście razy dziennie, a niektóre co kilka dni, tygodni czy nawet miesięcy. Wynika to z faktu, że serwis stara się wyłapywać nowo pojawiające się strony, ale aktualizuje snapshoty w zależności od ich popularności, częstotliwości uaktualniania itp. W efekcie tych mniej znanych, a być może dla kogoś ważnych, nie można efektywnie analizować, bo jest za mało zrzutów lub są za rzadko wykonywane. Jedynym rozwiązaniem jest… samodzielne tworzenie snapshotów interesujących nas stron. Przypuśćmy, że chcemy uzyskać dostęp do snapshota tweeta Elona Muska, ponieważ obawiamy się, że go przeedytuje lub skasuje. By go stworzyć, kopiujemy adres tweeta, klikamy na stronie Internet Archive w przycisk „Web” i w sekcji „Save Page Now” wpisujemy adres tweeta lub dowolnej strony, którą chcemy zapamiętać w Wayback Machine.

Odszukanie zapisanej wersji strony jest możliwe poprzez jej adres lub jego część, którą wpiszemy do wyszukiwarki.

Wyszukiwanie snapshotów stron można również zautomatyzować i pobrać listę zawierającą snapshoty z wybranego okresu, ale o tym innym razem.

SMS