Co warto wiedzieć o cyfrowym oceanie danych?

Udostępnij

Jeśli wiedza to uporządkowane informacje, to jednocześnie współczesny porządek informacji to mniej lub bardziej ujarzmiony ocean cyfrowych danych. Informacje są dla nas autentycznie ważne i informujące, kiedy opowiadają nam świat w zrozumiały i przystępny sposób, tylko wtedy przekładają się na wiedzę. Dane natomiast są cyfrowym kodem, który opisuje świat na potrzeby komputerowych kalkulacji i musi być przystępny dla cyfrowych maszyn w formie prostych sygnałów elektrycznych. Zatem informacje to język kultury i komunikacji społecznej, a dane to kontrolowane przepływy prądu wewnątrz cyfrowych maszyn i ich algorytmów.

Dane powstają na skutek digitalizacji świata, czyli tam i wtedy, gdzie systemy informatyczne za pomocą różnych swoich sensorów (matryce fotograficzne, mikrofony, czujniki) rozpoczęły cyfrowe przetwarzanie i zasysają wcześniejsze sposoby myślenia do wewnątrzcyfrowej rewolucji. Czynią je w ten sposób kompatybilnymi z możliwościami obliczeniowymi komputerów i sieci. Ostatecznie dane zawsze są sformatowane w sposób zerojedynkowy i elektryczny, przy pomocy reguły „0-1, brak-obecność napięcia, nie-tak” opisują świat. Potrzeba ponadprzeciętnych kompetencji matematycznych i inżynierskich, aby słuchać danych i je rozumieć, aby opisać i poinformować nimi świat i siebie.  

Pomimo tego cyfrowego uproszczenia dane są jednak w wielu aspektach podobne do informacji i bliskie kulturze symbolicznej. Ich cyfrowa forma jest sposobem kontrolowania przepływów napięcia elektrycznego wewnątrz maszyn. Mogą być bardzo precyzyjne, konkretne i o małym zasięgu, jak to ma miejsce na przykład wtedy, kiedy pochodzą od sensorów nadzorujących procesy zachodzące w złożonych systemach, takich jak silnik samochodowy czy licznik kroków w smartfonie, ale mogą być także bardzo ogólne, tak jak wtedy, kiedy porządkując te szczegółowe używamy metadanych wewnątrz sieci społecznych. Tak jak ma to miejsce wtedy, gdy chcemy porządkować zasoby cyfrowe tworząc dane o danych (metadane), na przykład w formie hashtagów, słów kluczy, indeksów czy hiperłączy. Dzięki danym o danych tworzymy mechanizmy pracy z danymi, które są powszechnie dostępne, stosunkowo proste w użytkowaniu, a przede wszystkim uspołeczniają te cyfrowe zasoby, tworząc z nich informacje i w rezultacie wiedzę. Naturalnie, tego rodzaju gry z danymi to nie tylko miejsce dla bezinteresownej współpracy internautów, ale i przestrzeń wpływów aktorów politycznych, rządów i przede wszystkim wielkich cyfrowych przedsiębiorstw zarabiających na wprowadzaniu danych do obiegu, pozyskiwaniu ich z przeróżnych źródeł i organizacji ich przepływów oraz dostępu do nich.  

W najbardziej optymistycznej i utopijnej wersji cyfrowej wyobraźni wszystko może i powinno być cyfrowe, a zatem wszelkie możliwe informacje i wiedza powinny być zdigitalizowane, to jest stać się danymi na potrzeby kalkulacji komputerowych. Te kalkulacje, czyli procesy obliczeniowe prowadzone przez cyfrowe maszyny obliczeniowe, polegają na przetwarzaniu danych zgodnie z instrukcjami wyrażonymi przez programistów w formie algorytmów, skryptów, aplikacji czy programów. Dane same w sobie są często określane cyfrowymi śmieciami, a internet pełen ich przeróżnych pakietów i strumieni bywa określany „wielkim śmietnikiem”. I faktycznie, ocean cyfrowych danych przytłacza swoją wielkością i odpycha brakiem przejrzystości, o ile nie potrafimy przy pomocy algorytmów czy apek (takich jak choćby wyszukiwarki) zapanować nad prądami danych i nie umiemy wyłowić zaszyfrowanej w nich wiedzy. Dane są o tyle użyteczne, o ile potrafimy odnaleźć właściwe ich źródła i zasoby oraz porządkować je i mieć z nich pożytek dzięki algorytmom, które w tym celu programujemy, oraz bazom danych, czyli zbiornikom określonych danych, które uporządkowane są według narzuconych im przez nas kryteriów. Taką wielką bazą danych jest choćby każdy serwis streamingowy, sklep internetowy, bank ze zdjęciami czy materiałami tekstowymi, które możemy układać według słów kluczy, segregując od treści najnowszych czy najlepiej ocenianych. 

Współcześnie największym wyzwaniem świata cyfrowych danych jest kwestia otwartego dostępu i możliwości łatwego wykorzystania. To problem danych generowanych za pieniądze podatników, którzy chcą mieć do nich dostęp nie godząc się na monopol państw i korporacji w tym zakresie. To także kwestia społecznej i kulturowej kreatywności, dla której łatwy i możliwie mało ograniczony dostęp do zasobów cyfrowych wydaje się być fundamentem. W tle kryje się wielka społeczna debata o piractwie, prawach własności intelektualnej, kontroli i nadzorze czy swobodnym dostępie do treści kulturowych.  

DR HAB. PIOTR CELIŃSKI, PROF. UMCS

medioznawca, pracuje w Katedrze Teorii Mediów UMCS w Lublinie. Zajmuje się nowymi mediami, internetem, kulturą cyfrową, komunikacją społeczną, kulturą wizualną i popularną. Współzałożyciel i członek zarządu Fundacji Instytut Kultury Cyfrowej, współtwórca wydarzeń kulturalnych, wystaw i działań edukacyjnych (MindwareEPCC), w latach 2015-18 zastępca dyrektora Centrum Badań Gier Wideo UMCS