Big Data – technologia większa niż myślisz.

Świat nierozerwalnie związany jest z danymi. Od dokumentów historycznych, książek, po dane pozwalające przewidywać pogodę czy wykorzystywane przez naukowców z niemal każdej dziedziny wiedzy. Jednak w XXI wieku dane, związane choćby z biznesem, rozrywką czy mediami społecznościowym, generowane są w zastraszającym tempie.

Potwierdzają to prognozy, wskazujące że ich obecny dzienny przyrost może przekroczyć to, co ludzkość wyprodukowała w całej swojej historii (włącznie z XX wiekiem). Forrester Research ocenia natomiast, że obecnie ilość zebranych danych to ok. 2.7 zettabajtów, a przewidywania dotyczące wzrostu zaczną spełniać prawo Moore’a w ciągu najbliższych kilku lat.

Maszyna do tworzenia danych

Wszystko, co robimy w sieci, m.in.: korzystanie z serwisów społecznościowych, czatowanie, tweetowanie, wysyłanie maili, przeglądanie zasobów internetowych czy konfiguracja kont i dokonywanie zakupów w sklepach internetowych, skutkuje zbieraniem dużych ilości danych. Te informacje muszą być zapisane i przenalizowane na żądanie. Po stronie serwerów, już same systemy logujące generują dużo „drobnych informacji” przez wejścia na stronę użytkowników. Przykładowo, mały serwis, odwiedzany dziennie przez kilkuset użytkowników, może wygenerować kilkaset MB danych tekstowych jednego dnia. W ciągu miesiąca jest to kilka GB, a po kilku latach istnienia stale rozwijającego się serwisu, zgromadzone dane mogą być liczone nawet w TB!

Dane do przechowania

Powiedzmy to wprost – nigdy nie dysponowaliśmy taką ilością danych jak dziś. Procesy dotyczące ich przetwarzania, przechowywania, zarządzania i dystrybucji to poważne wyzwanie technologiczne. Wraz ze wzrastającą ilością danych (z których większość i tak nigdy nie zostanie wykorzystana) coraz bardziej potrzebujemy technologii, która sprawnie i szybko przetworzy oraz przeanalizuje tak duże zbiory. I mamy ją! A kryje się ona pod dosyć chwytliwym marketingowym określeniem – Big Data.

Big Data, czyli 3xV

Badacze Forrester Research definiują Big Data jako techniki i technologie, które umożliwiają uzyskanie wartości biznesowej z zebranych danych. Od strony nauk informatycznych technologia ta musi spełniać cechy określane skrótem 3xV:

1. Volume – duże zbiory danych
2. Velocity – konieczność szybkiej analizy – uzyskania odpowiedzi z zebranych danych
3. Variety – różne typy danych – zestrukturyzowane i niestrukturyzowane.

blog_tech_Big_Data_TEKST

Chmura nad Big Data

Big Data to technologia wymagająca pod każdym względem. Najważniejsze z wymagań dotyczą szerokiego spektrum technologii, umiejętności i inwestycji, dostępu do dużej ilości danych znajdujących się poza naszymi systemami oraz do różnego rodzaju usług czy aplikacji. I tu pojawiają się kluczowe pytania dla osób zainteresowanych tą technologią:

  • Czy dysponujemy odpowiednimi zasobami, aby sprostać wymaganiom technologicznym Big Data?
  • Czy jeśli wymaga ona dostępu do dużej ilości danych znajdujących się poza naszymi systemami, sensowne jest filtrowanie i przenoszenie tych danych do wewnętrznych zasobów?
  • Czy nie warto skupić się jedynie na wartości, którą można uzyskać z zebranych danych, zamiast samemu tym zarządzać?

Te pytania podsuwają już sugestie co do środowiska, w którym Big Data może rozwijać się bardzo korzystnie, a jest nim chmura obliczeniowa. Cloud computing to przede wszystkim media, zbiory danych i aplikacje. Technologia ta dzięki swojej ogromnej elastyczności, pozwala na gromadzenie danych nieobciążające użytkownika. Z tego względu warto ją rozważyć poszukując środowiska idealnego do budowania i tworzenia Big Data.

W kolejnych wpisach rozwinę temat technologii i technik wykorzystywanych w Big Data. Więcej o Big Data na stronie computerword.