Definition
Bevor wir Informationen digital speichern konnten, war Papier ein viel verwendeter Datenspeicher. Heute ist Big Data ein nicht mehr wegzudenkendes Kapitel. Ein Synonym von Big Data ist Datenmengen. Diese Datenmengen sind so voluminös, dass herkömmliche Datenverabeitungssoftware nicht im Stande sind, diese zu verarbeiten. Big Date zeichnet sich vor allem durch folgende Hauptmerkmale aus: Komplexität, Grösse, Schnelllebigkeit und ihre schwache Strukturierung . Bei der Auswertung von Big Data stossen herkömmliche Methoden und Methoden der Datenverarbeitung von Hand schnell an ihre Grenzen. Unter dem Begriff Big Data versteht man im Allgemeinen den Umstand von Unternehmen, dass viele Daten gesammelt werden, welche für die Informationsgewinnung ausschlaggebend sein könnte. Alle zwei Jahren wird sich die Menge der weltweit erzeugten Daten in dem kommenden zehn Jahren verdoppelt. Schätzungen zufolgen beträgt die weltweite Datenmenge aktuell 33.000 Exabytes. Exabyte umfasst nach Dezimalzahl 1018, also eine Trillion Byte. Eine Million Byte ergeben ein Megabyte. Kaum vorstellbar!
Die 3 V's von Big Data
Volume, Velocity und Variety
Volume steht für die immer grösseren Menge des Datenbestands. Big Data sind verpflichtet unstrukturierte und viele Daten geringerer Dichte zu verarbeiten. Um was es bei diesen Daten handelt kann sehr unterschiedlich sein wie zum Beispiel Daten durch Traffic auf einer Webseite oder Twitter Datenfeeds.
Bei Velocity geht es um die immer höhere Geschwindigkeit in den Daten anfallen, gesammelt und verarbeitet werden. Normalerweise machen Daten keine Umwege auf Festplatten, sondern strömt direkt in schnell arbeitende Arbeitsspeicher.
Unter Variety versteht man die grössere Datenvielfalt. Früher gab es strukturierte Datentypen und passten gut in eine Datenbank, der die Speicherung und den Zugriff auf verbundener Datenpunkte ermöglicht; anders gesagt: eine relationale Datenbank. Durch Big Data gelangen Daten in neue sowohl unstrukturierte Datentypen. Un- und halbstrukturierte Datentypen, wie zum Beispiel Texte und Audios, erfordern zusätzliche Vorverarbeitung, um die Bedeutung dieser Datentypen zu verstehen und Metadaten Daten, die anderen Daten übergeordnet sind, zu generieren, um die Verwaltungsarbeiten und die Analyse der Daten zu vereinfachen.
Da sich Big Data immer weiterentwickelt hat, kamen zwei weitere V’s hinzu: Value und Veracity; Wert und Wahrheit. Was nützen Daten, die keinen Wert haben? Ebenso müssen die Daten wahr sein, um uns auf sie zu verlassen.
Schlüsselbegriffe
Datenmengen | Datenverarbeitung | Informationsgewinnung| 33'000 Exabytes | 3Vs + 2