Zusammenfassung
Verfolgt man die Diskussionen in der europäischen Wirtschaft, erkennt man, dass der Begriff Big Data in der Praxis nicht klar definiert ist. Er ist zwar in aller Munde, doch nur wenige haben eine klare Antwort auf die Frage, was Big Data ist und wo es sich von klassischen Daten einer Unternehmung unterscheidet. Dieser Beitrag gibt eine Einführung in Big Data. Anhand von Volume, Velocity und Variety werden grundlegende Merkmale von Big Data erläutert. Um Big Data wertschöpfend in einer Firma einzusetzen braucht es neue Technologien und neue Fähigkeiten, damit mit solchen Daten besser umgegangen werden kann. In diesem Beitrag werden die Hauptgruppen und einige Vertreter von solchen neuen Technologien kurz erläutert. Letztlich werden die Chancen und Risiken von Big Data in Unternehmen betrachtet.
Notes
Es ist hier zu vermerken, dass der Autor diese Kategorisierung nicht trennscharf betrachtet. Firmen haben oft ein Mischmodell beider Kategorien und nur wenige sind Reinformen dieser Kategorien.
Diese Aufzählung ist nicht als vollständig zu betrachten. Es gibt noch eine grosse Anzahl Firmen, wie Facebook, Twitter, etc., die viel zu diesen Technologien beigetragen haben.
Systemverbund ist der Versuch der Autoren das englische Wort „Cluster“ in diesem Kontext zu übersetzen. Im Folgenden werden die Wörter Cluster und Systemverbund synonym verwendet.
Literatur
Adrian M (2011) It’s going mainstream, and it’s your next opportunity. Teradata Magazine Online. http://www.teradatamagazine.com/v11n01/Features/Big-Data/. Zugegriffen: 03. Juni 2014
Brewer EA (2000) Towards robust distributed systems. In Symposium on Principles of Distributed Computing (PODC)
Chang F, Dean J, Ghemawat S, Hsieh WC, Wallach DA, Burrows M, Chandra T, Fikes A, Gruber RE (2006) Bigtable: a distributed storage system for structured data. OSDI’06: Seventh symposium on operating system design and implementation
Cudré-Mauroux P, Fasel D (2014) Le big data au service de la business intelligence. ICTjournal, Schweiz, März 2014
Dean J, Ghemawat S (2004) MapReduce: simplified data processing on large clusters. In Proceedings OSDI’04: sixth symposium on operating system design and implementation, San Francisco, USA
DeCandia G, Hastorun D, Jampani M, Kakulapati G, Lakshman A, Pilchin A, Sivasubramanian S, Vosshall P, Vogels W (2007) Dynamo: Amazon’s highly available key-value store. SOSP 2007: 21st ACM symposium on operating systems principles
Franks B (2012) Taming the Big Data tidal wave. Wiley Publishing, Inc.
Ghemawat S, Gobioff H, Leung S-T (2003) The google file system. 19th ACM symposium on operating systems principles
Harris D (2013) The history of Hadoop: from 4 nodes to the future of data. http://gigaom.com/2013/03/04/the-history-of-hadoop-from-4-nodes-to-the-future-of-data/
Manyika J, Chui M, Brown B, Bughin J, Dobbs R, Roxburgh V, Byers AH (2011) Big Data: the next frontier for innovation, competition, and productivity. Technical report, MacKinsey Global Institute
Marz N, Warren J (2014) Big Data: Principles and best practices of scalable realtime data systems. Manning Publications, USA
Needham J (2013) Disruptive possibilities. O’Reilly Media, Inc., USA
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Fasel, D. Big Data – Eine Einführung. HMD 51, 386–400 (2014). https://doi.org/10.1365/s40702-014-0054-8
Received:
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1365/s40702-014-0054-8