Marktübersicht Hadoop-Distributionen
Unübersichtlich ist mittlerweile das Hadoop-Angebot für Unternehmen geworden
Hadoop ist ein seit 2008 bei der Apache Software Foundation angesiedeltes Top-Level-Projekt, das sich aufgrund des großen Interesses von Anwenderunternehmen rasant weiterentwickelt
(13.06.14) - Mit der Untersuchung "Hadoop-Distributionen im Vergleich" des Business Application Research Center (Barc) erhalten Unternehmen jetzt erstmals einen Überblick über die diversen auf Apache Hadoop basierenden, aber funktional oft unterschiedlichen Angebote für die Verwaltung von Big Data-Daten.
Der Wunsch nach einer geschäftlichen Nutzung von Big Data hat in den vergangenen Monaten auch die Nachfrage nach neuen Techniken verstärkt, mit denen sich solche großen, polystrukturierten Datenbestände verwalten sowie schnell und fortschrittlich auswerten lassen. Einer der größten Hoffnungsträger ist hierbei "Hadoop", eine Sammlung von Komponenten für unterschiedliche Aufgabenstellungen für die Verwaltung und den Zugriff auf strukturierte und unstrukturierte Daten.
Hadoop ist ein seit 2008 bei der Apache Software Foundation angesiedeltes Top-Level-Projekt, das sich aufgrund des großen Interesses von Anwenderunternehmen rasant weiterentwickelt. Arbeitsschwerpunkte sind aktuell die Performance, die Stabilität, Sicherheitsmechanismen sowie die Analysefähigkeit, Nutzbarkeit, Wartbarkeit und die Administrierbarkeit des komplexen Frameworks. Das Versprechen kommerzieller Softwareanbieter ist es somit, die Community-getriebene Open Source Apache Hadoop Distribution "unternehmensfähig" auch für die Ansprüche von Großunternehmen nutzbar zu machen. Begleitend ist hierfür ein verlässlicher Support anzubieten und Fragen der Haftung zu klären.
Aufbauend auf dem Apache-Projekt versuchen diverse Anbieter mit ihren eigenständigen Hadoop-Distributionen die genannten Schwächen zu beseitigen, Lücken zu füllen und durch einen "Added Value" im Markt zu punkten. So konkurrieren aktuell reine Hadoop-Distributionen (Cloudera, Hortonworks, MapR), Software-Stack-Anbieter (IBM), Speicherlösungs-Anbieter mit Hadoop-Angebot (NetApp, Pivotal) und Cloud-Service-Anbieter (Amazon, Microsoft, Rackspace) um die Gunst der Kunden.
Vielfalt der Hadoop-Distributionen
Entsprechend unübersichtlich ist mittlerweile das Hadoop-Angebot für Unternehmen geworden. Eine gute Orientierung bietet die neue Marktübersicht "Hadoop-Distributionen im Vergleich" des Barc. Nach einer kurzen Einführung zu Hadoop und seinen Komponenten stellt die Untersuchung die fünf eigenständigen kommerziellen Hadoop-Distributionen Cloudera, Hortonworks, IBM, MapR und Pivotal detailliert gegenüber und gibt dem Leser dabei Auswahlkriterien für deren Bewertung an die Hand.
Allen Distributionen gemein ist laut Barc-Studie, dass ihre Entwickler angesichts der hohen Anzahl von Komponenten und Werkzeuge, die in Hadoop-Umgebungen für die Integration, Speicherung, Zugriff, Analyse und das Reporting zum Einsatz kommen, das Datenmanagement durch eine einheitliche Administrationskomponente vereinfachen wollen. Dabei zeigen sich in der Praxis vor allem in den Bereichen Datenmanagement, Security, Analytics und Benutzerfreundlichkeit einige Unterschiede zwischen den Angeboten.
"In dem Maße wie in den kommenden Monaten solche Datenmanagementfunktionen in Open-Source-Distributionen wie "Hortonworks" verfügbar werden, wird sich der bislang noch teuer bezahlte "Added Value" anderer Distributionen nicht mehr rechtfertigen lassen", kommentiert Timm Grosser, Co-Autor und Senior Analyst beim Barc, die weitere Entwicklung. "Unternehmen sollten aufgrund seiner großen Dynamik den Hadoop-Markt die eingesetzten Distributionen kontinuierlich evaluieren." (Barc: ra)
Barc Institut: Kontakt und Steckbrief
Der Informationsanbieter hat seinen Kontakt leider noch nicht freigeschaltet.