Hortonworks
Die aktuelle Version 2.1 der "Hortonworks Data Platform" steht seit Kurzem zur Verfügung. Eine Besonderheit ist, dass Hortonworks nicht nur Linux, sondern auch Windows unterstützt. Die Hadoop-Distribution enthält unter anderem die Tools Stinger Solr und Storm, aber auch Lösungen für Sicherheit sowie IT- und Daten-Governance.
- Hortonworks
Die aktuelle Version 2.1 der "Hortonworks Data Platform" steht seit Kurzem zur Verfügung. Eine Besonderheit ist, dass Hortonworks nicht nur Linux, sondern auch Windows unterstützt. Die Hadoop-Distribution enthält unter anderem die Tools Stinger Solr und Storm, aber auch Lösungen für Sicherheit sowie IT- und Daten-Governance. - Hortonworks
Die Versionsgeschichte der Hortonworks Data Platform: An diesem Beispiel wird deutlich, dass Anbieter von Hadoop-Distributionen unterschiedliche Tools wie Tez, Falcon oder Flume in ihre Pakete integrieren, um sich von Mitbewerbern abzuheben. - Hortonworks
Hadoop 1 und 2 im Vergleich: Ein maßgeblicher Unterschied ist die Integration von YARN in Version 2 der Software. - Hortonworks
Knox, ebenfalls ein Open-Source-Tool, stellt Sicherheitsfunktionen für Hadoop zur Verfügung, etwa für die Authentifizierung von Nutzern. - Hortonworks
Struktur der Hadoop-Distribution von Hortonworks
Hortonworks gilt als treibende Kraft hinter der Einführung von YARN (MapReduce 2.0) und zählt zudem den eifrigsten Lieferanten von Programmcode für Hadoop und entsprechende Erweiterungen. YARN ist eine Ergänzung von MapReduce, der traditionellen Batch-Komponente von Hadoop.
Den Consultants von Flux7 zufolge fallen die Performance-Daten der Distributionen von Cloudera und Hortonworks ähnlich aus. Schwächen weist demnach Hortonworks beim Cluster-Management auf. Dieses sei "primitiver" als das bei anderen Distributionen und daher verbesserungsfähig. Allerdings bezieht sich diese Kritik auf die überholte Version 1.3 der Hortonworks Data Platform. Seit April 2014 steht HDP 2.1 zur Verfügung, inklusive Ambari, einer durchaus leistungsstarken Cluster-Management-Konsole.
Ein Pluspunkt ist zudem die Integration von Apache Stinger. Damit will Hortonworks Apache Hive bis auf das Hundertfache beschleunigen. In der aktuellen Ausgabe HDP 2.1 ist Stinger Phase 3 enthalten. Weitere Komponenten von HDP aus der Hadoop-Ökosphäre sind unter anderem Apache Falcon für das Replizieren von Daten und die Authentifizierungssoftware Knox.