Vorbereitung des Hadoop Clusters für SAP HANA Vora

SAP HANA Vora ist nun in aller Munde und die Integrationsmöglichkeiten eines derartigen „Data Lakes“ mit SAP HANA spätestens nach der TechEd in Barcelona allgemein bekannt. Aber was ist überhaupt notwendig ein derartiges SAP HANA Vora Cluster [Hadoop Cluster mit SAP HANA Vora Services] betreiben zu können?

Zum einen werden mindestens 3 Computer (Instanzen) benötigt, die zu 3 Knotenpunkten innerhalb eines Clusters zusammengebracht werden. Zum anderen müssen diverse Services zusätzlich zu SAP HANA Vora installiert sein.

  • Hadoop Distributed File System (HDFS) high-throughput access to application data
  • YARN+MapReduce2 job scheduling and cluster resource management
  • ZooKeeper coordination service for distributed applications
  • Ambari Metrics monitoring nodes
  • Spark fast compute engine (in-memory)

Nach erfolgreicher Installation und Starten der zuvor genannten Services, kann SAP HANA Vora installiert werden.

In der folgenden Abbildung ist das Ambari Dashboard des biX_Cluster zu sehen. Links sind die installierten und aktiven (grüner Haken) Services, die zuvor beschrieben worden sind, zu sehen. Von hier aus können weitere Services dem Cluster hinzugefügt werden. Darüber hinaus können auch weitere Computer (Instanzen) durch diese Weboberfläche angefügt werden.

blogeintrag

 

Bei Fragen rund um das Thema SAP HANA Vora steht Ihnen das Expertenteam der biX gerne zur Verfügung.

kroll_niklas0
Niklas Kroll

Berater Business Intelligence

Getagged mit: , , , , , , , , , , ,