SAP HANA – eine Einführung

(Last Updated On: 29. September 2015)

Was ist SAP HANA und was ist das besondere daran?

SAP HANA ist ein Thema, an welchem man heutzutage nicht mehr vorbei kommt. Doch was verbirgt sich hinter diesem schönen Begriff?

In meinem Posting, welcher eine Übersicht über Data Warehousing-Lösungen bietet, habe ich erläutert, dass es zwei extra datenbanken gibt: eine für das ERP-System eines Unterenhmens, in welchem Daten eingetragen und gepflegt werden – und eine für das Data Warehousing-System, in welchem Daten aggregiert und zur Trend-Analyse und für Vorhersagen des Managements abgefragt werden.

SAP HANA ist ein 2010 veröffentlichtes AICD-compliant (Atomicity, Consistency, Isolation, Durability) Datenbankmanagementsystem und hat einige Vorteile im Vergleich zu anderen relationalen Datenbanksystemen, also im Vergleich zu beispielsweise

  • IBM DB2
  • Oracle Database
  • Microsoft SQL Server
  • SAP MAXDB

Der Grund hierfür ist, das SAP HANA auf die Verwendung in einem Szenario für ERP- und Data-Warehousing-Software optimiert wurde.

Zunächst einmla ist eine SAP HANA eine in-memory-Database. Einfach gesagt: alle Daten der Datenbank werden im Arbeitsspeicher, und nicht auf der festplatte / SSD eines Systems, vorgehalten. Die Datenbank ist dadurch messbar 5-7x so schnell wie ein gewöhnliches relationales Datenbankmanagementsystem. Dazu nutzt sie eine sogenannte In Memory computing Engine (IMCE).

SAP HANA hält die Daten in einem komprimierten Format vor. Mit nur einem TeraByte Arbeitsspeicher lassen sich so beispielsweise 5 TB unkomprimierte Daten vorhalten. Der Effekt skaliert sich immer weiter hoch. mit 8 TB RAM kann man 40 TB unkomprimierte daten im Arbeitsspeciher vorhalten, mit 100 TB RAM können 500 TB vorgehalten werden.

durch diese hohe Performance ist es möglich, dass das ERP-System und das Data Warehousing-System beide die selbe Datenbank verwenden. Also können sowohl die mitarbetier eines Unterenehmens mit den Daten des ERP-Systems arbeiten, und das Management kann aber auch mit den Daten des Warehousing-systems analysen und Trends durchführen lassen.

das spart im endeffekt hardwarekosten, da nicht mehr zwie Datenbanken betrieben werden müssen. Es entfallen Kosten für den Server selbst, die Netzwerk- und Speicherinfrastruktur usw. Desweiteren werden Unterhaltungskosten wie Verschleiß, Strom und Kosten für netzwerkbandbreite gespart.

SAP HANA ist eine spaltenorientierte Datenbank. Ich will hier jeztt nicht genau ins Detail gehen, nur folgendes: eine spaltenorientierte datenbank hat diverse Vorteile bie Abfragen zu bieten, weil dann eventuell nicht jede Zeile gelesen werden muss, sondern nur die zeilen, in denen die einzelnen Attributswerte (Spaltenwerte) gespeichert sind.  Dafür hat eine spaltenorientierte Datenbank Nachteile beim Einfügen und Ändern von Datensätzen, da hier mehr Schreibvorgänge dstattfinden müssen als bie einer zielenorientierten. Der Grund für eine spalteorientierte Datenbank ist aber nicht unbedingt der, dass man sich bei Abfragen leichter tut – schließlich vereinat man bei SAP HANA ja die ERP-Datenbank, in welcher viel geschrieben und verändert wird, mit der Data-Warehouse-Datenbank, in der viel abgefragt wird. Im mittel gleicht es sich wahrscheinlich also aus. Nein: der eigentliche Grunde für eine spaltenorientierte Datenbank ist, dass sie sich besser komprimieren lässt als eine zeilenorientierte – und somit ist es möglich, dass wir mit 1 TB Daten im Arbeitsspeicher  5 TB unkomprimierte daten vorhalten können.

Die Entwicklung von SAP HANA wurde erst mit der Entwicklung unserer Computerhardware im aktuellen Jahrzehnt möglich. Die Faktoren, welche SAP HANA m,öglich machten, sind:

  • preisgünstiger Arbeitsspeicher
  • Mehrkernprozessoren, die eine vielzahl von Datenbankabfragen bewältigen und (ent)komprimierungsvorgänge performant durchführen können
  • Solid State Drives, die es ermöglichen, dass in der Festplatte dauerhaft hinterlegte Informationen schnell gelesen und somit in den Arbeitsspeicher übertragen werden können.

Weiterhin liefert SAP ein paar Zuckerl, die für SAP HANA sprechen. Wird ein SAP-HANA-DBMS auf zertifzierter Hardware installiert, garantiert SAP die Leistung der Datenbank. Das trauen sich Unternehmen wie beispielsweise IBM und Oracle nicht in diesem Umfang.

SAP HANA sollte nicht nur, sondern muss auf zertifizierter Hardware installiet werden. Deswegen spricht man bei SAP HANA nicht von einer Software, sondern von einer Appliance – also einer Verheiratung zwischen Hardware und software als geschlossene Lösung. Dadurch will SAP die Stabilität seiner HANA-Systeme sicherstellen.

zertifizierte Hardware-appliances kommen beispielsweise von

  • Cisco
  • Dell
  • fujitsu
  • Hitachi
  • HP
  • IBM
  • NEC

Als Appliance wird eine SAP HANA Datenbank oft in Verbindung mit dem Data Warehousng-System SAP BI ausgeliefert. in dieser verbindung  – SAP HANA mit SAP BI, ist dieses Produkt marktführend und steht in KOnkurrenz zu folgenden Data Warehousing-Appliances.

  • Microsoft Parallel Data Warehouse
  • Teradata Active enterprise Data Warehouse 5600
  • Oralce exadata Database Machine
  • Oralce exalytics In-Memory Machine
  • EMC greenplum Data computing appliance
  • IBM Netezza Dta warehouse Appliance
  • HP Vertica analytics Platform

Desweiteren steht SAP HANA alleinstehend als in-memory Datenbank in Konkurrenz zu anderen in-memory datenbanken

  • Kognitio Analytical Platform
  • IBM solidDB
  • Oracle Times Ten
  • Software AG Terracotta BigMemory
  • Manifact

Desweiteren ist SAP HANA eine von SAP entwickelte Datenbank, das bedeutet es gibt keine Third-Party-Komplikationen zwischen Datenbank und anwendungssoftware mehr.

Und jetzt kommt der eigentliche Clou: Weil SAP HANA es ermöglicht, dass das ERP-System und das Data Warehousing zusammenarbeiten, ist es einfacher, etwas am System zu verändern, ohne dass eine der anderen Komponenten zusammenbricht, weil es mit der Veränderung nicht arbeiten kann. Eine solche Veränderung wäre etwa, weil wir ein neues Modul, beispielsweise Material Management, in unsere Business Suite hinzufügen (in unser ERP-System), was wir zuvor noch nicht hatten. Das DAta Warehousing kann mit dieser Änderung nicht umgehen, bis diese Änderung im ERP-System auf das Data Warehousing System manuell übertragen wurde.

Da aber SAP HANA es ermöglicht, in Echtzeit zwischen ERP-System und Data Warehousing-System zu kommunizieren, ist es einfacher möglich, Änderungen an beiden Systembestandteilen gleichzetiig zu machen – dadurch ist das System  besser wartbar. Und: da niocht erst umständlcih Daten zwischen der ERP-Datenbank und der Data Warehousing-Datenbank ausgetauscht werden können, gehen bestimmte Transaktionen nun schneller vonstatten – da man sich diesen Austausch nun sparen kann. da die Transaktionen nun schneller von statten gehen, sind die Systeme auch immer aktueller, und somit kann man auch schneller mit den Daten Data-Warehouse-Reports erstellen. Somit ist die Entscheidungsfindung im Management schneller, was Zeitgewinne gegenüber der Konkurrenz bringt.

die Performance von SAP HANA machte auch erst bestimmte Entwicklungen im SAP-produktportfolio möglich. So kann SAP mit der Entwicklung von SAP HANA erstmalig perofrmante mobile Applikationen anbieten, so dass Außendienstler und Mitarbeiter im Home-Office auf ihren mobilen Geräten zeitnah mit Business-Inforamtionen versorgt werden können.

SAP HANA steht übrigens nicht für irgendwas, es ist kein Akronym, sondern lediglich ein Name. es heißt schlicht und einfach HANA.

Big Data

Heutztuage sind Unternehmen immer mehr dazu angehalten, Entscheidungen in Echtzeit zu treffen.  Damit einher geht die Herausforderung an die IT, um immer schnellere Methodiken zur Bereitstellung analytischer Informationen bereitzustellen.

Früher wurden die analytischen Daten erst durch das Data Warehousing System gejagt und daraufhin wurden dann Informationen und Grafiken zusammengetragen, die anschließend dem Management zur Entscheidungsfindung zur Verfügung gestellt wurden. Dieser zeitaufwändige Prozess reicht dem Management führender Unternehmen heute schon nicht mehr aus.

Mit heutigen Big Data Lösungen – und SAP HANA ist eine davon – ist es beispielsweise möglich, das Echtzeitverhalten eines Users in einem Online-Shop zu analysieren. Also über welchen Werbebannern lässt er den Mauszeiger besonders lange schweben, nach welchen Artikeln sucht er, ohne dabei jedoch die Enter-Taste zu drücken und die Suche abzuschicken, und welche Produkte liked er in seinem Facebook-Profil? Diese Informationen werden nun in Echtzeit ausgewertet und dem User werden dabei noch während er surft passende Produkte für seine Interessen angezeigt und für ihn interessante Werbebanner eingeblendet. Gleichzeitig werden passende Werbe-E-Mails an sein Konto gesendet.

Und jetzt denken Sie weiter: Ihnen gehört ein Lebensmittelgeschäft und Sie möchten anhand der Echtzeitverkaufszahlen beliebte Produkte schon wieder nachbestellen, bevor Sie überhaupt gehen, damit keine Engpässe entstehen. Also msüsen Sie ständig in Echtzeit statistik darüber führen, wie oft sich ein Artikel aktuell pro Stunde verkauft. Um zu wissen, wann Sie spätestnes bestellen müssen, müssen Sie immer den aktuellen Lagerstand und die aktuelle Lieferzeit ihres Zulieferers kennen. Und wenn Sie wissen wollen, wann Sie am besten bestellen, die aktuellen Saisonpreise Ihrer Artikel bei diesen Zulieferern. Sie können noch viel mehr Faktoren in die Berechnung mit einfließen lassen, etwa ob das Wetter gerade gut ist (ERfrischrungsgetränke) oder wie die Temperaturen sind (Frostschutzmittel und Streusalz).

Damit diese Datenbereitstellung derart schnell, also in Echtzeit, von statten geht, bedarf es verschiedener Technologien, die SAP HANA unter seiner Haube vereint. Die massive aprallele Verabreitung von Informationen auf einer Plattform benennt SAP mit dem Begriff Massive parallel Processing (MPP).

Damit Sie eine Vorstellung davon haben, wie groß das thema Big Data mittlerweile ist: Mehr als 90% der heute verfügbaren Daten wurden erst in den letzten zwei Jahren erzeugt. Computersysteme wie wir sie heute kennen gibt es seit den 60ern. Sind Sie jetzt überzeugt?

Herkunft von SAP HANA

HANA wurde aus drei Komponenten entwickelt, die von SAP in der Vergangenheit released wurden

  • TREX. Text Retrieval and information Extraction. dies ist die Suchengine die in NetWeaver und Business intelligence genutzt wird. Sie wurde ursprünglich 2010 als Komponente veröffentlicht.
  • MaxDB. Enterprise-Level relationales Datenbankmanagementsystem, welche sich jedoch in der Regel nicht mit den konkurrenzprodukten IBM DB2, Oracle Databse und microsoft SQL Server messen konnte. Sie wurde ursprünglich 1977 erstellt. Zwischendurch wurde das DBMS mal umbenannt zu SAPDB, als SAP und mySQL eine PArtnerschaft eingingen. Nun ist die Partnerschaft wiederaufgelöst und wir sind wieder beim Namen maxDB
  • P*Time. Dies war ein zeilenbasiertes in-memory enterprise-Level Datenbankmanagementsystem. Im Gegensatz zu HANA war hier noch keine spaltenbasierung vorhanden. Sie wurde daher größtenteils für OLTP-Syteme, also für ERP-Systeme genutzt, da hier größtenteils Geschrieben und geändert, und weniger abgefragt wird. Der heruasgeber wurde von SAP aufgekauft.

aus diesen drei Produkten wurde mit ihren kombinierten Stärken das Produkt SAP HANA erstellt.

Die Komponenten von SAP HANA

SAP HANA besteht aus verschiedenen KLomponenten

  • SAP HANA DB. Die ist der Kern der Lösung, die datenbank selbst.
  • SAP HANA Appliance. Dieser Begriff bedeutet, dass die anderen HANA kompoentne, also HANA DB, HANA Studio usw., auf zertifizierter Hardware installiert sein müssen. Ist das der fall, garantiert SAP die Leistungsfähigkeit und Stabilität des Systems. Die SAP-HANA-Software ist also auf die zertifzierte Hardware speziell zugeschnitten. IHr könnt euch das ungefähr wie ein Apple MacBook oder eine Spielekonsole vorstellen: Die Software ist speziell auf die Hardware zugeschnitten – was diverse Vorteile mit sich bringt.
  • SAP HANA Studio. Das Studio ist für die Modellierng einer Datenbank zuständig. Es liefert also Tools zum Modellieren einer Datenbank.
  • SAP HANA Application Cloud. SAP HANA ist auch als Service in einer cloud-infrastruktur verfügbar.

modelling mit SAP HANA Studio

SAP HANA Studio ist, wie wir bereits kennengelernt haben, das modelling-Tool für SAP HANA. Es dient dazu, Daten in der HANA Datenbank zu modellieren und sie somit optimal für beispielsweise das Data Warehousing vorzubereiten.

Beim modellieren in SAP HANA Studio erstellt man in der Regel verschiedene Views

  • Attribute View. Ein Attribute View ist ein SAP BI / BW Info Object. Mehr über Info Objects gibt es in meinem Beitrag SAP BI Data Warehousing erklärt
  • Analytical View. Eine Analytical View ist ein InfoCube in SAP BI / BW. Mehr darüber im verlinkten Post.
  • Calculation View. Eine Calculation View ist Multi Provider in einem SAP BI System.

die Frage, die sich jeder von Ihnen stellt

Aber die daten in SAP HANA sind doch vollständig im Arbeitsspeicher. Gehen die Daten nun verloren, wenn ein Stromausfall mein System ausknockt?

Die Datenbank speichert Änderungen an der Datenbank zunäcjhst wirklich nur im Hauptspeicher, der wiedeurm in Seiten unterteilt ist (Pages). Werdne Daten durhc eien Transkation geändert, werden die Änderungen an diesen Seiten in ein Transaktionslog geschrieben, welches auf die Festplatte geschribeen wird. Erst, wenn diese ÄNderungen auf die Festplatte wandern, ist die Transaktion abgeschlossen und somit persistent.

Desweiteren werden die aktualisierten Pages auch hin und wieder in die Datendateien der Datenbank hineingeschrieben, wenn das System gerade Luft dafür hat. Es reicht jedoch grundsätzlich, wenn die Änderungen in dem Transaktionslog sind.

Andreas Loibl ist SAP-Berater, Ethical Hacker und Online Marketing Manager und schreibt auf seinem Blog DaFRK Blog über verschiedene Themen in den Sektoren Projektmanagement, Informationstechnik, Persönlichkeitsentwicklung, Finanzen und Zeitmanagement.

DaFRK

Andreas Loibl ist SAP-Berater, Ethical Hacker und Online Marketing Manager und schreibt auf seinem Blog DaFRK Blog über verschiedene Themen in den Sektoren Projektmanagement, Informationstechnik, Persönlichkeitsentwicklung, Finanzen und Zeitmanagement.

Das könnte Dich auch interessieren …

2 Antworten

  1. 28. Juni 2017

    […] Sie meinen Einführungspost über SAP HANA gelesen haben, wissen Sie bestens darüber Bescheid, dass SAP HANA eine in-Memory Datenbank ist. […]

  2. 11. Juli 2017

    […] konsolidierte Datenstamm kann mit Hilfe von SAP HANA on the fly für Embedded Analytics genutzt und somit für die schnelle und fundierte […]

Kommentar verfassen

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.