Transparenz für Service Level Agreements (SLAs)
Ausgehend von der Gesamtausfallzeit nimmt der Servicenehmer nicht alle Ausfälle exakt wahr
Das Rechenzentrum registriert weniger Ausfälle, als tatsächlich stattfinden
Von Dr. Ing. Robert Scholderer *
(21.08.09) - Für Rechenzentren, die ihre IuK-Leistung transparent nachweisen wollen, stehen mehrere Möglichkeiten offen, dies umzusetzen. Die Analyse der Ausgangssituation ist erforderlich, um das Thema Messung und die zu erreichende Messqualität bewerten zu können. Die Analyse, aus der ein IuK-Mess- und Reportingkonzept abzuleiten ist, startet beim Ausfall von IuK-Leistungen. Die Verfügbarkeit, die aus Ausfällen resultiert, ist die wichtigste Kennzahl, die in Rechenzentren zum Einsatz kommt. Die Schwierigkeit, Messungen exakt aufzusetzen, ergibt sich aus zwei Punkten.
Zum einen ist es der fehlende Messpunkt, d.h. die Frage, an welcher Stelle die Messung erfolgt und wie genau die Messung ausgeführt werden kann. Weiterhin ist die Präzision der Messergebnisse entscheidend. Wie tatsächliche Ausfälle als auch wie Ausfälle seitens Servicenehmer und Rechenzentrum jeweils wahrgenommen werden ist nicht deckungsgleich.
Ausgehend von der Gesamtausfallzeit nimmt der Servicenehmer nicht alle Ausfälle exakt wahr. Der Servicenehmer nimmt Ausfälle immer dann wahr, wenn er den Dienst in Anspruch nimmt und ggf. nicht auf eine andere Komponente kurzfristig ausweichen kann. Damit wird die tatsächliche Ausfallzeit auf die Inanspruchnahme auf der Servicenehmerseite reduziert. Hinzu kommen weitere Ausfälle, die der Servicenehmer wahrnimmt, jedoch keine Ausfälle sind.
Dies erfolgt besonders, wenn der Servicenehmer aus vielen einzelnen Usern besteht, die unterschiedlich geschult sind. Ferner ist die Verantwortung für einen Ausfall oft unklar. Somit nimmt der Servicenehmer subjektiv wahr, dass ein Ausfall vorliegt. Trotz der Tatsache, dass vom Rechenzentrum die zu erbringende IuK-Leistung im vereinbarten Umfang bereitgestellt wurde, können vom Servicenehmer Ausfälle geltend gemacht werden. Der Hintergrund hierzu liegt in der Qualität, der in Rechenzentren eingesetzten Messsysteme.
Basierend auf der tatsächlichen Gesamtausfallzeit registriert das Rechenzentrum einerseits nicht alle Ausfälle und andererseits zusätzlich noch Ausfälle, die den IuK-Dienst auf der Servicenehmerseite nicht betreffen. Die Messungen des Rechenzentrums können aufgrund von z.B. Messtakt und -standort nicht alle Ausfälle erfassen. Somit misst das Rechenzentrum weniger Ausfälle, als tatsächlich stattfinden. Die Situation wird u.a. dadurch verstärkt, dass Ausfälle registriert werden und in das Reporting übernommen werden, obwohl es keinen Ausfall für einen Servicenehmer gab.
Ein Beispiel soll dies verdeutlichen.
In einem Server-Verbund fällt ein Server aus. Die anderen Server übernehmen die Last. Im Idealfall wird nur die Antwortzeit schlechter. Treten beim Umschalten der Server Probleme auf, die einigen Usern keine Rechte mehr erteilen, so kommt es für eine Teilmenge von Usern zum Ausfall. Im Reporting wird der Server mit einem Ausfall gewertet, obwohl die andere Hälfte der User arbeiten konnte. Die Messung mittels Robotern zeigt, dass sie die Ausfälle annähernd genau erfassen können. In Abhängigkeit vom Messtakt bestimmt sich die Genauigkeit des Ausfalls. Im Idealfall bekommt der Roboter die Ausfälle aus der Perspektive eines Benutzers exakt mit und kann die Ausfälle geeignet Messen.
Somit wird deutlich, dass die Messung aus einem neuen Blickwinkel betrachtet werden muss, damit Servicenehmer und Rechenzentrum sich auf die Messungen verlassen können. Insbesondere, wenn Minderungsregelungen zum Einsatz kommen, sollte die Qualität der Messergebnisse auf einem hohen technischen Niveau sein. (Scholderer SLA: ra)
* Dr. Ing. Robert Scholderer, Selbstständiger SLA-Berater, Geschäftsführer, Berater und Gutachter, 40 Jahre
Scholderer SLA: Kontakt und Steckbrief
Der Informationsanbieter hat seinen Kontakt leider noch nicht freigeschaltet.