Warnmeldesystem Opsgenie mit Incident Rules optimal nutzen | Actonic GmbH

Warnmeldesystem Opsgenie mit Incident Rules optimal nutzen

Oft bekommen Sie eine Flut von unnötigen Benachrichtigungen zu Ihren Systemen geschickt – wenn aber signifikante Störungen auftreten, wird keine Warnung versandt oder falls doch, fühlt sich niemand angesprochen? Derartige Probleme kommen heutzutage leider häufig vor. Aber gerade bei Unternehmen, die eine 24-Stunden live Präsenz gewährleisten, gibt es eine Null-Toleranz Grenze, was Fehler betrifft. Schließlich können weder Kund*innen noch Partnerfirmen Sie kontaktieren, wenn Ihre Website nicht verfügbar ist. Jeder Ausfall wirkt sich negativ auf Ihre Reputation aus. Am besten also, man erkennt Fehler direkt und weiß in einer solchen Situation auch, wer für die Lösung verantwortlich ist.

Klingt kompliziert, ist es aber nicht, wenn Sie Opsgenie in Ihr Unternehmen integrieren. Mit Opsgenie stellen Sie sicher, dass keine Warnung mehr verpasst wird. Tiefe Integrationen in mehr als 200 Überwachungs- und Chattools stellen sicher, dass Ihr Team jederzeit Fehler so schnell wie möglich erkennt und behebt. So vermindern Sie wirtschaftliche Folgeschäden und können durch tiefgehende Analysen auf zukünftige Störfälle noch gezielter reagieren.

In diesem Artikel erfahren Sie, wie genau Opsgenie funktioniert, was die Vorteile der Software sind und wie Sie sie mit Incident Rules optimal einrichten.

Wie funktioniert Opsgenie?

Opsgenie lässt sich in Ihre Überwachungstools und benutzerdefinierten Anwendungen integrieren und kategorisiert Warnungen nach Zeitpunkt und Priorität. Die cloudbasierte Software verbindet Rufbereitschaftspläne, Erfahrungswerte und vordefinierte Eskalationsrichtlinien nach Ihren Wünschen und sendet nur dann eine Benachrichtigung, wenn ein Thema wirklich relevant ist.

Opsgenie verschickt beispielsweise E-Mails, SMS, Anrufe oder Push-Nachrichten und erstellt auch Servicetickets in Jira, sofern die Anwendungen verknüpft sind. Dabei können Sie stets festlegen, welche Personen Ihres Teams in bestimmten Einsatzfällen verantwortlich sind und kontaktiert werden sollen. Auf diese Weise vermeiden Sie Alarmmüdigkeit und Zuweisungsmissverständnisse.

Zusätzlich zu der ausgefeilten Aufnahme von Fehlern und der Weiterleitung von Meldungen sorgt ein weiteres Feature für einen reibungslosen Ablauf in Ihrem Unternehmen: die erweiterte Berichterstellung. Dank ihr können Sie Störquellen und Verbesserungsmöglichkeiten ausfindig machen und gegen zukünftige Fehler noch zielgerichteter vorgehen.

Weitere Vorteile von Opsgenie

  • Ereignisverfolgung in Echtzeit

  • Transparente Verteilung von Zuständigkeiten in Problemsituationen

  • hochgradig individuell anpassbare Funktionen

  • Regelmäßige Fehler werden erkannt und beseitigt

  • Integration in mehr als 200 leistungsfähige Kollaborationstools, bspw. Slack, Jira, GitHub, Microsoft Teams

  • Funktionalität rund um die Uhr, das ganze Jahr über

  • Erweiterte Post-Incident-Analyse und Berichterstattung

  • Flexibilität bei Benachrichtigungsmethoden und Weiterleitungen

Begriffserklärungen: Ereignis, Warnung, Vorfall

Bevor wir Ihnen zeigen wollen, wie Sie Ihr Opsgenie Warnmeldesystem ideal einrichten, lohnt es sich, einige Begriffe detaillierter zu betrachten.

  • Ereignis (Englisch: event)

    • Ein Ereignis ist eine beobachtete Änderung im Prozess, System oder Workflow, das schwerwiegende Auswirkungen auf die Infrastruktur von IT-Diensten haben kann, aber nicht muss. Ein Beispiel wäre die Aktualisierung von Router-ACL und dem Verschieben der Firewall-Richtlinie.

 

  • Warnung (Englisch: alert)

    • Eine Warnung oder Warnmeldung ist im Opsgenie Meldeprozess das wichtigste Element. Sie wird durch ein verknüpftes Ereignis ausgelöst und speichert die zugehörigen Informationen, wie Status, Aktivitätsprotokoll und Notizen.

 

  • Vorfall (Englisch: incident)

    • Ein Vorfall ist ein Ereignis, das zu einer erheblichen Unterbrechung der Geschäftstätigkeit führt (oder führen kann). Ein Beispiel wäre die Verbreitung eines Trojaners im Netzwerk. Alle Vorfälle sind Ereignisse, aber nicht jedes Ereignis ist ein Vorfall. Oft zeigt eine Vielzahl von Warnungen einen Vorfall an, wenn Sie dies so konfiguriert haben. Sie können völlig frei selbst definieren, wann ein Ereignis als Vorfall kategorisiert werden soll.

 

  • Vorfallsregelsätze (Englisch: Incident Rules)

    • Incident Rules sind Sammlungen von Regeln, die genau festlegen, in welcher Situation und unter welcher Voraussetzung welche Maßnahmen ergriffen und welche unterlassen werden sollen. Mit Incident Rules richten Sie verschiedene Workflows für Vorfälle unterschiedlicher Prioritäten ein, definieren Verantwortliche und die besten Kollaborationskanäle.

 

Aber wie funktioniert die Konfiguration von Incident Rules? Wie stellen Sie sicher, dass Ihr Warnmeldesystem einwandfrei funktioniert und nur wirklich die Ereignisse gemeldet werden, die Sie als Fehler erachten?

In der folgenden Schritt-für-Schritt-Anleitung erfahren Sie es!

Incident Rules: So richten Sie Opsgenie optimal ein

Bevor Sie die Incident Rules konfigurieren, gibt es einige Bedingungen zu erfüllen.

1. Bedingung: Sie benötigen mehrere Alerts. Diese können sowohl aus angebunden Systemen oder manuell erstellt werden. Hier sehen Sie drei Meldungen der Priorität 3.

2. Bedingung: Sie haben User in Opsgenie eingeladen (schließlich muss im Störungsfall jemand verantwortlich sein).

3. Bedingung: Diese User sind in einem Team zusammengefasst. Jedes Team hat die Möglichkeit, eigene Zeitpläne und Eskalationsrichtlinien zu definieren und somit Warnungen zielgerichtet weiterzuleiten.

4. Bedingung: Dieses Team bildet einen Service ab. Denn durch die Definition eines Services können Sie in Opsgenie schnell mit allen Parteien kommunizieren, wenn ein Service von einem Vorfall betroffen ist. Services sind beispielsweise Webseiten, mobile Apps oder ein Kundenportal.


Nun kann eine Incident Rule nach Ihren Vorstellungen gebildet werden. In Ihrer Konfiguration können Sie Prioritäten, Zeiten, Themen oder Keywords integrieren. Je nach Konfiguration werden auch zukünftige Meldungen von den Regeln aufgenommen.

In den folgenden Darstellungen zeigen wir Ihnen beispielhaft, wie Sie eine Regel erstellen, um aufgrund einer Warnmeldung der Priorität 3 einen Vorfall zu erstellen. Gleichzeitig steigt dieser Vorfall in der Priorität.

  1. Schritt: Klicken Sie auf Teams und gehen Sie zur Rubrik „Incident rules” und drücken dann den Button „create incident rule”

2. Schritt: Nun werden die Bedingungen abgefragt, auf Basis welcher die Zusammenführung stattfinden soll. Besonders wichtig hierbei ist die Auswahl des Services. Denn automatisierte Vorfallsreaktionen hängen immer von der Definition und Aktualität der Services ab.

3. Schritt: Die Incident Rule ist angelegt und die Aufgabe der Regel wird angezeigt.

Diese Regel besagt, wenn eine Meldung der Priorität 3 erstellt wird, wird automatisch der Vorfall hinzugefügt. Und dieser Vorfall erhält die Priorität 1.

4. Schritt: Unter Incidents ist nun der automatisch erstellte Vorfall zu finden:

5. Schritt: Öffnen Sie diesen Vorfall, sehen Sie die beinhalteten Alerts:

Nun haben Sie einen Einblick bekommen, wie Sie Incident Rules von Opsgenie nutzen und einrichten können, damit zukünftige Probleme schnell und effektiv erkannt, priorisiert und behoben werden. Denn obwohl die zahlreichen Vorteile dieses vielfältig integrierbaren Systems für sich sprechen, ist jedes System und jede Lösungskette nur so gut, wie die Regularien, nach denen sie konfiguriert werden.

Bleiben Sie gespannt auf weitere Artikel unserer Reihe, um anhand detaillierter Anwendungsfälle und weiteren Regel-Anleitungen die Funktionalität Ihres Unternehmens langfristig krisensicher zu machen.

Sie möchten
mehr erfahren?

Kontaktieren Sie unsere Experten zur Beantwortung Ihrer individuellen Fragen.

Unverbindlich
anfragen