Heartbeat-Monitoring

Überwachen Sie Cronjobs auf Ihren eigenen Servern mit Heartbeat-Pings — erkennen Sie verpasste, fehlgeschlagene und hängende Läufe.

Ein Heartbeat-Check ist ein Totmannschalter für einen Job, der auf Ihrer eigenen Infrastruktur läuft. Ihr Job pingt SteadyCron an, wenn er läuft; kommt der Ping nicht planmäßig an, werden Sie alarmiert, bevor Nutzer es merken.

Das ist ideal für nächtliche Datenbank-Backups, ETL-Pipelines, Zertifikatserneuerungen, Log-Rotation, Queue-Worker und jeden Cron, den Sie nicht von Ihren Servern wegbewegen können (oder wollen).

Die Ping-URL

Jeder Heartbeat-Check hat eine eindeutige Ping-URL. Senden Sie aus Ihrem Job einen HTTP-Request an sie — aus jeder Sprache oder Shell. Der einfachste Fall ist ein einzelnes curl am Ende Ihres Skripts:

# Ihre Arbeit hier ...
curl -fsS https://ping.steadycron.com/<ihr-ping-token>

Ping-Typen

Sie können drei Arten von Pings senden, um verschiedene Punkte eines Laufs zu signalisieren:

  • /start — der Job hat begonnen. So kann SteadyCron die Dauer messen und Läufe erkennen, die beginnen, aber nie enden.
  • /success (der Standard, ohne Suffix) — der Job wurde erfolgreich abgeschlossen.
  • /fail — der Job lief, schlug aber fehl. Nutzen Sie dies, um bei expliziten Fehlern zu alarmieren, nicht nur bei fehlenden Pings.
TOKEN=<ihr-ping-token>
curl -fsS https://ping.steadycron.com/$TOKEN/start
# ... den Job ausführen ...
if ./run-backup.sh; then
  curl -fsS https://ping.steadycron.com/$TOKEN
else
  curl -fsS https://ping.steadycron.com/$TOKEN/fail
fi

Sie können dem Ping auch eine kurze Nutzlast mitgeben (z. B. einen Log-Auszug); sie wird gekürzt als Kontext im Aktivitäts-Feed gespeichert.

Zeitplan und Kulanzzeit

Sagen Sie SteadyCron, wie oft der Job laufen soll — ein Cron-Ausdruck oder ein einfaches Intervall — und setzen Sie eine Kulanzzeit. Die Kulanzzeit fängt normale Schwankungen ab (ein Backup, das meist um 02:05, manchmal aber um 02:12 fertig ist). Ist ein Ping über die Kulanzzeit hinaus überfällig, gilt der Check als verpasst und ein Alert feuert.

Hängende Läufe erkennen

Senden Sie einen /start-Ping, aber es kommt kein passender /success oder /fail innerhalb des erwarteten Zeitfensters an, markiert SteadyCron den Lauf als hängend (abandoned) — und fängt so Jobs ab, die hängen statt auszufallen.

Status auf einen Blick

Jeder Check zeigt seinen aktuellen Zustand: pünktlich, verspätet (überfällig, aber in der Kulanzzeit), verpasst oder fehlerhaft. Das Dashboard zeigt fehlerhafte Checks zuerst, damit Probleme offensichtlich sind.

Nächste Schritte