Surveillance heartbeat

Surveillez les tâches cron de vos propres serveurs avec des pings heartbeat — détectez les exécutions manquées, échouées et bloquées.

Un heartbeat est un interrupteur « homme mort » pour une tâche qui tourne sur votre propre infrastructure. Votre tâche envoie un ping à SteadyCron lorsqu’elle s’exécute ; si le ping n’arrive pas à l’heure prévue, vous êtes alerté avant les utilisateurs.

C’est idéal pour les sauvegardes de bases de données nocturnes, les pipelines ETL, les renouvellements de certificats, la rotation des journaux, les workers de file d’attente et tout cron que vous ne pouvez (ou ne voulez) pas déplacer hors de vos serveurs.

L’URL de ping

Chaque heartbeat possède une URL de ping unique. Envoyez-lui une requête HTTP depuis votre tâche — depuis n’importe quel langage ou shell. Le cas le plus simple est un seul curl à la fin de votre script :

# votre travail ici ...
curl -fsS https://ping.steadycron.com/<votre-jeton-ping>

Types de ping

Vous pouvez envoyer trois types de ping pour signaler différents moments d’une exécution :

  • /start — la tâche a démarré. Permet à SteadyCron de mesurer la durée et de détecter les exécutions qui commencent mais ne se terminent jamais.
  • /success (le défaut, sans suffixe) — la tâche s’est terminée avec succès.
  • /fail — la tâche a tourné mais a échoué. Utilisez-le pour alerter sur des erreurs explicites, pas seulement sur des pings manquants.
TOKEN=<votre-jeton-ping>
curl -fsS https://ping.steadycron.com/$TOKEN/start
# ... exécuter la tâche ...
if ./run-backup.sh; then
  curl -fsS https://ping.steadycron.com/$TOKEN
else
  curl -fsS https://ping.steadycron.com/$TOKEN/fail
fi

Vous pouvez aussi joindre une courte charge utile au ping (par ex. la fin d’un journal) ; elle est stockée tronquée pour le contexte dans le flux d’activité.

Planning et période de grâce

Indiquez à SteadyCron la fréquence d’exécution attendue — une expression cron ou un simple intervalle — et définissez une période de grâce. La période de grâce absorbe les variations normales (une sauvegarde qui se termine d’habitude à 02:05 mais parfois à 02:12). Dès qu’un ping est en retard au-delà de la période de grâce, le check est considéré comme manqué et une alerte se déclenche.

Détecter les exécutions bloquées

Si vous envoyez un ping /start mais qu’aucun /success ni /fail n’arrive dans la fenêtre attendue, SteadyCron marque l’exécution comme bloquée (abandonnée) — capturant ainsi les tâches qui se figent au lieu d’échouer franchement.

Statut en un coup d’œil

Chaque check affiche son état actuel : à l’heure, en retard (dépassé mais dans la grâce), manqué ou en échec. Le tableau de bord fait remonter les checks en échec en premier, pour que les problèmes soient évidents.

Étapes suivantes