- PagerDuty /
- Blog /
- Caractéristiques /
- Trier les alertes PagerDuty à l'aide de Loggly
Blog
Trier les alertes PagerDuty à l'aide de Loggly
Article de blog invité de Jason Skowronki, chef de produit chez Loggly Loggly est le service de gestion de journaux basé sur le cloud le plus populaire au monde avec plus de 3 500 clients actifs et les développeurs et administrateurs système résolvent les problèmes, surveillent l'état du système et traitent de manière proactive les problèmes avec des alertes.
Vous sortez dîner avec des amis et vous recevez une alerte via PagerDuty. Votre taux d’inscription est tombé bien en dessous de son niveau habituel. Cela peut indiquer un problème sérieux avec votre site, mais il peut aussi s'agir simplement d'un modèle de trafic inhabituel. Faut-il quitter le restaurant et rentrer chez soi ? Ou sacrifieriez-vous simplement un temps d’arrêt bien mérité pour quelque chose qui pourrait attendre jusqu’à demain ?
L’alerte est essentielle à l’économie centrée sur Internet 24h/24 et 7j/7. C'est un moyen de minimiser l'impact des problèmes d'application sur les revenus et les bénéfices. Chez Loggly, nous aimons PagerDuty parce qu'il a apporté du sens dans la façon dont nous prenons conscience des problèmes opérationnels, affectons les bonnes ressources pour résoudre ces problèmes et les suivons jusqu'à leur terme. Il répond aux questions cruciales du « qui » et constitue un complément parfait au service Loggly, qui donne aux équipes DevOps un moyen d'approfondir le « pourquoi ».
Trier et trouver la cause profonde des problèmes plus rapidement
Revenons à notre repas interrompu. PagerDuty vous dira qu'une alerte s'est déclenchée en raison d'une diminution inattendue des inscriptions. Cependant, vous avez besoin de plus d’informations sur le système d’où ils proviennent et qui en est responsable. Vous cliquez sur l'alerte et accédez directement à votre tableau de bord Loggly, où vous voyez que l'alerte s'est déclenchée exactement au même moment où un déploiement a eu lieu. Il s'agit donc probablement d'un véritable problème de site. Il est temps de recevoir le chèque.
Pendant que vous attendez, vous recherchez les journaux de votre page d'inscription. Vous voyez que les clics sont enregistrés mais que les appels ne sont pas systématiquement envoyés au service back-end. Plus tard, quelques recherches dans le code vous montrent que la page ne s'affiche pas correctement dans les navigateurs Internet Explorer. Vous annulez le déploiement, signalez un bug à l'équipe front-end et résolvez l'alerte PagerDuty .
Loggly offre aux équipes DevOps une visibilité plus approfondie sur leurs systèmes, à la fois lors de l'évaluation et du tri initiaux et pendant qu'elles s'efforcent d'isoler et de résoudre leurs problèmes opérationnels. Nos puissantes fonctions de recherche et de filtrage, nos graphiques par pointer-cliquer et nos tableaux de bord vous aident à comprendre instantanément des tonnes de données de journaux provenant d'applications, de plateformes et de systèmes. Vous pouvez rapidement voir les corrélations entre un état d'alerte et d'autres événements qui se produisent sur vos systèmes, et vous avez accès à toutes les données dont vous avez besoin pour trouver les causes profondes.
Vous pouvez ainsi arrêter d'interrompre votre journée pour des petits problèmes et vous concentrer sur les plus importants. Et vous pouvez résoudre ces gros problèmes beaucoup plus rapidement.
Retrouvez Loggly, New Relic et PagerDuty ce soir à la réception de DataBeat et ayez des Data-tinis sur nous !