Đề cương khóa học

Giới thiệu về Cảnh báo Nâng cao

  • Các nguyên tắc chính của cảnh báo trong hệ thống IT
  • Tổng quan về Prometheus Alertermanager
  • Khả năng cảnh báo trong Grafana

Tạo Quy tắc Cảnh báo Nâng cao

  • Định nghĩa quy tắc cảnh báo trong Prometheus
  • Sử dụng nhãn và chú thích cho cảnh báo
  • Chiến lược nhóm và tắt cảnh báo

Tích hợp Alertermanager với Hệ thống Bên ngoài

  • Cấu hình webhook cho tích hợp bên ngoài
  • Tích hợp với các công cụ như Slack, PagerDuty và hệ thống email
  • Tùy chỉnh các mẫu Alertermanager

Tự động hóa Phản hồi Cảnh báo

  • Triển khai quy trình khắc phục sự cố tự động
  • Tích hợp với các công cụ điều phối (ví dụ: Ansible, Kubernetes)
  • Sử dụng các tập lệnh để giải quyết sự cố tự động

Trực quan hóa Cảnh báo trong Grafana

  • Thiết lập các bảng điều khiển cảnh báo trong Grafana
  • Tùy chỉnh thông báo và ngưỡng cảnh báo
  • Các phương pháp hay nhất để giám sát trạng thái cảnh báo

Quản lý Cảnh báo Khối lượng Lớn

  • Xử lý hiệu quả các cơn bão cảnh báo
  • Tối ưu hóa hiệu suất Prometheus cho cảnh báo
  • Scala Khả năng mở rộng của Alertermanager

Mở rộng và Kỹ thuật Nâng cao

  • Thiết lập cảnh báo phân tán với Prometheus và Alertermanager
  • Tích hợp với các giải pháp cảnh báo dựa trên đám mây
  • Khám phá các tính năng mới trong hệ sinh thái Grafana và Prometheus

Tóm tắt và Các Bước Tiếp theo

Requirements

  • Kinh nghiệm cơ bản với Grafana và Prometheus
  • Hiểu các khái niệm giám sát IT
  • Làm quen với scripting hoặc lập trình để tự động hóa

Đối tượng

  • Kỹ sư DevOps
  • Kỹ sư độ tin cậy của trang web (SRE)
 14 Hours

Number of participants


Price per participant

Testimonials (2)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories