Prometheus+Grafana搭建全方位的监控告警系统

53人 购买 好评度 -
用手机看

扫一扫继续用手机看

  • 微信扫码

  • QQ扫码

下载手机APP
收藏
  • prometheus监控
更多班级

prometheus监控

支持随到随学,25年04月过期

¥586.22

本班因教学质量问题暂时不能报名。 查看详情

课程因违反平台规定暂时不能报名。

立即购买

课程概述

目录

往期学员作业()

评论

老师介绍

  • 韩先超

    韩先超

    高级运维工程师、资深DevOps工程师,在互联网上市公司拥有多年一线运维经验,主导过亿级pv项目的架构设计和运维工作
简  介 本套课程我将带领大家学习prometheus生态圈中涉及到的所有组件,包括prometheus、grafana、alertmanager、pushgateway,PromQL,只要大家认真学习,完全可以把prometheus+grafana+alertmanager这套监控告警系统应用到企业生产环境中,满足对物理节点,容器,线上业务,kubernetes等架构的监控,实现微信,qq,钉钉报警。

一、prometheus简介

Prometheus是一个开源的系统监控和告警系统,现在已经加入到CNCF基金会,成为继k8s之后第二个在CNCF维护管理的项目,在kubernetes容器管理系统中,通常会搭配prometheus进行监控,prometheus支持多种exporter采集数据,还支持通过pushgateway进行数据上报,Prometheus再性能上可支撑上万台规模的集群。

二、prometheus架构图

 

三、prometheus组件介绍

1.Prometheus Server: 用于收集和存储时间序列数据。

2.Client Library: 客户端库,检测应用程序代码,当Prometheus抓取实例的HTTP端点时,客户端库会将所有跟踪的metrics指标的当前状态发送到prometheus server端。

3.Exporters: prometheus支持多种exporter,通过exporter可以采集metrics数据,然后发送到prometheus server端

4.Alertmanager: 从 Prometheus server 端接收到 alerts 后,会进行去重,分组,并路由到相应的接收方,发出报警,常见的接收方式有:电子邮件,微信,钉钉, slack等。

5.Grafana:监控仪表盘

6.pushgateway: 各个目标主机可上报数据到pushgatewy,然后prometheus server统一从pushgateway拉取数据。

四、课程亮点

五、效果图展示

六、讲师简介

先超(lucky)高级运维工程师、资深DevOps工程师,在互联网上市公司拥有多年一线运维经验,主导过亿级pv项目的架构设计和运维工作

主要研究方向:

1.云计算方向:容器

(kubernetes、docker),虚拟化(kvm、Vmware vSphere),微服务(istio),PaaS(openshift),IaaS(openstack)等
2.系统/运维方向:linux系统下的常用组件(nginx,tomcat,elasticsearch,zookeeper,kafka等),DevOps(Jenkins+gitlab+sonarqube+nexus+k8s),CI/CD,监控(zabbix、prometheus、falcon)等

七、技术交流群

  为了大家更快速的学习知识,掌握技术,随时沟通问题,特组建了技术交流群,大家在群里可以分享自己的技术栈,抛出日常问题,群里会有很多大佬及时解答,这样我们就会结识很多志同道合的人,长按下图可加我微信,备注运维或者k8s或者devops即可进群,让我们共同努力,向着美好的未来出发吧~~~

微信:luckylucky421302

八、课程大纲

第一章 自我介绍+课程大纲

1-1.自我介绍

1-2.课程大纲介绍

1-3.课程大纲介绍-补充微信报警

1-4.对您的承诺

1-5.课程课件使用说明

第二章 安装kubernetes(简称k8s)

2-1.准备安装k8s的实验环境

2-2.初始化k8s机器

2-3.安装k8s1.16.4高可用集群

2-4.安装k8s1.17.3高可用集群-视频在百度网盘,可按如下方式加我微信获取

第三章 node-exporter和cadvisor组件介绍

3-1.cadvisor组件介绍-监控容器

3-2.node-exporter组件介绍-监控node节点

第四章 prometheus安装+核心组件+架构介绍

4-1.prometheus简介

4-2.prometheus特点

4-3.prometheus组件介绍

4-4.prometheus架构图

4-5.部署prometheus-在k8s中部署

4-6.部署prometheus-在物理节点部署

4-7.Prometheus metrics类型介绍

第五章 prometheus基于k8s的服务发现-kubernetes_sd_configs

5-1.prometheus服务发现简介

5-2.prometheus重写标签relabel_configs介绍

5-3.prometheus配置endpoints模式的服务发现-监控k8s的apiserver组件

5-4.prometheus监控apiserver组件的各监控指标介绍

5-5.prometheus配置endpoints模式的服务发现-监控k8s所有的service服务

5-6.prometheus基于k8s服务发现总结

第六章 prometheus基于k8s的服务发现-kubernetes_sd_configs

6-1. prometheus配置node模式的服务发现-通过node-exporter监控node节点的cpu/内存/磁盘/网络等

6-2. node-exporter监控指标说明

6-3. prometheus配置node模式的服务发现-通过cadvisor监控容器的cpu/内存/磁盘/网络等

6-4.cadvisor采集容器的监控指标介绍

6-5.总结

第七章 promethues静态服务发现static_configs-监控k8s组件

7-1. prometheus监控kube-schedule组件

7-2. prometheus监控kube-controller-manager组件

7-3. prometheus监控kube-proxy组件

7-6. prometheus监控etcd组件

第八章 grafana介绍

8-1.grafana安装和配置

8-2.配置grafana的web界面-接入prometheus数据源

8-3.grafana导入node的dashboard

8-4.grafana导入容器的dashboard

8-5.grafana导入k8s的dashboard

第九章 容器监控之kube-state-metrics组件介绍

 

9-1.kube-state-metrics介绍

9-2.安装kube-state-metrics

 

9-3.kube-state-metrics的监控指标类型介绍

第十章 alertmanager安装+配置详细介绍

10-1.alertmanager安装+配置邮件告警

10-2.alertmanager用于发送告警的邮箱配置

10-3.alertmanager配置自定义告警规则

10-4.创建钉钉机器人

10-5.alertmanager配置钉钉告警

10-6.alertmanager配置钉钉和邮件同时告警

10-7.alertmanager全局配置说明-global

10-8.alertmanager基于标签的告警处理路由-match_re

10-9.alertmanager告警分组group和告警一直inhabit

10-10.alertmanager告警静默-临时静默silence

第十一章 promethues基于k8s的服务发现-Kubernetes_sd_configs

11-1.prometheus配置pod模式的服务发现-监控pod组件

第十二章 prometheus监控扩展

12-1.prometheus监控tomcat

12-2.prometheus监控redis

12-3.prometheus监控mysql

12-4.prometheus监控zookeeper

12-5.prometheus监控mongodb

第十三章 pushgateway

13-1.pushgateway简介

13-2.pushgateway优缺点

13-3.安装pushgateway

13-4.为prometheus添加pushgateway

13-5.上报到pushgateway的数据

13-6.自定义node节点的监控指标数据上报到pushgateway

13-7.honor_labels true 参数介绍

第十四章 在物理节点安装prometheus

14-1.准备实验环境

14-2.在物理节点安装prometheus

第十五章 prometheus联邦集群

15-1.prometheus联邦集群-安装和配置

第十六章 prometheus基于consul的服务发现

16-1.课前须知

16-2.consul简介

16-3.安装consul集群

16-4.在consul中注册node-exporter服务

16-5.配置prometheus基于consul的服务发现

16-6.在consul中注册master2节点的node-exporter

16-7.总结

第十七章 prometheus发送微信报警
17-1.配置prometheus接入alertmanager
17-2.配置企业微信,创建接收告警群
17-3.登陆企业微信
17-4.在企业微信添加接收报警成员
17-5.配置prometheus发送微信报警
17-6.自定有prometheus发送报警的告警信息格式
17-7.总结

资料下载报名后支持下载

* 课程提供者:韩先超