Nov 11, 2021

prometheus系列-快速入门

前言

对于Prometheus，我们一般有两种理解：

Prometheus在2016年加入CNCF(Cloud Native Computing Foundation), 是继k8s之后的第二个托管项目，其主要特点如下：

Prometheus生态由多个组件共同组成，其中许多组件是可以根据实际情况选择的，并且绝大部分由go语言编写，在部署和构建上比较方便，如下：

Prometheus Server：Prometheus服务器，用于收集指标和存储时间序列数据，并提供以一系列的查询和设置接口
Client Library：客户端库，用于帮助需要监控采集的服务暴露metrics handler和Prometheus server。例如我们经常在gin直接调用promhttp暴露一个metrics接口
Push Gateway：推送网关，Prometheus服务端仅支持http pull的采集方式，但是有一些值存在的时间短，Prometheus来之前pull就结束了。或者说该类指标，是需要客户端自行上报的，这时候就可以采用Push GateWay的方式。客户端将指标push到Push GateWay，再由Prometheus Server从Push GateWay上pull
Exporters：用于暴露已有的第三方服务（HAProxy，StatsD，Graphite）的metrics给Prometheus Server
AlterManager：用于处理告警，从Prometheus Server端接收到alters后，会进行去重，分组，然后路由到对应的receiver，发出报警
Support Tools：各种支持工具

Prometheus的整体架构和生态组件，如下图所示：

Prometheus所有采集的指标数据在默认情况下，都保存在本地所内置的时间序列数据库中（TSDB）当中。目前在行业中比较出名，流行度较高的时序数据库如下：

时序数据库，简单来说就是将数据按照时间的顺序排列，它具有唯一性和可排序性，因此在Prometheus的Metrics中即使只添加一个标签，也会造成破坏，也就是说它不再是原来的那个时序数据了。关于这个破坏性，我们后面再来细说。