prometheus 服务发现原理 快播报
服务发现
概述
如上图,Prometheus核心功能包括服务发现、数据采集和数据存储。服务发现模块专门负责发现需要监控的目标采集点(target
)信息,数据采集模块从服务发现模块订阅该信息,获取到target
信息后,其中就包含协议(scheme
)、主机地址:端口(instance
)、请求路径(metrics_path
)、请求参数(params
)等;然后数据采集模块就可以基于这些信息构建出一个完整的Http Request
请求,定时通过pull http
协议不断的去目标采集点(target
)拉取监控样本数据(sample
);最后,将采集到监控样本数据交由TSDB
模块进行数据存储。
为什么需要服务发现模块?
类似于微服务通过引入注册中心组件解决众多微服务间错综复杂的依赖调用。无论是服务主动停止,意外挂掉,还是因为流量增加对服务实现进行扩容,这些服务数据或状态上的动态变化,通过注册中心屏蔽服务状态变更造成的影响,简化了调用方处理逻辑。
(资料图)
同理,Prometheus
最开始设计是一个面向云原生应用程序的,云原生、容器场景下按需的资源使用方式对于监控系统而言就意味着没有了一个固定的监控目标,所有的监控对象(基础设施、应用、服务)都在动态的变化。Prometheus
解决方案就是引入一个中间的代理人,这个代理人掌握着当前所有监控目标的访问信息,Prometheus
只需要向这个代理人询问有哪些监控目标即可,这种模式被称为服务发现(service discovery
)。
目前,Prometheus
支持的服务发现协议是非常丰富的,最新版本(2.41
)已支持接近三十种服务发现协议:
服务发现配置解析
1、Prometheus
服务启动加载prometheus.yml
配置文件会被解析Config
结构体:
❝
Config
结构体是配置类的最顶层结构,内部包含6个字段分别对应prometheus
配置的6大组成部分。
❞
2、其中数据采集配置部分ScrapeConfigs
对应的是一个*ScrapeConfig类型
切片,一个ScrapeConfig
对应的是scrape_configs
配置下的一个job
抓取任务,服务发现协议配置对应其中ServiceDiscoveryConfigs
字段:
3、discovery.Configs
对应的是Config
切片:
type Configs []Config
所以,一个job
抓取任务下可以配置多个服务发现协议,如:
- job_name: "prometheus" metrics_path: /metrics static_configs: - targets: ["124.222.45.207:9090"] file_sd_configs: - files: - targets/t1.json - targets/t2.json refresh_interval: 5m
4、Config
是一个接口:
Config
是一个接口的定义,每种服务发现协议都会存在一个对应Config
接口的实现(见下图)。该接口主要定义两个方法:
1、Name() string:定义服务发现协议类型,如eureka、kubernetes等等;2、NewDiscoverer(DiscovererOptions) (Discoverer, error):返回一个Discoverer类型变量,该类型也是一个接口,其只定义了一个方法Run方法,即Discoverer是对应的服务发现协议具体运行逻辑封装,通过Run方法提供统一的运行入口。
服务发现核心原理
说明:
Prometheus
服务发现核心逻辑的入口主要关注Manager
结构体的ApplyConfig
方法:基于服务发现的配置使其生效;
ApplyConfig
方法包括四个主要步骤:
type provider struct { name string d Discoverer subs []string config interface{}}
❝一个job下一个服务发现协议对应一个Discoverer。❞
provider
还有额外三个字段:
1、name
:provider
名称,格式:fmt.Sprintf("%s/%d", typ, len(m.providers))
;
2、subs
:string
切片,存放job
名称,因为可能不同job
下存在一致的服务发现配置,就只会生成一个provider
,然后subs
存放job
列表;
3、config
:服务发现配置
Discoverer
接口Run
方法,让服务发现逻辑运行;协程中运行updater
方法;Discoverer
接口Run
方法主要基于具体服务发现协议发现target
,然后通过通道传递给updater
处理逻辑,将其解析处理放入到Manager
结构体中targets
字段中,并向triggerSend
通道发送信号,表示当前targets
发生变更;Manager
结构体sender
方法每5秒监听triggerSend
通道信号,并将Manager
结构体中targets
字段处理后放入到syncCh
通道中;数据采集模块(scrape
)监听syncCh
通道,就可以获取到服务发现生成的targets
信息,然后reload
将target
纳入监控开始抓取监控指标。启动provider
:遍历Manager
结构体中providers
切片,启动每个provider
,该步骤主要是启动两个协程:❝Manager
结构体sender
方法是在Prometheus
启动时discoveryManagerScrape.Run()
方法中启动。❞取消服务发现:配置变更也会调用ApplyConfig
方法,这时就要把基于之前配置运行的服务发现服务取消,然后基于当前配置重新生成;清空:主要清空discoverCancel
、targets
和providers
几个容器元素,因为要基于当前配置重新生成;注册provider
:provider
是对Discoverer
的封装,不同服务发现协议都会实现Config
接口,其中NewDiscoverer
方法就是创建Discoverer
「Prometheus服务发现核心就是三个协程之间协作:」
「协程1:」负责运行Discoverer
接口Run
方法,基于协议发现采集点;「协程2:」负责将协程1发现的采集点信息更新到Manager
结构体中targets
字段的map
中;「协程3:」负责将Manager
结构体中targets
字段的数据通过通道发送给scrape
模块;scrape模块获取到采集点如何进行数据采集后续scrape模块分析。
监控指标
Prometheus
服务发现通用指标主要有如下5个,都定义在discovery/manager.go
中:
prometheus_sd_discovered_targetsprometheus_sd_failed_configsprometheus_sd_received_updates_totalprometheus_sd_updates_delayed_totalprometheus_sd_updates_total
「1、采集点数量指标」
服务发现主要基于协议发现采集目标,prometheus_sd_discovered_targets
指标反馈各个job
发现的采集目标数:
prometheus_sd_discovered_targets:gauge类型,当前发现的目标数config:job名称name:取值scrape和notify,区分指标抓取服务发现还是告警通知服务发现示例:prometheus_sd_discovered_targets{config="auth_es1", name="scrape"} 12
❝这里基于协议发现的目标数,还未进入采集模块,并不能区分是在线还是离线。❞
「2、服务发现协议异常错误指标」
服务发现会给每个发现配置项生成一个provider
,并为每个provider
使用协程运行,如果基于配置项生成provider
错误就可以通过prometheus_sd_failed_configs
指标反馈:
prometheus_sd_failed_configs:gauge类型,当前无法加载的服务发现配置数配置数:一个job可能存在多个服务发现协议配置,对应配置项则是多个示例:prometheus_sd_failed_configs{name="scrape"} 10prometheus_sd_failed_configs{name="notify"} 5
一个job
可能对应多个服务发现配置项,如下:这个job
下配置了static_configs
和file_sd_configs
两个服务发现协议配置,则对应两个服务发现配置项,注册两个provider
,每个provider
在独立协程中运行:
scrape_configs: # The job name is added as a label `job=` to any timeseries scraped from this config. - job_name: "test" static_configs: - targets: ["localhost:9090"] file_sd_configs: - refresh_interval: 5m files: - targets/manual.*.json
「3、协程交互指标」
服务发现主要涉及3类协程:
Discoverer协程
(多个):封装provider
,基于协议发现采集点,这里可能会存在多个,一个provider
对应一个Discoverer协程
;updater协程
(1个):Discoverer协程
发现采集点,通过channel通道
通知到updater协程
,updater协程
将采集点更新到Manager结构体
中targets字段
中,然后向Manager结构体
中triggerSend通道
写入数据,告诉sender
协程targets
有更新;sender协程
(1个):sender协程
每5秒检测triggerSend
通道数据,检测到更新则将Manager
结构体targets
数据处理封装写入到Manager
结构体syncCh
通道中,scrape
模块监测该通道,即完成将服务发现模块
和scrape模块
交互。这其中涉及三个指标:
prometheus_sd_received_updates_totalprometheus_sd_updates_delayed_totalprometheus_sd_updates_total
标签:
为您推荐
广告
- prometheus 服务发现原理 快播报
- 湖南郴州可提供华帝热水器维修服务地址在哪 独家焦点
- 少年的生活里,藏着一万种向往
- 能文能武代表什么生肖
- 昌平消防开展校园消防安全知识培训活动 环球看热讯
- 环球速讯:广西首个海上风电项目全面启动
- 流转税包括哪些税种 流转税有哪些特点
- 每日快看:抓住免费的“尾巴”,“泰山门票”话题冲上热搜第二
- 生意社:PA6行情周报(3.20-3.25)
- asha501是3g手机吗(asha502)-世界头条
- 世界简讯:景点及旅游板块正处“春天行情”恢复成色有待一季报验证
- 卷发棒对头发有伤害吗
- 环球热议:俄军T54坦克都来凑数了,T34坦克出山不远了
- 天天快资讯丨雪铁龙推出了无可争议的最新车型E-MEHARI是对1960年代E-MEHARI的致敬
- 大健康国际(02211)拟折让约0.83%发行最多约1.11亿股认购股份 净筹约1310万港元_世界播报
- 青海玉树:50条惠企惠民措施进一步推动文旅融合发展
- 中国的节日有哪些?_中国的节日
- 环球热头条丨php出现403错误是什么原因?怎么解决?
- 李幼斌演过哪些电视剧-全球讯息
- 直觉思维具有_ 特点_直觉思维具有以下哪些特点 环球观点
广告
- 城步召开清明期间森林草原防灭火工作推进会
- 世界看点:ins上很火的裤装搭配,尤其是这三种最亮眼,成熟大气又时尚减龄
- 西班牙苍蝇药_西班牙苍蝇
- 焦点速读:克雷洛夫的主要作品有哪些
- 世界头条:感冒咳嗽可以喝奶茶吗请问_感冒咳嗽可以喝奶茶吗
- 世界通讯!咖喱咖喱歌词原唱歌曲视频_咖喱咖喱歌词
- 快资讯:新世界小耳朵扮演者
- 普通股和优先股的区别?
- 新桥医院医生态度问题
- 中洲队张杰_中洲队|全球热资讯
- 全球动态:索尼或用《蜘蛛侠2》营销PS5新机型:捆绑包形式
- 海南聚兴乾晟大宗商品交易有限公司大宗商品市场必将“水大鱼大”|全球看点
- 中天金融:3月21日融资买入142.79万元,融资融券余额3.7亿元|当前时讯
- 全球动态:这部电影把反黄谣搬上荧幕,网友:她不该轻易成为新闻里的“那谁”
- 铝塑管规格及价格(铝塑管价格多少一米)-天天微动态
- 视频|三大数字基础设施在渝发布 助力重庆数字经济发展 全球速递
- 贵州茅台获沪股通连续3日净买入 累计净买入6.94亿元-讯息
- 齐心集团接待中邮证券等多家机构调研-世界快看
- 混凝土强度换算表对照_混凝土强度换算表
- 安踏体育公布年度业绩,收益537亿元 同比增长8.8% 实现高质量稳健增长