flink-user-zh mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From 李佳宸 <lijiachen...@gmail.com>
Subject Prometheus pushgateway 监控 Flink metrics的问题
Date Tue, 12 May 2020 00:57:14 GMT
您好!

我在使用prometheus监控flink时发现一个问题不知是不是bug,反映如下

版本信息
Flink 1.9.1
Prometheus 2.18
pushgateway 1.2.0

问题:
配置
metrics.reporter.promgateway.randomJobNameSuffix为false后,部分metrics不能正确的push到pushgateway里。具体表现是,部分metrics(主要是jobmanager相关,如
flink_jobmanager_Status_JVM_CPU_Load
),无法持久的存在pushgateway中,频繁刷新发现指标一会儿消失,一会儿又出现。还有部分指标直接丢失了,如
flink_jobmanager_job_fullRestarts。

metrics.reporter.promgateway.randomJobNameSuffix设置为true时,功能是正常的。

以下是我的相关配置:
metrics.reporter.promgateway.class:
org.apache.flink.metrics.prometheus.PrometheusPushGatewayReporter
metrics.reporter.promgateway.host: localhost
metrics.reporter.promgateway.port: 9091
metrics.reporter.promgateway.jobName: cluster1
metrics.reporter.promgateway.randomJobNameSuffix: *false*
metrics.reporter.promgateway.deleteOnShutdown: *false*

望能解决我的疑惑,谢谢~~~~
Mime
  • Unnamed multipart/alternative (inline, None, 0 bytes)
View raw message