Dubbo 框架标准监控指标

描述了 Dubbo 中统计的一些标准监控指标。

Dubbo 指标含义

Provider Metrics

指标含义
dubbo_provider_qps_total提供者每秒接收的请求数
dubbo_provider_requests_total提供者总的接收请求数
dubbo_provider_requests_processing提供者正在处理的接收的请求数
dubbo_provider_requests_succeed_total提供者请求成功接收的请求数
dubbo_provider_requests_total_aggregate滑动窗口下的提供者总的接收请求数
dubbo_provider_requests_succeed_aggregate滑动窗口下的提供者成功的接收请求数
dubbo_provider_rt_milliseconds_min提供者所有处理请求中最小的响应时间
dubbo_provider_rt_milliseconds_avg提供者所有处理请求的平均响应时间
dubbo_provider_rt_milliseconds_sum提供者所有处理请求的时间总和
dubbo_provider_rt_milliseconds_max提供者所有请求中最大的响应时间
dubbo_provider_rt_milliseconds_last提供者处理请求中当前的响应时间
dubbo_provider_rt_milliseconds_p95提供者处理请求中95%的请求耗费的总响应时间
dubbo_provider_rt_milliseconds_p99提供者处理请求中99%的请求耗费的总响应时间

Consumer Metrics

指标含义
dubbo_consumer_qps_total消费者每秒发送的请求数
dubbo_consumer_requests_total消费者总的发送请求数
dubbo_consumer_requests_processing消费者正在处理的发送的请求数
dubbo_consumer_requests_succeed_total消费者请求成功发送的请求数
dubbo_consumer_requests_total_aggregate滑动窗口下的消费者总的发送请求数
dubbo_consumer_requests_succeed_aggregate滑动窗口下的消费者成功的发送请求数
dubbo_consumer_rt_milliseconds_min消费者所有请求中最小的响应时间
dubbo_consumer_rt_milliseconds_avg消费者所有请求的平均响应时间
dubbo_consumer_rt_milliseconds_sum消费者所有请求的时间总和
dubbo_consumer_rt_milliseconds_max消费者所有请求中最大的响应时间
dubbo_consumer_rt_milliseconds_last消费者处理请求中当前的响应时间
dubbo_consumer_rt_milliseconds_p95消费者处理请求中95%的请求耗费的总响应时间
dubbo_consumer_rt_milliseconds_p99消费者处理请求中99%的请求耗费的总响应时间

ThreadPool Metrics

Metrics NameDescription
dubbo_thread_pool_max_sizeThread Pool Max Size
dubbo_thread_pool_largest_sizeThread Pool Largest Size
dubbo_thread_pool_thread_countThread Pool Thread Count
dubbo_thread_pool_queue_sizeThread Pool Queue Size
dubbo_thread_pool_active_sizeThread Pool Active Size
dubbo_thread_pool_core_sizeThread Pool Core Size

Registration Center Metrics

Metrics NameDescription说明
dubbo_register_rt_milliseconds_maxMax Response Time应用级 实例注册总的最大时间
dubbo_register_rt_milliseconds_avgAverage Response Time应用级 实例注册总的平均时间
dubbo_register_rt_milliseconds_sumSum Response Time应用级 实例注册总的注册时间
dubbo_register_rt_milliseconds_minMin Response Time应用级 实例注册总的最小时间
dubbo_registry_register_requests_succeed_totalSucceed Register Requests应用级 实例注册成功的次数
dubbo_registry_register_requests_totalTotal Register Requests应用级 实例注册总次数包含成功与失败
dubbo_registry_register_requests_failed_totalFailed Register Requests应用级 实例注册失败次数
dubbo_register_rt_milliseconds_lastLast Response Time应用级 实例注册最新响应时间
dubbo_registry_register_requests_failed_totalFailed Register Requests应用级 实例注册失败次数
dubbo_registry_register_service_totalTotal Service-Level Register Requests接口级 服务接口注册总数
dubbo.registry.register.service.succeed.totalSucceed Service-Level Register Requests接口级 服务接口注册成功总数
dubbo.registry.register.service.failed.totalFailed Service-Level Register Requests接口级 服务接口注册失败总数
dubbo.registry.subscribe.service.num.totalTotal Service-Level Subscribe Num接口级 服务接口订阅总数
dubbo.registry.subscribe.service.num.succeed.totalSucceed Service-Level Num接口级 服务接口订阅成功总数
dubbo.registry.subscribe.service.num.failed.totalFailed Service-Level Num接口级 服务接口订阅失败总数

Metadata Center Metrics

部分元数据指标生效范围:当元数据为集中式配置时(report-metadata为true或者metadataType为remote)

Metrics NameDescription说明
dubbo_metadata_push_num_totalTotal Num提供者 推送元数据到元数据中心的成功次数,当提供者元数据发生了变更时触发
dubbo_metadata_push_num_succeed_totalSucceed Push Num提供者 推送元数据到元数据中心的成功次数,当提供者元数据发生了变更时触发
dubbo_metadata_push_num_failed_totalFailed Push Num提供者 推送元数据到元数据中心的失败次数,当提供者元数据发生了变更时并且出现异常触发
dubbo_metadata_subscribe_num_totalTotal Metadata Subscribe Num消费者 获取元数据的总次数,当消费者启动时本地磁盘缓存无元数据获取元数据的次数
dubbo_metadata_subscribe_num_succeed_totalSucceed Metadata Subscribe Num消费者 获取元数据的总次数,当消费者启动时本地磁盘缓存无元数据并且成功获取元数据的次数
dubbo_metadata_subscribe_num_failed_totalFailed Metadata Subscribe Num消费者 获取元数据的总次数,当消费者启动时本地磁盘缓存无元数据并且获取元数据失败的次数
dubbo_push_rt_milliseconds_sumSum Response Time提供者 推送元数据到元数据中心的总时间
dubbo_push_rt_milliseconds_lastLast Response Time提供者 推送元数据到元数据中心的最新耗时
dubbo_push_rt_milliseconds_minMin Response Time提供者 推送元数据到元数据中心的最小时间
dubbo_push_rt_milliseconds_maxMax Response Time提供者 推送元数据到元数据中心的最大时间
dubbo_push_rt_milliseconds_avgAverage Response Time提供者 推送元数据到元数据中心的平均时间
dubbo_subscribe_rt_milliseconds_sumSum Response Time消费者 获取元数据从元数据中心的总时间
dubbo_subscribe_rt_milliseconds_lastLast Response Time消费者 推送元数据到元数据中心的最新耗时
dubbo_subscribe_rt_milliseconds_minMin Response Time消费者 推送元数据到元数据中心的最小时间
dubbo_subscribe_rt_milliseconds_maxMax Response Time消费者 推送元数据到元数据中心的最大时间
dubbo_subscribe_rt_milliseconds_avgAverage Response Time消费者 推送元数据到元数据中心的平均时间

Provider Exception

MetricsNameDescription说明
dubbo.provider.requests.business.failed.totalTotal Failed Business Requests当RPC请求异常状态码为 RpcException.BIZ_EXCEPTION
dubbo.provider.requests.timeout.totalTotal Timeout Failed Requests当RPC请求异常为超时异常状态码为 RpcException.TIMEOUT_EXCEPTION
dubbo.provider.requests.limit.totalTotal Limit Failed RequestsRPC请求中一般为并发数超过了限制 max concurrent invoke 或者是超过了系统的上限出现了异常状态码为RpcException.LIMIT_EXCEEDED_EXCEPTION或者异常类型为LimitExceededException LimitExceededException
dubbo.provider.requests.unknown.failed.totalTotal Unknown Failed Requests暂为归类的其他类型的异常具体分析根据日志来看
dubbo.provider.requests.failed.totalTotal Failed Requests总的异常次数
dubbo.provider.requests.failed.network.totalTotal network Failed Requests一般发生在网络连接失败或者网络通信时候发生的异常,对应Java异常为RemotingException
dubbo.provider.requests.failed.service.unavailable.totalTotal Service Unavailable Failed Requests当不存在提供者或者调用了被禁止访问提的提供者时候会出现此异常 ,对应异常码FORBIDDEN_EXCEPTION
dubbo.provider.requests.failed.codec.totalTotal codec failed序列化相关的异常,异常码SERIALIZATION_EXCEPTION

Consumer Exception

MetricsNameDescription说明
dubbo.consumer.requests.business.failed.totalTotal Failed Business Requests当RPC请求异常状态码为RpcException.BIZ_EXCEPTION
dubbo.consumer.requests.timeout.totalTotal Timeout Failed Requests当RPC请求异常为超时异常状态码为RpcException.TIMEOUT_EXCEPTION
dubbo.consumer.requests.limit.totalTotal Limit Failed RequestsRPC请求状态码为RpcException.LIMIT_EXCEEDED_EXCEPTION或者异常类型为LimitExceededException 一般为并发数超过了限制 max concurrent invoke 或者是超过了系统的上限出现了异常LimitExceededException
dubbo.consumer.requests.unknown.failed.totalTotal Unknown Failed Requests暂为归类的其他类型的异常具体分析根据日志来看
dubbo.consumer.requests.failed.totalTotal Failed Requests总的异常次数
dubbo.consumer.requests.failed.network.totalTotal network Failed Requests一般发生在网络连接失败或者网络通信时候发生的异常,对应Java异常为RemotingException
dubbo.consumer.requests.failed.service.unavailable.totalTotal Service Unavailable Failed Requests当不存在提供者或者调用了被禁止访问提的提供者时候会出现此异常 ,对应异常码FORBIDDEN_EXCEPTION
dubbo.consumer.requests.failed.codec.totalTotal codec failed序列化相关的异常,异常码SERIALIZATION_EXCEPTION

Configcenter

Metrics NameDescription
dubbo.configcenter.totalConfig Changed Total

ApplicationInfo

Metrics NameDescription
dubbo_application_info_totalTotal Application Info