文档基于2025-10-10日社区最终版构建     
切换到英文版    进入演示系统    进入交流社区

MinIO Documentation

使用 InfluxDB 进行监控和告警

MinIO 通过以下方式发布集群和节点指标:Prometheus 数据模型. InfluxDB支持抓取MinIO指标数据用于监控和告警。

本页面的流程记录了以下内容:

  • 配置 InfluxDB 服务以抓取和显示 MinIO 部署的指标

  • 在 MinIO 指标上配置告警

前提条件

此过程需要以下条件:

  • 现有的 InfluxDB 部署配置有一个或多个通知端点

  • 一个现有的 MinIO 部署,具有对 InfluxDB 部署的网络访问权限

  • An mc在本地主机上配置安装访问MinIO 部署

这些说明使用version 2 metrics.有关指标 API 版本的更多信息,请参阅指标和告警。

对于在 Kubernetes 上的 MinIO 部署,此流程假设所有必要的网络控制组件(如 Ingress 或负载均衡器)均已就位,以便于 MinIO 租户与 InfluxDB 服务之间的访问。

配置 InfluxDB 使用 MinIO 指标进行收集和告警

重要

此过程专门使用 InfluxDB UI 来创建抓取端点。

InfluxDB UI 不提供与使用Telegraf以及相应的Prometheus 插件具体来说:

  • 您无法通过 InfluxDB UI 启用对 MinIO 指标端点的身份验证访问

  • 您无法为收集的指标设置标签(例如url_tag) 用于唯一标识给定 MinIO 部署的指标

Telegraf Prometheus 插件还支持 Kubernetes 特定功能,例如从minio给定 MinIO 租户的服务。

配置 Telegraf 超出了本流程的范围。 您可以将本流程作为配置 Telegraf 抓取 MinIO 指标的一般指南。

  1. 配置对 MinIO 指标的公共访问权限

    设置MINIO_PROMETHEUS_AUTH_TYPE环境变量"public"对于 MinIO 部署中的所有节点。 然后您可以重新启动部署以允许对 MinIO 指标进行公共访问。

    您可以通过尝试以下操作来验证更改:curl指标端点:

    curl https://HOSTNAME/minio/v2/metrics/cluster
    

    替换HOSTNAME通过您访问 MinIO 部署的负载均衡器或反向代理的 URL。 您也可以指定任何单个节点作为HOSTNAME:PORT除了节点主机名外,还需要指定 MinIO 服务器 API 端口。

    响应体应包含收集到的MinIO指标列表。

  2. 登录 InfluxDB UI 并创建存储桶

    选择组织您希望存储 MinIO 指标的位置。

    创建一个新存储桶用于存储 MinIO 部署指标的存储位置。

  3. 创建新的抓取源

    创建一个新的 InfluxDB 数据采集器.

    指定 MinIO 部署的完整 URL,包括指标端点:

    https://HOSTNAME/minio/v2/metrics/cluster
    

    替换HOSTNAME通过您访问 MinIO 部署的负载均衡器或反向代理的 URL。 您也可以指定任何单个节点作为HOSTNAME:PORT除了节点主机名外,还需要指定 MinIO 服务器 API 端口。

  4. 验证数据

    使用DataExplorer可视化收集的 MinIO 数据。

    例如,您可以设置一个过滤器在minio_cluster_capacity_usable_total_bytesminio_cluster_capacity_usable_free_bytes比较 MinIO 部署中的总可用空间与总空闲空间。

  5. 配置检查

    创建一个new Check关于 MinIO 指标。

    以下示例检查规则为 MinIO 部署提供了警报基准。 您可以修改这些示例或将其用作构建自定义检查的指导。

    • 创建一个阈值检查命名MINIO_NODE_DOWN.

      设置过滤器为minio_cluster_nodes_offline_totalkey.

      设置阈值 to WARN当值大于1

    • 创建一个阈值检查命名MINIO_QUORUM_WARNING.

      设置过滤器为minio_cluster_drive_offline_totalkey.

      设置阈值 to CRITICAL当该值比您配置的值小一时擦除码奇偶校验设置。

      例如,使用 EC:4 的部署应将此值设置为3.

    配置您的通知端点通知规则使得每种类型的检查都能触发适当的响应。