文档基于2025-10-10日社区最终版构建     
切换到英文版    进入演示系统    进入交流社区

MinIO Documentation

硬件故障后恢复

分布式 MinIO 部署依赖于擦除编码提供对多个驱动器或节点故障的内置容错能力。根据部署拓扑和选定的纠删码奇偶校验配置,MinIO 可以容忍部署中高达一半的驱动器或节点发生故障,同时保持对对象的读取访问("读取法定人数")。

下表列出了 MinIO 部署中的典型故障类型 以及从每种故障中恢复的操作步骤链接:

故障类型

描述

硬盘故障

MinIO支持用新的健康驱动器热替换故障驱动器。

节点故障

MinIO 检测到节点重新加入部署并开始主动愈合节点重新加入集群后不久,会恢复先前存储在该节点上的数据。

站点故障

MinIO 站点复制支持在完全站点丢失后对存储桶、对象和符合复制条件的配置设置进行完整重新同步。

由于MinIO可以在降级状态下运行而不会出现显著的性能损失,管理员可以根据硬件故障率来安排硬件更换计划。"常规"故障率(单驱动器或单节点故障)可以允许更合理的更换时间窗口,而"严重"故障率(多驱动器或多节点故障)则可能需要更快速的响应。

对于具有一个或多个处于部分故障或降级状态(驱动器错误增加、SMART警告、MinIO日志中出现超时等)的驱动器的节点,您可以安全地卸载该驱动器if集群有足够的 剩余健康驱动器来维持读写仲裁与持续产生读写错误的驱动器相比,缺失的驱动器对部署的影响较小。

驱动器独占访问

MinIO需要 独家对象存储所提供的驱动器或卷的访问权限。 任何其他进程、软件、脚本或人员均不得执行任何直接对提供给 MinIO 的驱动器或卷,或 MinIO 置于其上的对象或文件执行操作。

除非得到 MinIO 工程团队指示,否则不得使用脚本或工具直接修改、删除或移动所提供驱动器上的任何数据分片、校验分片或元数据文件,包括在不同驱动器或节点间的转移操作。 此类操作极有可能导致大范围损坏和数据丢失,超出 MinIO 的自我修复能力范围。

MinIO 专业支持

MinIO SUBNET用户可以使用登录并创建一个与驱动器、节点或站点故障相关的新问题。 通过SUBNET与MinIO工程团队协调,可以确保生产环境中MinIO部署的成功恢复操作,包括根本原因分析和健康诊断。

社区用户可以在以下平台寻求支持:MinIO Community Slack社区支持仅为尽力而为,不保证响应时间的服务等级协议。