Minio纠删码快速入门 Slack

Minio使用纠删码erasure codechecksum来保护数据免受硬件故障和无声数据损坏。 即便您丢失一半数量N/2的硬盘您仍然可以恢复数据。

什么是纠删码erasure code?

纠删码是一种恢复丢失和损坏数据的数学算法, Minio采用里德-所罗门码将对象分片为数据和奇偶校验块。 这就意味着如果是12块盘一个对象可被分片的范围是6个数据块和6个奇偶校验块 到 10个数据块和2个奇偶校验块之间。

默认情况下, MinIO 将对象拆分成N/2数据和N/2 奇偶校验盘. 虽然你可以通过 存储类型 自定义配置, 但是我们还是推荐N/2个数据和奇偶校验块, 因为它可以确保对硬盘故障提供最佳保护。

比如上面12个盘的例子通过默认配置运行MinIO服务的话你可以丢失任意6块盘不管其是存放的数据块还是奇偶校验块你仍可以从剩下的盘中的数据进行恢复是不是很NB感兴趣的同学请翻墙google。

为什么纠删码有用?

纠删码的工作原理和RAID或者复制不同像RAID6可以在损失两块盘的情况下不丢数据而Minio纠删码可以在丢失一半的盘的情况下仍可以保证数据安全。 而且Minio纠删码是作用在对象级别可以一次恢复一个对象而RAID是作用在卷级别数据恢复时间很长。 Minio对每个对象单独编码存储服务一经部署通常情况下是不需要更换硬盘或者修复。Minio纠删码的设计目标是为了性能和尽可能的使用硬件加速。

Erasure

什么是位衰减bit rot保护?

位衰减又被称为数据腐化Data Rot、无声数据损坏Silent Data Corruption,是目前硬盘数据的一种严重数据丢失问题。硬盘上的数据可能会神不知鬼不觉就损坏了,也没有什么错误日志。正所谓明枪易躲,暗箭难防,这种背地里犯的错比硬盘直接咔咔宕了还危险。 不过不用怕Minio纠删码采用了高速 HighwayHash 基于哈希的校验和来防范位衰减。

驱动器(盘)如何使用纠删码?

MinIO会把你提供的所有驱动器按照4 到 16个一组划分为多个纠删码集合,因此,你提供的驱动器数量必须是以上这些数字(4到16)的倍数。每个对象都会被写入一个单独的纠删码集合中。

Minio会尽可能使用最大的纠删码集合大小EC set size进行划分.比如 18个盘会被划分为2个纠删码集合每个集合有9个盘24个盘也会被划分为2个纠删码集合每个集合有12个盘。对于将MinIO作为独立的纠删码部署运行的场景而言这是正确的。然而分布式部署 时,选择的是基于节点(亲和力)的纠删条带大小.

驱动器的大小应当都差不多。

Minio纠删码快速入门

1. 前提条件:

安装Minio- Minio快速入门

2. 以纠删码模式运行Minio

示例: 使用Minio在12个盘中启动Minio服务。

minio server /data{1...12}

示例: 使用Minio Docker镜像在8块盘中启动Minio服务。

docker run -p 9000:9000 --name minio \
  -v /mnt/data1:/data1 \
  -v /mnt/data2:/data2 \
  -v /mnt/data3:/data3 \
  -v /mnt/data4:/data4 \
  -v /mnt/data5:/data5 \
  -v /mnt/data6:/data6 \
  -v /mnt/data7:/data7 \
  -v /mnt/data8:/data8 \
  minio/minio server /data{1...8}

3. 验证是否设置成功

你可以随意拔掉硬盘看Minio是否可以正常读写。