RAID卡一致性检查 概念解读

相关原理解释

  1. PR(Patrol Read):硬盘巡读功能,针对阵列卡下组建RAID 的HDD 盘(SSD 默认是关闭的)。RAID 卡下发verify 指令给硬盘,硬盘FW 对物理介质进行检查是否有坏块,并反馈检查结果给RAID卡。而硬盘本身存在background 功能,对全盘所有Block 进行读取校验,如果有异常区域会进行 修复或者标记,功能类似阵列卡的PR。可以替代阵列卡的PR 功能,关闭PR 不影响数据坏块校验;
  2. CC(Consistency Check):冗余逻辑盘的数据一致性校验功能,定期对逻辑盘的数据区与备份 区进行一致性校验,当检测到异常时,通过不同的RAID 机制进行数据的恢复。但如果正常的IO 读 写检测到数据不一致问题,也会触发RAID 数据一致性的校验修复,关闭CC 不影响数据一致性的校验修复。
  3. 在IO时延要求高的场景下(常见有分布式存储、分布式数据库),当LSI阵列卡在执行PR或者CC时,会出现硬盘IO时延增大导致业务受影响的情况。

 

我个人疑惑点在于:PR会自动校验数据,CC也会进行校验数据,那为什么会分成两个概念呢

解释

PR和CC确实都和”检查数据”有关,但它们检查的对象和目的完全不同。我用生活中的例子帮你理解:

1. PR(硬盘巡读)——检查硬盘的”身体健康”

  • 就像体检医生:PR是定期检查硬盘的物理健康,看看硬盘的”皮肤”(物理盘面)有没有坏点、划痕、老化等问题。
  • 检查对象:单个硬盘本身(比如检查你的心脏、肝脏是否健康)
  • 作用:防止硬盘突然暴毙。比如发现某个区域有坏块,就提前标记出来,把数据搬到安全区域。

2. CC(一致性校验)——检查数据的”家庭关系”

  • 就像户口普查员:CC是检查RAID家庭成员(多个硬盘)之间的数据是否一致,比如RAID1镜像的两个硬盘内容是否完全相同。
  • 检查对象:多个硬盘之间的数据关系(比如检查夫妻两人的户口信息是否一致)
  • 作用:防止数据出现”家庭矛盾”。比如发现主硬盘和备份硬盘的数据不一致,就用正确的数据覆盖错误的部分。

举个具体例子(RAID1镜像为例):

  • PR发现硬盘A有个坏块 ➜ 标记这个坏块不再使用
  • CC发现硬盘A和硬盘B在某个位置的数据不同 ➜ 用正确的数据覆盖错误的一方

关键区别总结

PR CC
检查对象 单个硬盘的物理健康 多个硬盘之间的数据关系
好比 体检 核对账本
主要目的 防止硬盘物理损坏 防止数据逻辑错误
影响范围 单块硬盘 整个RAID阵列

关闭后的区别

  • 关PR:硬盘自己还有后台体检(类似手机自动清理垃圾),风险不大
  • 关CC:就像不核对账本,平时存取钱(正常IO)时发现问题还能修复,但可能错过隐藏的问题

这两个功能就像汽车的”定期保养”(PR)和”四轮定位检查”(CC),虽然都检查车,但关注点完全不同。

原创文章,作者:AIRF,如若转载,请注明出处:http://www.ai-rf.com/index.php/2025/02/20/raid%e5%8d%a1%e4%b8%80%e8%87%b4%e6%80%a7%e6%a3%80%e6%9f%a5-%e6%a6%82%e5%bf%b5%e8%a7%a3%e8%af%bb/

(0)
AIRFAIRF
上一篇 2025年2月19日
下一篇 2025年2月26日

相关推荐

  • H3C服务器红灯故障解决方案

    1.现象描述 巡检部门巡检现场发现H3C服务器红灯报警,现场查看服务器状态,现场查看后未发现任何故障,收集带外日志信息也未发现任何告警 2.解决问题 更换两次主板后无果,将服务器进…

    硬件天地 2021年11月21日
  • 物理服务器多块硬盘故障

    一.问题描述 生产环境中某操作系统并插网线后在系统下网口状态为DOWN,HBA卡网卡口状态显示正常,但无法与光纤交换机进行互信 二.排查问题 查看服务器网卡灯是否正常闪烁查看网线与…

    硬件天地 2021年11月21日
  • 浪潮NF8480 M5服务器HBA卡BUG处理

    前景提示 浪潮8480M5型号服务器在安装Redhat7.6操作系统并安装存储多路径软件后重启服务器报错导致系统无法进入 处理方法 1.更新HBA卡驱动1.1 安装需要提前安装开发…

    硬件天地 2021年12月30日
  • 查看RAID卡一致性检查状态 命令及关闭方法

    ./storcli64 /call show cc ./storcli64 /call set cc=off命令,关闭CC功能。 ./storcli64 /call show cc…

    2025年2月19日
  • U盘安装Windows Server 2016入坑篇

    windows server版安装报错吗???安装提示cannot open the required file X:Sourceslinstall.wim????不用慌直接为你解…

    硬件天地 2023年7月17日
  • IPMI管理工具使用方法

    前言 最近需要对多台服务进行控制,通过服务器的 BMC 控制台去控制太麻烦,服务器刚好支持 IPMI 协议,这里记录下常用的几条命令备忘。 什么是 IPMI 智能平台管理接口(In…

    硬件天地 2021年12月31日
  • uefi和legacy的区别有哪些

    我也是因为这两天安装Windows系统时,硬盘大于4T且默认安装使用的MBR模式,导致RAID的4T空间只能分出2T的空间,最后把服务器模式更改为UEFI,并且需要把U盘的格式从N…

    2023年3月7日
  • 信创服务器和现有商业芯片服务器的故障率对比

    @Yufu338 信息技术经理: 故障率相当,但因为信创服务器较少,所以数据仅供参考;信创服务器最大的问题不是故障率,而是出现故障后的故障修复能力比较弱,很多故障都无法做根因分析,…

    硬件天地 2023年8月3日
  • StorCLI工具日志收集分析

    工具名称​​:storcli(LSI/Broadcom RAID 卡管理工具) ​​用途​​:收集服务器 RAID 控制器的详细硬件配置与运行状态,用于存储系统故障排查或健康检查。…

    硬件天地 2025年7月24日
  • 电脑死机的时候,CPU到底在做什么?

    前几天,读者群里有人聊起了一个问题:计算机为什么死机,死机的时候CPU在干什么? 我想起之前写过这方面的文章,想着估计有不少新粉没有看过,就挖个坟给大家看看,这个有趣又能涨知识的问…

    2023年11月20日

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注