RAID6の故障率を算出する

RAID 6は耐障害性が高くもっともよく利用されるRAID構成だろう。しかしながら、はっきり言って、SIerに努めているサラリーマンの90%は障害率など考えたこともありません(笑)。ディスクが 「4本ならRAID 10、5本以上ならRAID 6」と何も考えずに言っているだけです。世の中のサラリーマンは自分の頭で考えることが大っ嫌いです。だからこそ、こういったことをちゃんと一つづつ理解するだけで、その他大勢から頭一つ抜け出せます。本当です。

それではRAID 6の故障率について計算してみましょう。ここでは話を簡略化するために、下記を前提とします。

[前提]

1. ディスク1本の年間故障率は1/5(20%)
2. ディスクが1本故障しても、ディスクの交換を行わず放置

RAID 6の故障率を計算するときに注意したいのは、3本以上同時に故障したときに RAIDアレイ全体の故障になるということです。つまり、4本でも、5本でも同時に壊れれば RAIDアレイ全体の障害となります。従ってRAIDアレイ 全体が故障する確率は、1 すなわち全事象から下記の確率を減じればよいことになります。

1. ディスクが1本も故障しない確率
2. ディスクが1本故障する確率
3. ディスクが2本故障する確率

はい、大抵の人はここで脱落します(笑)。その他大勢から抜け出したければ、ここでグッと我慢しないといけません。ここでちょっと、高校数学をおさらいしておきましょう。

★★★

[問題]
10円玉を3枚投げるときに、表が2回、裏が1回出る確率はいくらでしょうか?


全事象の組み合わせは全部で8通りあります。 表を○裏を×で表現すると下記のとおりになります。
1. ○、○、○
2. ×、○、○
3. ○、×、○
4. ○、○、×
5. ○、×、×
6. ×、○、×
7. ×、×、○
8. ×、×、×

コインは裏と表の2通りしかないので、2×2×2 で全事象は8通りありますね。表が2回でる組み合わせは3通りあります。これも、高校数学の知識があれば、わざわざ数えなくてもわかります。

3枚のコインのうち2枚が表なので、3C2ですね。

3C2=(3×2)× (2×1)  = 3

したがって、10円玉を3枚投げるときに、表が2回、裏が1回出る確率は、
(1/2)^2 ×(1/2)1 × 3C2 = 3/8、つまり 37.5%となります。

※「^」は乗を意味します

★★★

そでは、ディスクの場合にもどりましょう。考え方は同じです。

コインの場合は表が出る確率も裏が出る確率も1/2ですが、ここではディスクが故障する確率を 1/5 とします。ディスクが故障しない確率は 1- 1/5 で、4/5となりますね。

6本のディスクが1本も故障しない確率
= (4/5)^6 × 6C0 = 0.26

6本のディスクのうち、1本故障する確率

=(1/5)^1 ×(4/5)^5 × 6C1 = 0.39

6本のディスクのうち2本故障する確率
=(1/5)^2 ×(4/5)^4 × 6C2 = 0.25

レイドアレイ全体が故障しない確率は、0.26+0.39+0.25 = 0.9
従って、1年間でディスクが故障する確率は、1-0.9 = 0.1
つまり、10%となります。

上記から下記の公式が導かれます。

●RAID6全体が故障する確率 =
1 -{
[(F^0) ×((1-F)^(N-0)) × (NC0)]+
[(F^1) ×((1-F)^(N-1)) × (NC1)]+
[(F^2) ×((1-F)^(N-2)) × (NC2)]
}
※N=ディスク総数、F=ディスク1本の故障率

簡単ですね。今回はディスクの年間故障率を20%としましたが、実際はもっと低いです。実際に算出するときは各メーカーの公表値を使いましょう。

障害率ではなく、MTBFで公表されている場合もあるのでその場合は下記のようになります。

例えば、MTBFが40万時間のときの年間故障率は、

DISK故障率 = 365*24/400000 = 0.0219 (2.19%)

また、今回は前提として、ディスクが1本故障しても放置する前提としましたが、正しく監視・運用をしていれば故障してから、24時間以内にディスクの交換が行われるので故障率は大幅にさがります。その場合は故障率を年間故障率ではなく、24時間の故障率にして計算してあげるといいですね。

本日の講義は以上となります。

  • このエントリーをはてなブックマークに追加

コメントをどうぞ

メールアドレスが公開されることはありません。