システム構成要素を冗長化することでシステム信頼性を高めること。
冗長化された機器のどれか一つに障害が発生した場合に正常動作している機器に自動的に切り替えるシステム。障害の解消後、元の状態に戻すことをフェイルバックと呼ぶ。
障害発生時にシステム性能は低下しても運用の継続が可能なシステム。縮退運転状態でシステムを運用することをフォールバックと呼ぶ。
障害の発生を防ぐ措置をすることでシステム信頼性を高めること。
不具合が生じても警告を発したりすることで致命的な障害に至らないように運用させるシステム。
ログを保存してロールバック可能にしたりすることで、システム利用者が運用中に誤操作しても障害に至らないようにできるシステム。
システムの信頼性を表す要素に各要素の頭文字をとったRASISがある。
Reliability | 狭義の信頼性 | システムの故障のしにくさ |
Availability | 可用性 | システムが継続して稼働できる能力 |
Serviceability | 保守性 | システムのメンテナンス性 |
Integrity | 一貫性,完全性 | システム内での論理の不整合や矛盾がないこと |
Security | 安全性 | 障害や不正なアクセスに対する耐性 |
平均故障間隔。故障から復旧してから次の故障が発生するまでの平均の時間数。信頼性の指標として用いられる。以下の式で求められる。
MTBF = 正常動作時間の合計 ÷ 正常動作の回数
平均修理時間。故障発生から復旧までに要する時間の平均。保守性の指標として用いられる。以下の式で求められる。
MTTR = 修理時間の合計 ÷ 故障発生の回数
時間全体に対して正常動作していた時間の割合。可用性の指標として用いられる。以下の式で求められる。
稼働率 = | MTBF | ≈ | 正常動作時間 |
MTBF + MTTR | 正常動作時間 + 故障時間 |