Nutanixバイブル/NutanixBible_2-01J のバックアップ(No.2)

バックアップ一覧
差分を表示
現在との差分を表示
ソースを表示
Nutanixバイブル/NutanixBible_2-01J へ行く。
- 1 (2014-08-28 (木) 10:34:05)
- 2 (2014-08-28 (木) 12:08:36)
- 3 (2014-09-18 (木) 10:08:02)
- 4 (2014-09-18 (木) 17:34:08)

(2-01) データの保護 (Data Protection)

Nutanix Platformは、現在、resiliency factor 即ち replicaton factor(RF)とchecksumを用いて、node,diskの故障や機能低下が発生した場合にdataの冗長性と有効性を保障している。上記に述べた通り、OpLog?は、低遅延のSSD tierへの書込み発生を吸収するための処理の段階となる。 hostへの書込みに成功した事を知らせるacknowledge(ack)が発行される前に、ローカルなOpLogs?に書込まれる時に、dataは同期的にRFの値に依って他の１つ或いは２つのCVMのOpLog?に複製される。

この仕組により、少なくても２～３箇所の独立した異なった場所にデータが存在しているため、障害に耐性があることを意味している。

注) RF3を実現するためにはmetadataはRF5となるため、最低5nodeが必要となる。Data RFは、 PRISM経由でコンフィグレーションが行われ、コンテナレベルで実現されている。

いかなる"ホットノード"も除外しスケールがリニアに実現されることを保障するために、全てのnodeが OpLog?の複製に参加している。 dataが書込まれている間にchecksumが計算され、metadataの一部として保存される。そして、dataは、RFが暗黙のうちに維持されているextent storeは、非同期的に書出される。 node或いはdiskに障害が発生した場合、dataはRFを維持しているため、クラスター内の全nodeにわたって再度複製が作られる。 dataが読取られる時は常に、dataが正しいものであることを保障するために checksumが計算される。 checksumとdataが、一致しない様な事態が発生した場合、複製からdataが読み出され正しくない複製を置換える。

以下の図は、この仕組が論理的にどの様な見え方をするのかを表している。

図版挿入

Nutanixバイブル