Kubernetes 環境で NoSQL データベースをバックアップする
このガイドでは、ScalarDB または ScalarDL が Kubernetes 環境で使用するマネージド データベースのトランザクション的に一貫したバックアップを作成する方法について説明します。 NoSQL データベースまたは複数のデータベースを使用する場合は、トランザクションの一貫性のあるバックアップを作成するために ScalarDB または ScalarDL を一時停止する必要があることに注意してください。
ScalarDB がデータベースをバックアップする方法の詳細については、A Guide on How to Backup and Restore Databases Used Through ScalarDB を参照してください。
このガイドでは、ポイントインタイム リカバリ (PITR) または同等の機能を使用していることを前提としています。 そのため、復旧のためには継続的な取引がない期間を設ける必要があります。 その後、PITR を使用してデータをその特定の期間に復元できます。 進行中のトランザクションがない期間を作成せずにデータをある時点に復元すると、復元されたデータはトランザクション的に不整合となり、ScalarDB または ScalarDL がデータを適切に処理できなくなる可能性があります。
データを復元する期間を作成し、バックアップを実行します
-
バックアップ操作を開始する前に、
kubectl get pod
コマンドを実行して、次の 4 つの点を確認します。- ScalarDB または ScalarDL ポッドの数。 ポッドの数を書き留めて、その数をバックアップの実行後のポッドの数と比較できるようにします。
NAME
列の ScalarDB または ScalarDL ポッド名。 バックアップの実行後にそれらの名前とポッド名を比較できるように、ポッド名を書き留めます。- ScalarDB または ScalarDL ポッドのステータスは、
STATUS
列でRunning
になっています。 バックアップを続行する前に、ポッドが実行中であることを確認してください。 次のステップではポッドを一時停止する必要があります。 - **
RESTARTS
列の各ポッドの再起動回数。** バックアップ実行後の再起動回数と比較できるように、各ポッドの再起動回数を書き留めます。
-
scalar-admin
を使用して、ScalarDB または ScalarDL ポッドを一時停止します。 ポッ ドを一時停止する方法の詳細については、このガイドのscalar-admin
の使用の詳細 セクションを参照してください。 -
pause completed
時間を書き留めます。 PITR 機能を使用してデータを復元する場合は、その時間を参照する必要があります。 -
バックアップ機能を使用して、各データベースをバックアップします。 自動バックアップと PITR 機能を有効にしている場合、管理されたデータベースは自動的にバックアップを実行します。 クライアント クロックとデータベース クロック間のクロック スキューの問題を回避するのに十分な長い期間を作成できるように、約 10 秒待つ必要があることに注意してください。 この 10 秒の期間は、PITR 機能を使用してデータを復元できる正確な期間です。
-
scalar-admin
を使用して、ScalarDB または ScalarDL ポッドの一時停止を解除します。 ポッドの一時停止を解除する方法の詳細については、このガイドのscalar-admin
の使用の詳細 の使用の詳細」セクションを参照してください。 -
unpause started
時刻を確認します。 PITR 機能を使用してデータを復元できる正確な期間を確認するには、unpause started
時間を確認する必要があります。 -
バックアップの実行後にポッドのステータスを確認します。 バックアップ操作完了後、
kubectl get pod
コマンドを使用して以下の4点を確認する必要があります。- ScalarDB または ScalarDL ポッドの数。 この数が、バックアップを実行する前に書き留めたポッドの数と一致することを確認します。
NAME
列の ScalarDB または ScalarDL ポッド名。 名前がバックアップを実行する前に書き留めたポッド名と一致することを確認します。- ScalarDB または ScalarDL ポッドのステータスは、
STATUS
列でRunning
になっています。 RESTARTS
列の各ポッドの再起動回数。 カウントが、バックアップを実行する前に書き留めた再起動回数と一致することを確認します。
2 つの値のいずれかが異なる場合は、バックアップ操作を最初から再試行する必要があります。 値が異なる理由は、バックアップの実行中に追加または再起動されたポッドが原因である可能性があります。 そのような場合、それらのポッドは
unpause
状態で実行されます。 ポッドがunpause
状態にあると、バックアップ データのトランザクションの不整合が発生します。 -
(Amazon DynamoDB のみ) DynamoDB の PITR 機能を使用する場合、この機能は PITR を使用して別の名前テーブルでデータを復元するため、バックアップを作成するために追加の手順を実行する必要があります。 データを復元できる正確な期間を作成した後の追加手順の詳細については、Kubernetes 環境でのデータベースの復元 を参照してください。