血と汗となみだを流す

クラウドエンジニアになるための修業の場

ElastiCacheノード入れ替えイベントについてのまとめメモ

※以前書いたのも混ざってます

primary/replica同時にノード入れ替え発生

  • 20180731時点
  • 2ノードのレプリケーショングループとしていて、primary/replicaが「同時に」ノード入れ替え対象となった場合
    • メンテナンスウィンドウはレプリケーショングループ単位の指定なので、片方ずつメンテナンスウィンドウを設定することが出来ない
    • 予定期間のメンテナンスウィンドウ時間内にprimary/replica同時にノード入れ替えが発生するように見える
    • が!!primary/replica同時に発生した場合は、どちらかが翌週のメンテナンスウィンドウに延長されるらしい
    • 翌週なので予定期間外にも関わらず実施されるっぽい

ElastiCacheのメンテナンスウィンドウを手動で変更することに発生する現象

  • 20180727時点
  • ノード入れ替えイベントが発生した際に、最初に設定されていたメンテナンスウィンドウの時間を前倒しすると、予定期間より前にノード入れ替えが発生する現象がある
  • 例(マジであった)
    • ノード入れ替えイベント発生!
    • 期間は 2018/07/23(月)00:00〜2018/07/29(日)23:59の、メンテナンスウィンドウ(web 0:00〜1:00)の時間帯に実施!
      • つまり7/29(水)の0:00〜1:00に発生
    • メンテナンスウィンドウを(sun 0:00〜1:00)に変更!
      • 7/29(日)0:00〜1:00に発生するはず・・・!
    • 7/22(日)0:00〜1:00に発生

アプリケーション側のコネクションを張り直す必要がある場合(裏は取れていません。発生した現象です)

  • コネクションが切れなかったため、アプリケーション側でコネクションを張り直す必要がありました。
    • ノードのスケールアップ
    • FailOverを2回する(1回はOK)