クラウドインフラ構築記

現在AWSの構築支援に携わっております。今注視しているのは、GKE、BigQuery、Google Dataflowなどサービスを展開しているGoolge Cloud Platformです。

EC2 Auto Recoveryを試してみました。 #aws


ホストの障害を検知して、別のホストにマイグレーションすることができるEC2 Auto Recoveryは、US東海岸リージョンで使えるようになったので、実際試してみました。関連リリース記事はこちらになります。

これで、GCP ( Goolge Cloud Platform)のライブマイグレーションと似たことがAWSでも。ライブマイグレーションができれば、昨年末のXeon セキュリティパッチによるリブート祭りでも対応できるのでは。

1-0

 

Auto Recovery のドキュメントによるとEBS ストレージを使っているインスタンスに限定されるとなっています。

他にも、新しめのインスタンスのみ(c4シリーズは現時点では対応リストに入っていない)など制限事項があります。詳しくはこちらを。

  • Instances that use Amazon EBS storage exclusively.

インスタンスストアとしてswapが使われています。

[   37.962432] Adding 4188668k swap on /dev/xvdb.  Priority:-1 extents:1 across:4188668k SSFS

Swapをインスタンスストレージに使っているインスタンスのEC2 Recoveryを発動させてみました。StateがAlarmになった場合、発動させるようにしますが、それではホストが障害がなければ発動しませんので、疑似障害のために、INSUFFICIENTになったときに発動させるようにしました。

1-1

下記の通り、リカバリが失敗しました。インスタンスストアを使うインスタンスのリカバリができない結論か。

1-2

念のため、インスタンスストア(ephemeral disk)を使わないインスタンスのリカバリは、正常に終了しました。

1-3

 

結論インスタンスストアを使うとNGか。

コメントは受け付けていません。