如何在 Google Compute Engine 实例重新启动或迁移时接收通知？

Question

如何在 Google Compute Engine 实例重新启动或迁移时接收通知？

google-cloud-platformgoogle-compute-engine

6

我希望每当我的Compute Engine虚拟机重新启动时，能够收到电子邮件（或其他形式的通知），这样我就可以连接并查看所有内容是否已经正确地重新启动（并生成一个实例可靠性的总体印象）

我已经查看了Google Cloud Console中的所有选项，但没有找到任何东西...

- BruceM

2个回答

0

Stackdriver提供了许多事件驱动通知选项。请参见Serverfault上的答案：

如何在Google Compute Engine自动迁移实例时获取通知

- Arne S

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Tuxdude · Accepted Answer

如果您还没有阅读过Live Migration文档，建议先了解一般的实时迁移工作原理。

实时迁移

Google提供控制选项来设置实例可用性策略, 这也让您可以控制实时迁移的方面。在这里，他们还提到了如何确定何时进行实时迁移的内容。

By default, standard instances are set to live migrate, where Google Compute Engine automatically migrates your instance away from an infrastructure maintenance event, and your instance remains running during the migration. Your instance might experience a short period of decreased performance, although generally most instances should not notice any difference. This is ideal for instances that require constant uptime, and can tolerate a short period of decreased performance.

When Google Compute Engine migrates your instance, it reports a system event that is published to the list of zone operations. You can review this event by performing a gcloud compute operations list --zones ZONE request or by viewing the list of operations in the Google Cloud Platform Console, or through an API request. The event will appear with the following text:
compute.instances.migrateOnHostMaintenance

获取实时迁移通知

此外，您可以在虚拟机上直接检测到维护事件即将发生。

元数据服务器通过调度/目录和维护事件属性提供有关实例的调度选项和设置的信息。您可以使用这些属性了解虚拟机实例的调度选项，并使用此元数据在属性上通知您何时将发生维护事件。默认情况下，所有虚拟机实例都设置为实时迁移，因此在VM实例实时迁移之前，元数据服务器将接收到维护事件通知。如果您选择在维护期间终止VM实例，则Compute Engine将自动终止并可选地重新启动VM实例（如果设置了automaticRestart属性）。要了解有关维护事件和实例在事件期间的行为的更多信息，请阅读有关调度选项和设置的文章。

您可以通过定期查询属性来了解何时会发生维护事件。该属性的值将在维护事件开始60秒之前更改，从而为您的应用程序代码提供了一种触发任何任务的方法，例如备份数据或更新日志。Compute Engine还提供一个示例Python脚本，演示如何检查维护事件通知。

您可以使用等待更新功能与maintenance-event属性一起使用，以在维护事件即将开始和结束时通知您的脚本和应用程序。这使您可以自动化您可能想在事件之前或之后运行的任何操作。以下Python示例提供了如何同时实现这两个功能的示例。

终止并（可选）重新启动

如果您想禁用实时迁移，可以选择在维护事件发生时终止实例，并可选地重新启动实例。

如果您不希望实例进行实时迁移，可以选择终止并可选地重新启动实例。使用此选项，Google Compute Engine 将向您的实例发送关闭信号，等待一段时间以使您的实例干净地关闭，终止该实例，并将其重新启动远离维护事件。此选项非常适合需要持续最大性能的实例，并且您的整个应用程序都构建为处理实例故障或重新启动。

请查看设置可用性策略部分，了解如何配置此选项的更多详细信息。

实时迁移和 GPU

如果您使用带有GPU或可抢占实例，请注意不支持实时迁移：

附有GPU的实例无法进行实时迁移。它们必须被设置为终止并可选择重新启动。Compute Engine在附有GPU的VM实例终止前提供60分钟通知。要了解更多关于这些维护事件通知的信息，请阅读获取实时迁移通知。要了解有关处理附有GPU的主机维护的更多信息，请阅读GPU文档上的处理主机维护。无法配置抢占式实例进行实时迁移。抢占式实例的维护行为始终默认设置为TERMINATE，并且您无法更改此选项。还不可能为抢占式实例设置自动重启选项。注意：对于带有GPU的实例，属性更改在实例终止之前60分钟，以便您有时间关闭并在另一台主机上重新启动。具有GPU的实例不会进行实时迁移，而是终止并可选择重新启动。要了解更多信息，请阅读GPU文档上的处理主机维护。