在乌默大学的博士论文中,Jakub Krzywda开发了模型和算法来控制云基础设施的功耗和托管应用的性能之间的权衡,从而在有限的电力预算下实现安全高效的运行。
云计算基础设施让谷歌、脸书和亚马逊等大多数互联网服务保持运行,消耗大量能源,从而加剧气候变化。
有趣的是,在一定条件下,数据中心原则上与有老旧电器的房子没有太大区别。大多数人可能会回忆起一个案例,当时他们打开了太多的电器,同时使断路器跳闸。发生这种情况是因为电气安装不是为了维持这种高功率浪涌。
在现代数据中心,为所有服务器供电的电力传输基础设施通常是有意提供的。在这种情况下,它无法承受所有服务器全速运行的激增。乍一看,这听起来是一个糟糕的计划,但在实践中,几乎不会发生所有服务器同时需要计算能力的情况。由于电力传输基础设施的成本与其能够承受的峰值功率成正比,因此对其设置上限将有助于数据中心运营商节省资金,否则将花费在几乎不必要的基础设施上。
然而,在云行业,“几乎从不”是不够的。许多云提供商向他们的客户承诺,基础架构将在99.99%的时间内可用-它每年只允许52分钟的停机时间。
这是本文的贡献:当没有足够的电力来全速运行所有应用程序时,处理数据中心操作的最佳方式是什么?运营商应该完全关闭不太重要的应用程序还是强制所有应用程序变慢?某些类型的应用程序能更好地适应性能下降吗?应该采取什么措施来确保应用程序在降低功耗的同时仍能产生有用的结果?应该使用哪种技术来实施它?
Jakub Krzywda说:“为了回答上述问题,在这篇论文中,我开发了一个模型来捕捉功耗和应用程序性能之间的关系,并提出了一组功能预算控制器,它们在应用程序、服务器和整个数据中心级别工作,以强制执行功率限制,同时最大限度地降低性能下降。
本文所包含的研究成果具有实际应用价值,例如,使用现代服务器中可用的软件技术的一系列建议,这些建议可以使数据中心运营商以更少的电力运行其基础设施,同时仍然确保其客户对其性能的满意度。申请。
本文提供的结果和分析可供数据中心运营商用来提高服务器效率、降低总体运营成本并最大限度地降低性能下降。这项工作中生成的所有软件,包括模型、控制器和模拟器的源代码,都是开源的,可在线用于研究和工业数据中心的部署。

