在周二对Amazon Web Services(AWS)造成重大破坏的后续行动中,该公司昨天宣布,造成事故的原因是人为错误…… 确切地说是错别字。

“ Amazon Simple Storage Service(S3)团队正在调试一个导致S3计费系统进度比预期慢的问题。太平洋标准时间上午9:37,经过授权的S3团队成员使用已建立的剧本执行了一条命令,该命令旨在为S3计费过程使用的S3子系统之一删除少量服务器。不幸的是,该命令的输入之一输入错误,并且删除了比预期更大的服务器集。意外删除的服务器支持另外两个S3子系统。”
亚马逊的公告继续了有关由简单输入错误引起的连锁反应的更多详细信息。但是,大多数人以为是软件错误是造成混乱的原因,相反,他们了解到在精心设计的调试过程中,“人为错误”正在等待。可以理解,我们所有人都熟悉该语言。
正如ZDNet所指出的那样:历史上充斥着错字错误,导致重大技术中断,混乱和大量损失。这包括在速度和轨迹编码中缺少连字符,导致1962年美国国家航空航天局的维纳斯火箭爆炸,估计损失8000万美元(按今天的美元计算,超过10亿美元),以及许多不幸的美国国家航空航天局糟糕的PR。关于那个特殊的错误,2001年:《太空漫游》作家亚瑟·克拉克(Arthur C. Clarke)称其为 “历史上最昂贵的连字符”。
AWS及其受影响的客户(包括主要发行商和政府站点)遭受的实际损失是未知的。但是,毫无疑问,亚马逊将对其S3服务进行重要的更改,包括S3子系统的恢复时间,并且客户群可能不会大幅减少。他们是全球云基础设施中的主要角色,实在太过夸张,以至于打字错误不会成为真正的行业改变者。

