马斯克硬核搬迁服务器:3天移动700个机架!真的很“省钱”吗?
《伊隆・马斯克亲自搬运服务器,彰显他在 X 公司(此前为 Twitter)的 “狂热紧迫感”》
-
此内容改编自 Walter Isaacson 本月出版的传记《伊隆・马斯克》。
“这让我的大脑感到压抑,” 他说。
“对不起,我没有这个意思,” 她平稳地回答。
“你知道头爆炸的表情符号吗?” 他问她。“我的脑袋现在就是这个感觉。真是一堆屁话。波特兰明显有大量的空间,从一个地方迁移到另一个地方简直小菜一碟。”
当 X 公司的经理们再次试图解释时,马斯克打断了他们。“你们能不能去我们的服务器中心,然后给我发视频?” 他问。
那是圣诞节前的三天,经理承诺一周后提供视频。“不,明天,” 马斯克命令。“我曾经自己建设过服务器中心,我可以判断是否还可以放更多的服务器。这就是为什么我问你们是否真的去过那些设施。如果你们没有去过,那你们说的就是胡说八道。”
SpaceX 和 Tesla 的成功是因为马斯克不懈地推动他的团队更加敏捷、有创造力,并发起突击冲刺以解决所有障碍。这就是他们如何在弗里蒙特快速组装汽车生产线,并在得克萨斯州的沙漠中建立试验设施,以及在卡纳维拉尔角使用旧零件建造发射场。
“你们需要做的就是将服务器迁移到波特兰,” 他说。“如果超过 30 天,我会很震惊。” 他停顿了一下,重新计算。“找一家搬家公司,运输电脑需要一个星期,然后再花一个星期来连接它们。两周。就应该这样。”
所有人都默不作声。但马斯克仍在发火。“如果你们租了一个 U-Haul (一家租车公司),你们可能自己就能完成。” 两位 X 公司的经理看着他,试图判断他是否是认真的。马斯克的两位亲密助手 Steve Davis 和 Omead Afshar 也在场。他们多次看到过他这样,知道他可能真的这么认为。
“为什么我们现在不去做?”James Musk 提议。
该设施的其他工作人员带着混合的惊奇和恐惧看着。马斯克和他的团队在没有用箱子包装或用防护材料包裹的情况下,直接推动服务器,然后使用店里买来的绑带固定它们在卡车上。“我从未装载过半挂车,”James 承认。Ross 称其为 “令人恐惧”。这就像清理衣橱,“但里面的东西都是至关重要的。”
下午 3 点,当他们把四台服务器装到卡车上后,这一消息传到了拥有并管理数据中心的 NTT 公司的高层。他们下令马斯克的团队停止行动。马斯克的表情中混杂着欢乐和愤怒,这是他经常伴随着他的狂热激进时出现的情绪。他给存储部门的 CEO 打电话,CEO 告诉他,在没有专家的情况下,是不可能移动服务器机架的。“屁话,” 马斯克反驳。“我们已经装了四台到半挂车上了。”
这位 CEO 随后告诉他,一些地板承受不了超过 500 磅的压力,所以滚动一个 2000 磅的服务器会造成损坏。马斯克回应说,服务器有四个轮子,所以任何一个点上的压力只有 500 磅。“这家伙数学真的不太行,” 马斯克告诉他的队友。
在破坏了 NTT 管理层的圣诞前夜,并使他们在明年可能损失超过 1 亿美元的收入后,马斯克表示同情,并说他会暂停迁移服务器两天。但他警告说,圣诞节后他们会继续。
圣诞节后,Andrew 和 James 返回萨克拉门托,看看他们还能移动多少服务器。他们没有带足够的衣服,所以去了沃尔玛买了牛仔裤和 T 恤。
NTT 希望他们使用的搬运承包商收费是每小时 200 美元。所以 James 在 Yelp 上找到了一个名为 Extra Care Movers 的公司,他们只需要十分之一的费用。这家看起来有些乱七八糟的公司将低成本的理念发挥到极致。老板曾在街上流浪,后来有了孩子,他正在试图重整旗鼓。他没有银行账户,所以 James 使用 PayPal 支付给他。
服务器上有用户数据,James 最初并没有意识到,出于隐私原因,它们在迁移前应该被彻底擦除。“当我们知道这个时候,服务器已经被拔掉并推出去,所以我们不可能再推回去,插入,然后再擦除,” 他说。此外,擦除软件也不能工作。“靠,我们怎么办?” 他问。伊隆建议他们锁住卡车并进行追踪。
所以 James 派人到家得宝买了一些大的挂锁,他们将组合代码发送到波特兰,以便卡车可以在那里被打开。“我简直不敢相信它起作用了,”James 说。“他们都安全地到达了波特兰。”
到这周结束时,他们已经使用了萨克拉门托所有可用的卡车。尽管该地区受到了雨的袭击,他们在三天内移动了 700 多个机架。该设施之前的记录是一个月移动 30 台。这仍然留下了大量的服务器在设施中,但这群人已经证明了它们可以被快速移动。其余的部分在 1 月份由 X 公司的基础设施团队处理。
这一切听起来都很激动人心和鼓舞人心,对吧?这是马斯克大胆和有创意的方法的一个例子!但与所有关于马斯克的事情一样,这也并非那么简单。这也是他鲁莽、对反驳的不耐烦和他恐吓人们的一个例子。一个星期前,X 公司的基础设施工程师在那次令人头疼的会议中试图解释为什么快速关闭萨克拉门托中心会有问题,但他打断了他们。他在忽略否定者时有很好的记录。但并不完美。
在接下来的两个月里,X 公司不稳定。服务器的缺乏导致了多次系统崩溃,包括当马斯克为总统候选人 Ron DeSantis 主持 Twitter Spaces 时。到 2023 年 3 月,马斯克会承认:“回头看,整个萨克拉门托的关停是一个错误。有人告诉我我们的数据中心有冗余。我不知道的是,我们有 70,000 个硬编码的引用指向萨克拉门托。由此导致的问题至今仍然存在。”
在 Tesla 和 SpaceX,他最有价值的助手已经学会了如何避开他的坏主意,并给他逐渐透露不受欢迎的信息,但 X 公司的老员工不知道该怎么处理他。也就是说,X 公司还活着。萨克拉门托的事件向 X 公司的员工展示了,当他谈到需要狂热的紧迫感时,他是认真的。
不要走开,文末评论好精彩
来源:https://weibo.com/1727858283/NkRTyymTQ
一大波网友评论来袭
马斯克硬核迁移服务器,运维同仁您怎么看?期待您的留言与评论哦~
10月26-27日,GOPS 全球运维大会 2023 · 上海站,来自腾讯、阿里、字节、农行、交行、申万宏源等 80+ 大咖齐聚 GOPS,点击阅读原文,了解完整日程~
好文推荐:
提升工作效率!如何巧用 Ansible 实现自动化运维?
“高效运维”公众号诚邀广大技术人员投稿
投稿邮箱:jiachen@greatops.net,或添加联系人微信:greatops1118。
发表评论