以服务于中国广大创业者为己任,立志于做最好的创业网站。

标签云创业博客联系我们

导航菜单

十大短视频排名,全球短视频app排行榜前十名

  

     

  

  崩溃,崩溃,双重崩溃!   

  

  脸书(脸书)这些天,真是屋漏偏逢连夜雨。   

  

  就在前天,才刚遭遇一场信誉危机:   

  

  取而代之的是前脸书产品经理弗朗西斯豪根。   

  

  遭到公开抨击,称脸书利用算法放大互联网上的仇恨言论,散布虚假谣言,将企业利益置于安全利益之上。   

  

     

  

  现在,又出现了另一场危机:   

  

  美国时间4日中午,脸书突然倒下,如果刷新脸书页面,所有人都出不来。   

  

  而这一宕,就是 6 个小时,刷新了自 2008 年以来最长的宕机时长。   

  

  公司内部网也崩溃了。尴尬的同事们正坐在办公室里,安心钓鱼,无法工作。   

  

     

  

  停机,可能很多人不太明白是什么意思。你可以简单地理解为崩溃。   

  

     

  

  事实上,它的所有产品,包括照片社交服务Instagram,以及WhatsApp和Messenger,都已经崩溃。   

  

  这个时候,他们都因为自己的产品而无法使用。脸书首席技术官迈克斯科洛普夫此时只能去他家:推特,向广大用户道歉。   

  

     

  

  翻译:我们遇到网络问题,团队努力解决问题,尽快恢复正常。   

  

  作为世界上最大的社交软件,脸书拥有29亿的月生活。是什么概念?微信月活12亿。   

  

  无处发泄的脸书用户也在此时涌入竞争对手推特,推特成为最大赢家。   

  

     

  

  这次停机,经过6个小时的紧急抢修,下午开始恢复部分作业。   

  

  到底啥原因呢?   

  

  脸书在同一天发布了一篇解释事故的博客文章,称事故是由主干路由器的配置变化引起的。   

  

     

  

  但,这么大的事故,不会是脸书为了转移公众对丑闻的关注而制造的吧?   

  

  想想似乎还不够。这次宕机直接导致扎克伯格个人财富一夜蒸发70亿美元,脸书股价暴跌5%。   

  

  有这么受伤的士兵和钱,   

  

     

  

  话说回来,好像大型科技公司的宕机事故,这几年,就没停过。   

  

  去年12月,由于自动存储配额管理系统的故障,包括YouTube和Gmail在内的大量谷歌服务,挂了,无法使用。   

  

     

  

  这是半年内第三次大规模停机。   

  

  今年3月,由于配置变化,   

strong>微软 office 365 服务也挂了 ,

  

  

这离上一次比较严重的宕机,也就半年。

  

今年 6 月的这次,规模更大,多家受牵连。

  

由于云计算提供商 Fastly 的实时内容交付网络(CDN)出现问题, 导致亚马逊、eBay、Reddit、Target ,及多家媒体网站

  

CNN、New York Times 出现长达一个小时的瘫痪。

  

  

这些是这一两年全球科技公司的宕机事故,而我们熟知的一些国内互联网企业,也频频宕机。

  

像大家都知的 B 站,就在今年 7 月份发生大规模宕机,还牵连 A 站,豆瓣,晋江一起下水。

  

  

今年 8 月份,腾讯视频也崩了。

  

  

同月,支付宝在七夕节,因为大量用户参加七夕红包活动,页面也挂了。

  

  

仔细想想,这些知名的互联网公司,

  

不管是国内的 B 站、知乎、支付宝;还是国外的谷歌,微软,特斯拉,

  

就没哪个没崩过。

  

有句话说得好,没有崩过的互联网企业,不足以称之为互联网企业”。

  

  

这些网站和软件都是跟生活工作息息相关,一旦宕机,十分影响日常生活。

  

为啥老宕机呢?可以完全避免不?

  

其实看上面的梳理也知道,发生宕机的原因非常多,软件、硬件都有可能。

  

很多原因我们不能把控,实际上,就跟我们无法完美把握未来一样,宕机,无法避免。

  

假设现在有一个月可用率高达 99.95% 的服务器,在连续工作 5 年后,完全不发生宕机的概率,降到了(99.95%)^60=97%,

  

或者说,5 年内,至少发生一次宕机的概率只有 3%。

  

  

虽然概率看起来还挺低, 但在大型的公司中,服务器往往几万台甚至上百万,

  

比如腾讯云,此前就公布它的全网服务器数量突破 100 万台。

  

  

这样的概率再乘以几百方次方,那么发生宕机的概率基本上就是 100% 了。

  

  

想要在漫长的时间长河中,一个都不出错,基本不可能。

  

这就好像,人在河边走,哪能不湿鞋。

  

  

所以,我们也要理性看待这些宕机事故。

  

不过,以上都是听天由命下的算法, 但是我们人本身,不有主观能动性嘛 ,做好我们该做的,还是能降低下概率的,

  

比如:多排查,多维护。

  

但如果人员安排不合理,也可以拉高宕机概率。

  

  

2013 年,Facebook 数据中心运维主管 Delfina Eberly 就曾透露,

  

每个 Facebook 数据中心的运维工作人员管理了至少 20,000 台 服务器,有的甚至要管理高达 26,000 多个的系统。

  

一个人面对这么多系统,脸书工程师的压力山大啊,很容易漏掉一些漏洞。

  

  

Facebook 数据中心运维主管 Delfina Eberly

  

另外,还有些人为操作, 可将概率直接拉满。

  

在“流量至上”的互联网,一些“系统崩溃”造成的所谓的“宕机”,不排除是 人为制造来吸引公众眼球的办法。

  

  

天灾,我们无力抵抗,

  

但,尽人事,听天命,这宕机宕得,至少无愧于心。