跳动探索网

服务器需要维护

导读 首先来说,服务器本身也是属于耗材,长时间的运行、设备升级更换、系统升级等情况下,是需要停机维护的。现实中,我们很少看见淘宝网、腾讯...

首先来说,服务器本身也是属于耗材,长时间的运行、设备升级更换、系统升级等情况下,是需要停机维护的。

现实中,我们很少看见淘宝网、腾讯等这些大型互联网站打不开的情况,很多人就心生疑问,它们的服务器都不需要维护吗?其实是需要维护的。

这样说吧,淘宝网服务器很多,没人知道其具体数字。但从网络上的资料来看,淘宝宣称双11当天每小时扩容10W台服务器,足见其服务器规模的庞大了。

这么多的服务器,它们会以集群的形式来部署,同时淘宝网也是分布式的。假设它有10台服务器,当其中一部分需要维护升级时,可以直接停机维护,对于整个集群而言就是少了一个节点而以,还有其余9个节点可以为用户提供服务。所以对于用户而言,是没有感知的!

集群有很多优点,其中之一就是高可用性。像淘宝网这类的网站都是声称全年可用率达99.9%以上,加上其后端服务器规模的庞大,一部分服务器节点需要停机时,对整体网站的稳定性不会产生影响。


“极客谈科技”,全新视角、全新思路,伴你遨游神奇的科技世界。

任何时间都可以登录淘宝网站与淘宝服务器维护之间并不存在任何冲突。

服务器无论是从硬件的扩容、例行的维护检查、损坏硬件设备的更换等方面均需要进行维护。根据服务器运行等级的不同,维护的级别也就不同。重要领域的服务器维护并不允许中断其业务,例如金融系统服务器的维护,往往中断一次需要向省级管理机构进行申请。淘宝服务器的维护同样如此,并不会轻易允许中断用户的访问。

那么,一起来看看淘宝服务器究竟是如何实现访问无干扰前提下的维护吧!

淘宝的服务器维护如何避免业务中断

一、淘宝服务器搭建的框架基础

淘宝的阿里云作为国内最大的云服务器厂商,自家产品的服务器怎能落下。淘宝依靠大量的服务器集群构建的云服务器,系统并不单单依靠一台服务器,而是整个服务器所建立起来的虚拟云空间。服务器集群的部分硬件维护并不会影响其业务网站的正常访问,只是性能有所下降而已,后面将会谈到该问题。

二、淘宝服务器的冗余备份

无论是网络、服务器设备的冗余备份很重要。对于阿里巴巴来说同样如此,冗余备份并非指的是双服务器备份这么简单,级别较高的需要使用异地备份。也就是说,在不同的地市、不同的数据机房均会建立淘宝的云服务器。这样可以避免突发情况,导致的业务不可恢复的问题。淘宝涉及用户量较大,不仅仅是服务器维护的问题,用户数据的安全性同等重要。

即便局部城市服务器中断维护,对其网站的正常访问也不会造成影响。

三、淘宝服务器的维护时间段

前面两点已经提到,服务器的正常维护并不会影响网站的正常访问,但是会导致访问时服务器处理性能的下降。这点很容易理解,毕竟接入的服务器数量降低,计算能力有所下降。这与双十一用户激增,服务运行缓慢是一个道理。那么,服务器维护时间的选择就较为重要。一般是选择用户访问量较小的时间段进行维护,通常是凌晨。

如果涉及的维护工作较为复杂,影响范围较广,通常会发布服务器维护的公告。

关于淘宝服务器维护却不会中断用户业务的事情,您怎么看?

欢迎大家留言讨论,喜欢的点点关注。


1.淘宝有几十万台服务器,就好像人有好多细胞一样,其他细胞的死亡不会影响人类的生命。

2.淘宝的服务器是集群的,都由中央主机来控制。就好像一张大网,如果有哪一个网格开线了,只要修补一下,是不影响正常服务的。

3.一般正常点的服务器会做到数据硬盘red0,就是说一个数据盘坏了,另外一个盘立马顶上,服务还可以进行,当然那个坏盘会在最快的时间报警工作人员会替换下来,而这个硬盘会直接粉碎,以防数据泄露,但阿里的服务器数据盘肯定在red0以上,有好几个数据组硬盘,一组坏了另外一组可以顶上。

4.有人说了,那如果一台主要服务器瘫痪了,就算硬盘没坏也停止服务了,理论上是这样的,但是服务器也可以增加备份机,行话叫做双机热备,意思就是说,两台甚至两台以上的服务器,同步储存一个内容,一样的设置,如果其中一台服务器在服务淘宝用户账户数据管理的时候主板烧了,另外一台会自动跳转到另外一台备份服务器上,因为两台服务器都是相同的内容,所以就可以正常服务了,那台坏的,维修好了,直接插到双机热备组里数据同步,所以你不会感觉到淘宝出问题的,就好像打仗一样,前边的士兵倒了,后排的士兵补上。

5.综上所述,数据盘多组备份加上服务器多组联合预备服务,就算一半服务器出现另外一半服务器都会顶上,维护只是把备份的机器拆下来维护,所以你感觉不到,两台服务器那台在用哪台就是服务器,另外一台就是备用同步,一台坏掉,备用服务器就自动成为主服务器。


    2019年的双11已经过去,成交额达到了2684亿。很多人可能会有这样的想法“淘宝网难道不停机维护吗?为什么任何时间都可以登陆淘宝呢?”下文具体说一说。

    服务器需要维护

    淘宝网的服务器很多,没人知道具体的数字,从网上的资料来看,淘宝网声称双11当天,每小时扩容10W台服务器,足见其服务器规模的庞大了。

    对网络、服务器等设备来说,冗余很重要。对于阿里巴巴等这些大型互联网公司来说,冗余备份并非是双服务器那么简单,而是需要异地备份。也就是说不同城市、不同的数据机房都会有淘宝的云服务器,避免突发情况。

    可以说,淘宝的服务器分布再全国各地,某个地区的网络中断或者电力中断,可以马上跳转到别的机房,不会影响其业务,因为有异地备份。在保证正常使用的同时,如果需要维护了,只需要停止一部分服务器就行了,然后进行分批次维护。

    安全性保证

    除了考虑服务器的维护问题外,还需要有安全保障。

    大型互联网公司的服务器,采用了集群的运行方式,某个节点宕机或者停机维护都不会影响到业务的正常运行。服务器放在机房里,服务器运行需要网络的电力的支持,网络方面接入了电信、联通、移动的骨干网,电力除了正常的工业用电外,还有UPS、发电机等设备,保证设备的正常运行。

    总之,淘宝等这些互联网公司的服务器需要维护,由于服务器数量众多,采用了集群的工作方式。维护时,只需要停止一部分服务器就行了,然后进行分批维护。

如果觉得对你有帮助,可以多多点赞哦,也可以随手点个关注哦,谢谢。


人可以两班倒,服务器当然也可以啊……那些升级维护需要停机的,只有一个原因,就是穷


感谢您的阅读!

2019年天猫双11,每秒订单峰值54.4万笔,这么庞大的数据流量,阿里巴巴核心系统100%上云,它抗住了。下图似乎更能证明,阿里巴巴在服务器方面的优势。

从2009年,400笔/秒,到2019年,54.4万笔/秒,可以说阿里巴巴十年的进步。其实,我们现在可以慢慢回答这个问题,淘宝需要维护服务器吗?

了解第一个词:服务器集群。

所谓的服务器集群,指的是众多服务器集中起来一起进行同一种服务,因此它们能够在一起提供更好,更高的计算速度,从而带来系统的运行正常。

而服务器集群最大的好处是,能够在某一台服务器进行故障的时候,集群也在工作,并且接管共享磁盘柜上的数据区,进而使应用重新正常运转,它可以平衡服务器负荷、卸载服务器,从而让我们更好的进行维护。

而且一般维护服务器的时候,时间段选择也很重要,自然不会选择流量巨大的高峰期,比如双十一等等,一般选择在凌晨,流量比较少的时间段。

了解第二个词:公共云

在2019年3月21日,2019阿里云峰会·北京站上,阿里云表示,整个阿里经济体正在All In Cloud,成为“云上的阿里巴巴”!

可以说,公共云已经成为了阿里巴巴的核心,即使在2018年,还是在使用神龙服务器,在2019年,大约9月份左右,阿里巴巴就将数以万计的物理服务器转移到云端,而如今阿里巴巴是将首个交易核心放在了云上,这就为未来的服务器的维护以及应对像双11这样大流量奠定了基础,阿里云已经有能力,应对复杂的流量激增等问题。


这只是一个简单的技术…一般服务器如果不遇到特殊问题是会一直处于运行状态的,而如果出现了问题或者有了新功能的话我们需要停机部署服务。这个时候就会出现一个时间空挡。像我们公司用的nginx做负载均衡,只需要有两台服务器就可以保证在一台服务器部署或者宕机情况下把所有用户请求转发到另一台服务器,更别说阿里这样的大企业了


我的工作就是做电子商务系统维护,我来回答一下这个问题。任何服务器都需要维护,但是可以做到在用户无感知的状态下进行维护。

诸如银行网银、电子商务等涉及到互联网服务的项目现在都能够做到7*24小时提供服务。实现这个目标主要依靠以下几个方面:

服务器集群

我们在客户端(网页浏览器或者手机app)进行浏览时访问的不仅仅只有一个服务器,小的网站3、5台,大型的如淘宝估计就有数不清的服务器了,每一个向客户端提供的服务都由多台服务器同时提供,如果其中一个服务器宕机了,则用户会自动访问到其他的服务器上,而且所有的服务器都分布在不同的机房里面,即便是某个机房断电断网了,也可以保证其他机房能够持续的提供服务,保证了后台服务的高可用。

分布式服务架构

分布式服务指的是一个系统的所有服务并不一定由一台服务器或者一个程序完全提供,我们可以根据职责的不同将服务进行归类划分(比如把需要高度运算的服务放在一起,把需要访问数据层的服务放在一起),也可以按服务功能的不同将服务进行归类划分(比如把用户中心独立成为服务,把订单独立成为服务)。分布式服务架构对于系统稳定性的好处就在于倘若部分服务出现异常情况也不会影响到系统其他职责的服务(比如订单服务挂了,但是我们仍然可以正常访问用户中心)。

运维工程师

无论是服务器集群也好,分布式服务架构也好,总归是要有人去维护和管理。目前再高度自动化的运维依然需要人为介入,这就是运维工程师的职责。

综上所述,我们的运维工程师可以采取分批维护、升级、重启部分服务器的方式,对系统进行用户无感知的维护。

我是程序员爱编程,一个资深非专业码农,科技领域段子手!如本回答能够讨得您的欢心,劳请点赞、转发、关注我,如有不同看法可以在评论区留言,谢谢!


阿里的技术在国内也算是数一数二的了,所以我们任何时候都可以登录淘宝,但淘宝的服务器也是需要维护的,只不过我们只是站在使用者的角度去访问淘宝服务器,而后端服务方面却处理的毫无痕迹,而用户是根本感知不到它在何时做了维护。

记得有一次演讲中介绍到,现在阿里可以做到仅用一秒钟即可完服务器迁移,而且因为阿里拥有大量的服务器集群,可以分别在不同的时间段维护不同的服务器,这也不会影响到用户的正常访问。所以,作为用户来说,看到的结果就是任何时候都能访问淘宝。

所谓的服务器集群,简单来说就是大量的服务器一起工作。用户通过一个网址访问的时候,即使是某一个服务器挂掉了也不会影响到你的访问,会有其他的服务器提供服务,从而保证用户可以正常登陆访问。就好比一个人穿衣服一样,虽然穿在身上的只有一套,但肯定会有多套衣服存在的。如果不小心把衣服弄脏了、烂了,可以立即去换一套穿着出门。

关于服务器维护的时间问题,这里也是有学问的。尽管阿里有大量的服务器集群,但阿里的网站访问量也是非常之大的。在大数据方面,阿里是做的非常好的。各种数据都会有专门的数据报表,自然知道在什么时间段用户的访问量是比较少的,所以,可以在访问量较低的时候对服务器进行维护。

当然,也并不是说不会有大规模的服务器维护的情况出现。因为阿里服务器上面所承载的服务太多了,比如淘宝、支付宝还有更多其他应用,不管是应用还是每个应用的功能,其实也都是独立的。一般出现大规模需要服务器维护的话,也是针对负责某一应用的某个功能的服务器做大规模维护。一般出现这种情况的话就属于比较大维护,所以也都会提前有公告发出来,会指定说在什么时间段要做维护。

不过随着技术的不断升级,像阿里这类财大气粗的公司,基本可以实现永不宕机,给用户造成的就是阿里服务器不需要“维护”的假象。


服务器集群,即使有服务器挂了,备用服务器能立马跑起来,实现24小时无间断允许,怕就怕光缆给人挖了