`
baalwolf
  • 浏览: 344197 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

[Linux]负载均衡 LVS 工作原理

 
阅读更多


一.LVS主从工作原理和网站架构
      LVS在基本的生产环境中,都会同时运行在二台硬件相近的服务器上:LVS Router(主 LVS ),一个作为备份LVS(备份 LVS )。
      主 LVS 服务器在网站的前端起二个作用:
            (1. 均衡负载压力到真实服务器(如apache)上.
            (2. 检查后面真实服务器提供的服务是否正常.
     备份LVS 用来监控主LVS和备份主服务器,在当故障出现时主LVS 死机 fail 掉了以后,就会启动自己来接管主 LVS 的工作。
基中有一个叫 Pulse (心跳服务) 运行在主LVS和备份LVS上。在备份 LVS 上,每秒 pulse 发送一个心跳(heartbeat)到主LVS的外网接口检查主LVS的服务是否正常。当然在主LVS上,也有pulse服务,它主要是响应备份LVS的心跳。
      LVS进程调用 ipvsadm工具(RedHat开发)去配置和维护 IPVS 路由表,它会为每一个在真实服务器上的虚拟服务启动一个nanny进程。每一个nanny进程去检查真实服务器上的服务状态,如果有异常.就会将故障情况通知LVS进程。当故障时,LVS进程通知 ipvsadm 在 IPVS 路由表中将此节点删除。当然,它发现故障的机器恢复时也能自动的加入到服务中来.

     如果备份LVS未收到来自于主LVS的响应,它将调用send_arp将虚拟IP地址再分配到备份LVS的公网接口上。并在公网接口和局域网接口上分别发送一个命令去关掉主LVS上的LVS进程。同时启动自己的LVS进程来调度客户端请求。

下面是一个大中型网站 LVS 架构的服务器:




象平时在大中型网站的服务器架构,基本就象上面一样.上面是一个服务器组提供同一种服务,如image的服务.

如上所示,最前面是一组主备LVS服务器,他们由心跳联系在一起 .接下来是一组功能相同的Real server服务器.有可能是Apache,nginx, squid之类的服务器.在接下来是一组应用服务器,应用服务器用的 Redhat Cluster 组成.最后,给所有的网站将数据放到一个网络文件系统NFS AND 分布文件系统GFS上做Shared Storage,用来提供所有的Real Server同时读写。当然,你也可以用SAN的存储服务器.

二. IP 负载均衡技术
在LVS上调度器的实现技术中,由VS/NAT、VS/TUN和VS/DR这三种方法来实现使用负载均衡. IP 负载均衡技术是效率最高的。在已有的 IP 负载均衡技术中有通过网络地址转换(Network Address Translation)将一组服务器构成一个高性能的、高可用的虚拟服务器,我们称之为VS/NAT技术(Virtual Server via Network Address Translation),大多数商品化的IP负载均衡调度器产品都是使用此方法,如 Cisco 的 LocalDirector、F5 的 Big/IP 和 Alteon的ACEDirector。当然在分析 VS/NAT 的缺点和网络服务的非对称性的基础上,LVS 的作者提出通过 IP 隧道实现虚拟服务器的方法 VS/TUN (Virtual Server via IP Tunneling),和通过直接路由实现虚拟服务器的方法 VS/DR(Virtual Server via Direct Routing),它们可以极大地提高系统的伸缩性。

下面分别来介绍一下这三种方法.

1. 使用VS/NAT方法

客户通过Virtual IP Address(虚拟服务的IP地址)访问网络服务时,请求报文到达调度器,调度器根据连接调度算法(下面会提到)从一组真实服务器中选出一台服务器,将报文的目标地址 Virtual IP Address 改写成选定服务器的地址,报文的目标端口改写成选定服务器的相应端口,最后将修改后的报文发送给选出的服务器。同时,调度器在连接 Hash 表中记录这个连接,当这个连接的下一个报文到达时,从连接Hash表中可以得到原选定服务器的地址和端口,进行同样的改写操作,并将报文传给原选定的服务 器。当来自真实服务器的响应报文经过调度器时,调度器将报文的源地址和源端口改为Virtual IP Address和相应的端口,再把报文发给用户。
当使用VS/NAT方法时,如果有大量的响应数据经过调度器,调度器将成为整个集群的瓶颈。
这个很象 Nginx 的 7 层调度,所以大约能支持的后端机器只有 10 台的样子。因为这台调度器就成了瓶颈。



2. 使用VS/TUN方法

VS/TUN 的连接调度和管理与 VS/NAT 中的一样,只是它的报文转发方法不同。调度器根据各个服务器的负载情况,动态地选择一 台服务器,将请求报文封装在另一个IP报文中,再将封装后的IP报文转发给选出的服务器;服务器收到报文后,先将报文解封获得原来目标地址为VIP的报 文,服务器发现VIP地址被配置在本地的IP隧道设备上,所以就处理这个请求,然后根据路由表将响应报文直接返回给客户。



3. 使用VS/DR方法
调度器和服务器组都必须在物理上有一个网卡通过不分断的局域网相连,如通过交换机或者高速的HUB相连。VIP地址为调度器和服务器 组共享,调度器配置的VIP地址是对外可见的,用于接收虚拟服务的请求报文;所有的服务器把VIP地址配置在各自的Non-ARP网络设备上,它对外面是 不可见的,只是用于处理目标地址为VIP的网络请求。在VS/DR中,调度器根据各个服务器的负载情况,动态地选择一台服务器,不修改也不封装IP报文, 而是将数据帧的MAC地址改为选出服务器的MAC地址,再将修改后的数据帧在与服务器组的局域网上发送。因为数据帧的MAC地址是选出的服务器,所以服务 器肯定可以收到这个数据帧,从中可以获得该IP报文。当服务器发现报文的目标地址VIP是在本地的网络设备上,服务器处理这个报文,然后根据路由表将响应 报文直接返回给客户。

VS/TUN相比,这种方法没有IP隧道的开销,但是要求负载调度器与实际服务器都有一块网卡连在同一物理网段上,服务器网络设备(或者设备别名)不作ARP响应,或者能将报文重定向(Redirect)到本地的Socket端口上.

三.负载调度算法
针对不同的网络服务需求和服务器配置,IPVS调度器实现了如下八种负载调度算法:

1. 轮调(Round Robin)
   调度器通过"轮叫"调度算法将外部请求按顺序轮流分配到集群中的真实服务器上,它均等地对待每一台服务器,而不管服务器上实际的连接数和系统负载。
2.加权轮叫(Weighted Round Robin)
调度器通过"加权轮叫"调度算法根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器处理更多的访问流量。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。 3.最少链接(Least Connections)
调度器通过"最少连接"调度算法动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能,采用"最小连接"调度算法可以较好地均衡负载。
4.加权最少链接(Weighted Least Connections)
在集群系统中的服务器性能差异较大的情况下,调度器采用"加权最少链接"调度算法优化负载均衡性能,具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。
5.基于局部性的最少链接(Locality-Based Least Connections)
"基于局部性的最少链接" 调度算法是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则用"最少链接"的原则选出一个可用的服务器,将请求发送到该服务器。
6.带复制的基于局部性最少链接(Locality-Based Least Connections with Replication)
"带复制的基于局部性最少链接"调度算法也是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。它与LBLC算法的不同之处是它要维护从一个目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务器组,按"最小连接"原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器,若服务器超载;则按"最小连接"原则从这个集群中选出一台服务器,将该服务器加入到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的程度。 7.目标地址散列(Destination Hashing)
"目标地址散列"调度算法根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。
8.源地址散列(Source Hashing)
"源地址散列"调度算法根据请求的源IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。

总结
根据上面的分析,我们知道,在lvs中有VS/NAT、VS/TUN和VS/DR这三种方法来实现使用负载均衡,和8种调度的算法.下面我来针对不同的服务的实现方法如你是使用Web服务一般采用普通IP负载均衡技术,流媒体服务使用IPVS负载调度器一般使用直接路由方法(即VS/DR方法),对 Cache服务如CDN之类技术的应用中一般使用IP隧道方法(即VS/TUN方法).
分享到:
评论

相关推荐

    linux负载均衡lvs原理详细讲解什么是lvs负载均衡技术

    均衡负载压力到真实服务器(如apache)上.(2.检查后面真实服务器提供的服务是否正常.备份LVS用来监控主LVS和备份主服务器,在当故障出现时主LVS死机fail掉了以后,就会启动自己来接管主LVS的工作。基中有一个叫Pulse...

    LVS集群系统网络核心原理分析(系统管理) .doc

    摘要本文主要介绍了LVS系统采用2.4内核的NetFilter的功能实现负载均衡的基本原理和技术手段 主要介绍了3个比较重要的NetFilter钩子函数,最后描述了LVS的平衡算法 (2002 07 3***:30:20)By iamafanInternet的快速增长...

    LVS Keepalived 详细中文原理构建LINUX HA服务配置手册

    服务器集群间的负载均衡 15  小结 16 IP负载均衡技术 16 通过NAT实现虚拟服务器(VS/NAT) 17 通过IP隧道实现虚拟服务器(VS/TUN) 19 通过直接路由实现虚拟服务器(VS/DR) 22 三种方法的优缺点比较 24 ...

    linux搭建lvs虚拟vip实现nginx高可用

    通过linux安装nginx,通过lvs+keeplived实现nginx负载均衡高可用,实现企业级7*24 软件高可用方案。 里面有文档,nginx安装步骤原理图,有图有真相不会你找我

    分布式集群、PB级别网站性能优化

    LVS调度策略及负载均衡原理深入 LVS深入及NAT集群调试 Nginx反向代理实战 Nginx实战进阶 Nginx动静分离URL转发实战 NFS共享文件系统实战 动态内容静态化加速实战 memcached缓存安装配置 memcached缓存编程实战 mysql...

    LVS 三种工作模式原理、以及优缺点比较1

    LVS 三种作模式原理、以及优缺点原地址:http://9ilinux.com/149.html原理:就是把客户端发来的数据包的IP头的的地址,在负载均衡器上换

    linux集群应用实战

    通过测试了解lvs负载均衡集群的工作机制和切换原理 启动LVS高可用集群服务 keepalived高可用性功能测试 测试lvs+keepalived的负载均衡集群功能 测试lvs+keepalived的故障透明转移功能 第23讲 drbd+mysql+heartbeat+...

    LINUX集群文库(多份PDF)

    LINUX集群文库 HP集群技术MC-ServiceGuard的应用 Linux机群系统并行程序调试器的设计与实现 ...Linux下的负载均衡集群LVS实现分析与测试 分布式网络环境下的负载平衡原理及算法 基于Linux 的PC 集群 。。。

    072801LB集群LVS原理应用1

    072801LB集群LVS原理应用1

    领悟云应用、云平台、云架构体系相关必备资料

    结合目前现有云体系所涉及一系列可能的...2.PaaS-lvs虚拟系统资料:LINUX集群LVS负载均衡配置.pdf、LVS基本原理和配置课件.ppt、Linux网络编程.pdf等等 3.SaaS-应用层系统资料:数据库集群技术.doc、网络负载平衡.txt

    论文研究-一种基于cookie会话保持的LVS集群系统.pdf

    实验结果表明, 改进的基于cookie会话保持的IPVS负载均衡集群系统能有效地解决高速代理上网环境中存在的会话失效和负载不均衡的问题, 同时在相同的并发用户量的情况下响应时间更短、吞吐率更高, 特别是在高并发情况下...

    集群好书《高性能Linux服务器构建实战》 试读章节下载

    11.2 高可用 LVS负载均衡集群体系结构 11.3 高可用性软件Heartbeat与Keepalived 11.3.1 开源HA软件Heartbeat的介绍 11.3.2 安装heartbeat 11.3.3 开源HA软件Keepalived的介绍 11.3.4 安装Keepalived ...

    LVS 生产环境架构详解1

    1.1 作原理 1.2 调度模式 1.2.3 内负载均衡 1.4 会话保持 1.5 7 2.1 并旁挂 2.2 串路由 3.1 主播模式 3.2 集群模式 3.

    lvs+keepalived 详细教程 HA

    详细讲解lvs和keepalived原理,详细实战,详细的讲解配置项内容和各种模式的配置方法

    高性能Linux服务器构建实战:运维监控、性能调优与集群应用

    集群高级应用篇是前面内容的综合,也是本书的核心,主要讲述了如何通过LVS+heartbeat、piranha、LVS+Keepalived来构建高可用的负载均衡集群,其次讲解了红帽集群套件RHCS的配置、管理、维护和监控,然后讲解了Oracle...

    百度、京东、阿里巴巴大牛力荐 Linux企业运维实战

    主要内容包括最新版Linux系统安装的完整过程、系统启动原理、系统必备的命令、系统管理、初学者必备软件管理、基础服务实战、生产环境LAMP.Redis实战及备份、性能优化、Zabbix企业级分布式监控、Nginx高性能Web...

    基于 Linux的集群系统建设与研究

    分析了LVS总体架构,IPVS软件的工作原理,说明了构建web服务的可行性;然后从硬件和软件配置方面设计集群系统,将4台PC机通过100 mbps的交换机连接建立集群,操作系统为Red Hat Linux 9,并采用了基于网络地址转换...

    一种新的处理能力优先的权值分配调度算法 (2011年)

    针对加权最小连接数算法中服务节点权值不准确而直接影响负载均衡效率和整个集群系统性能的问题,提出一种新的改进算法处理能力优先的权值分配调度算法.给出了改进算法的工作流程和要点,分析并设计了算法的主要技术、...

Global site tag (gtag.js) - Google Analytics