主动/主动、主动/被动
一个有关服务在节点上如何运行的概念。主动-被动方案是指一个或多个服务在主动节点上运行,而被动节点等待主动节点出现故障。另一方面,主动-主动是指每个节点同时是主动的和被动的。
群集
一个高性能的群集是指一组共享应用程序负载以快速完成工作的计算机(真实或虚拟)。高可用性群集主要是为确保服务最高可用性而设计的。
群集分区
当一个或多个节点与群集的剩余节点之间的通讯失败时,即会发生群集分区。群集分区的节点仍是活动的且能够相互通讯,但它们无法感知不能与其通讯的节点。由于无法确认其他分区的丢失,所以开发了一种节点分裂方案(另请参见节点分裂)。
一致群集成员资格 (CCM)
CCM 确定组成群集的节点并在群集中共享此信息。任何节点或仲裁人数的新增和丢失都由 CCM 提供。群集的每个节点上都运行 CCM 模块。
群集信息库 (CIB)
整个群集配置和状态(节点成员资格、资源、约束等等)的表示。它用 XML 编写,位于内存中。主 CIB 在 DC 上保存和维护并复制到其他节点。
群集资源管理器 (CRM)
负责协调所有非本地交互的主要管理实体。群集的每个节点都有自己的 CRM,但在 DC 上运行的那一个是选为将决策传播到其他非本地 CRM 并处理其输入的 CRM。CRM 会与许多组件交互:自己的节点和其他节点上的本地资源管理器、非本地 CRM、管理命令、屏障功能及成员资格层。
指定协调器 (DC)
主
节点。在此节点上保存着 CIB 的主副本。所有其他节点都从当前 DC 获取他们的配置和资源分配信息。DC 是在成员资格更改后从群集的所有节点中选出的。
分布式复制块设备 (drbd)
DRBD 是为构建高可用性群集而设计的块设备。整个块设备通过专用网络镜像,且视作网络 RAID-1。
failover
指资源或节点在某台服务器上出现故障、受影响的资源在另一个节点上启动的情况。
屏障
描述了防止非群集成员访问共享资源的概念。通过终止(关闭)有故障
的节点以防止其引起问题、使资源远离状态不确定的节点或多种其他方式均可以达到此目的。另外,节点屏障和资源屏障是有区别的。
Heartbeat 资源代理
Heartbeat 第 1 版中广泛地使用了 Heartbeat 资源代理。第 2 版中已废弃对它们的使用,但仍然支持。Heartbeat 资源代理可以执行启动、停止和状态操作,它位于 /etc/ha.d/resource.d 或 /etc/init.d 下。有关 Heartbeat 资源代理的更多信息,请参见 http://www.linux-ha.org/HeartbeatResourceAgent。
本地资源管理器 (LRM)
本地资源管理器 (LRM) 负责对资源执行操作。它使用资源代理脚本执行工作。LRM 是哑
的,它自己无法了解任何策略。它需要 DC 告诉它做什么。
LSB 资源代理
LSB 资源代理是标准 LSB init 脚本。LSB init 脚本不仅用于高可用性环境中。任何兼容 LSB 的 Linux 系统使用 LSB init 脚本控制服务。任何 LSB 资源代理支持 start、stop、restart、status 和 force-reload 选项,并可能可选地提供 try-restart 和 reload。LSB 资源代理位于 /etc/init.d。在 http://www.linux-ha.org/LSBResourceAgent 和 http://www.linux-foundation.org/spec/refspecs/LSB_3.0.0/LSB-Core-generic/LSB-Core-generic/iniscrptact.html 可了解有关 LSB 资源代理和实际规范的更多信息。
节点
任何作为群集成员并对用户可见的计算机(真实或虚拟)。
pingd
ping 守护程序。它使用 ICMP ping 持续联系一个或多个群集外的服务器。
策略引擎 (PE)
策略引擎计算要实现 CIB 中的策略更改而需要执行的操作。此信息随后传递到事务引擎,它在群集设置中依次实施策略更改。PE 始终在 DC 上运行。
OCF 资源代理
OCF 资源代理类似于 LSB 资源代理(init 脚本)。任何 OCF 资源代理必须支持 start、stop 和 status(有时候称为 monitor)选项。另外,它支持以 XML 返回资源代理类型描述的元数据选项。它可能支持更多选项,但不是强制的。OCF 资源代理位于 /usr/lib/ocf/resource.d/提供程序。在 http://www.linux-ha.org/OCFResourceAgent 和 http://www.opencf.org/cgi-bin/viewcvs.cgi/specs/ra/resource-agent-api.txt?rev=HEAD 可了解有关 OCF 资源代理和规范草稿的更多信息。
仲裁人数
在群集中,如果群集分区具有多数节点(或投票),则它定义为具有仲裁人数(是具有仲裁人数的
)。仲裁人数准确地区分了一个分区。它是算法的组成部分,用于防止多个断开的分区或节点继续运行而导致数据和服务损坏(节点分裂)。仲裁人数是屏障的先决条件,而屏障随后确保仲裁人数确实是唯一的。
资源
Heartbeat 已知的任何类型的服务或应用程序。例如,IP 地址、文件系统或数据库。
资源代理 (RA)
资源代理 (RA) 是一种脚本,作为代理管理资源。有三种不同的资源代理:OCF(开放群集框架)资源代理、LSB 资源代理(标准 LSB init 脚本)和 Heartbeat 资源代理(Heartbeat v1 资源)。
单一故障点 (SPOF)
单一故障点 (SPOF) 是群集的任何如下的组件:如果它出现故障,则会触发整个群集的故障。
节点分裂
一种将群集节点分为两个或多个互不了解的组的方案(通过软件或硬件故障)。为防止节点分裂情况严重影响整个群集,必须靠 STONITH 来救援。也称为分区的群集
方案。
STONITH
Shoot the other node in the head(关闭其他节点)
的首字母缩写,它关闭功能不正常的节点以防止其在群集中造成故障。
事务引擎 (TE)
事务引擎 (TE) 从 PE 取得策略指令并执行它们。TE 始终在 DC 上运行。它从那里指示其他节点上的本地资源管理器应执行的操作。