混合式集群的先决条件

在创建集群的过程中,需要在三类集群中作出选择:高可用集群HA)、高性能计算集群HPC)和高吞吐率集群HTC)。我们选择的是 HPC,这是最常用的集群,它会带来以下后果:

忽略在节点上可能发生的故障。这些故障包括电源故障、网线损坏以及其他种类的硬件相关问题,比如磁盘损坏、CPU 由于过热而被锁,以及内存损坏。

各个节点在执行主节点所提交的作业时,需要重新引导的机率较小。在这种情况下,应用程序本身或者管理员必须在特定时间内重新启动必要的应用程序或者检查点。

让我们退而考虑这个问题:“为什么我们需要植入一个集群代理?难道将基于 Linux 的应用程序移植到 Windows 不能获得更好的性能吗?”当然,随着 MinGW 或 Cygwin 等跨平台编译器的可用,这可能会很容易。

对这个问题的回答是,我们出于以下原因而更希望使用集群代理:

将软件移植到另一个平台不会像预期的那样顺利。对系统调用、时间、直接硬件访问等问题的处理会延缓实现。
混合式集群往往用作各种新应用程序的实验台,或者用作对已有集群的扩展。投入很多精力来进行移植,对计划会经常变化的环境而言不会有太多好处。

实际上,很多人使用商业或者私有软件。这种软件出售或发布时并没有附带源代码。结果是不可能进行移植。

我们提出的解决方案并不是要获得如同将其移植为本地 Windows 应用程序那样快的执行速度。不过请记住,在这个试验中,我们将尝试达到以下几个关键目标:

灵活性,当代理以较低的优先级运行,或者只有在 CPU 的空闲周期中运行时,Windows 用户才可能如往常一样工作。

性能,当运行集群代理时,执行速度应该几乎 与本地移植一样快。

效率,我们只需要像安装普通 Windows 程序一样安装集群代理的二进制程序,并让它们自动运行。

易管理,借助大规模部署软件比如 LanDesk 套件,或者微软软件管理服务器Microsoft Software Management Server),我们可以快速安装和删除代理软件包。如果需要,还有 VNC 等远程 X 客户机扩展可以简化远程管理。


相关内容

    暂无相关文章