无论有多大规模,数据中心都必须保持全天候安全运营。这要求数据中心设施管理人员定期监控数据中心关键设备的运行状态及其周围的环境状况,尤其是在没有采用DCIM系统的情况下。
独立的远程监控系统使数据中心设施管理人员可以在其移动设备上查看实时的状态更新。这些监控系统有助于确保关键IT设备的全天候操作,即使管理人员不在现场也是如此。
如果考虑以下提示,则设置监控系统和传感器可能很简单快捷。
1.选择监控系统制造商
数据中心运营商采用远程监控系统的是选择经验丰富、并且具有训练有素的支持团队的监控系统制造商,可以评估其需求。监控系统厂商将要求提供有关数据中心设施的详细信息。先进的监控系统支持从安装在智能控制设备的现有传感器中提取数据。其清单应包括UPS电源、PDU、HVAC系统、配线架(IDF)和建筑自动化系统。还可以监视功耗和能源使用情况,以便更好地管理与运行服务器相关的冷却和其他成本。
监控设备可以连接到这些IT设备上,以远程获取它们的信息。用户可以通过查看所有这些数据,并在数值超出预设范围时立即收到警报。
此外,这些监控系统可以与其他的硬接线传感器通信,并直接监视设备和环境状况。在大多数情况下,这些传感器是单独安装的。其选择的传感器取决于监视的条件以及可以连接到IT设备的数量。在通常情况下,需要选择用于监视环境温度、服务器机架的冷热区域、湿度、漏水、二氧化碳水平、电源波动以及物理安全漏洞的传感器。对于HVAC的监控,还要采用监测振动、气流和压差的传感器。
数据中心运营商需要确保考虑数据中心设施当前运营状况和未来的增长。然后,监控系统制造商将确定适合其操作的系统类型、所需的IT设备数量以及所需的传感器类型。
通常无需进行现场访问即可确定适合应用的产品。如果认为需要检查数据中心设施,许多公司可以设置视频会议或FaceTime聊天软件进行现场检查。或者制造商推荐当地承包商进行检查。
在整个销售过程中,不应收取演示、咨询或帮助的费用。但是务必询问购买之后继续使用设备是否需要任何费用或许可证,此外一定要了解硬接线、编程、软件设置和集成要求。
2.配置与安装
在通常情况下,监控系统易于安装,用户通常可以在不需要外部帮助的情况下进行设置。然而,当与建筑自动化系统(BAS)连接时,其安装可能更复杂,因此可能需要电气承包商的帮助,这取决于所监控的条件。在需要帮助安装监控系统的情况下,询问制造商是否提供安装服务,或者他们是否可以推荐所在地区的当地服务商。
IT设备的物理安装通常仅需要四个步骤:将设备放置在1U服务器机架中,接入电源,将其连接到互联网,以及对设备或传感器进行连接和编程。
外部传感器通过直接连接或跳线连接到IT设备。某些监控系统使用现有的RJ45以太网跳线,并且与IT设备的大距离为300英尺。如果需要将电线穿过墙壁或天花板,则可能需要电工安装。
数据中心运营商可能在监控系统制造商设计的传感器中选择,这些传感器专门用于监视系统或第三方制造的通用组件。例如,某些监控单元可以与大多数数字或模拟传感器和变送器连接,而与品牌无关。如果组件不是由系统制造商制造的,则将要查找它们是否已在所选的显示器上进行测试,以及是否需要与其他供应商合作以购买部件。
插入设备并连接传感器后,通常必须在关联的网站上创建一个帐户才能开始使用该系统。
3.连通性
大多数远程监控系统需要全球互联网或Wi-Fi连接,并接入电源。其编程是通过网站完成的,因此使用计算机或平板电脑进行初始设置是容易的。
通过这些系统,当传感器读数超出预设参数范围时,指定人员会立即通过电话、短信、电子邮件或SNMP通知。如果不希望所有人员同时收到通知,则可以对某些设备进行编程,以分层方式或按计划发送警报。
多种通信方式(例如电话、电子邮件和短信)可确保相关人员收到警报。检查监控系统可以联系的人数,以及系统是否自动循环浏览联系人的列表,直到有人响应为止。某些系统允许采用灵活的计划,因此下班的工作人员不会收到这样的警报。
4.有限与无线
无线在与监控相关的过程中有两个不同的含义:监控系统如何将其数据与外部世界通信,以及传感器如何与系统通信。
有些监控系统需要采用全球互联网或Wi-Fi连接才能将数据传输给用户,但是如果不是这样,则可以使用蜂窝系统。也可以使用基于固定电话的系统。
通常情况下,外部传感器通过将其连接到监视设备的电线与IT设备进行通信,或者通过与IT设备进行通信的内置无线电发送器进行无线通信。在做出决定之前,需要询问无线传感器的任何限制和可靠性。
5.数据记录
数据记录器是以设定的时间间隔记录传感器数据的一种电子设备。使用数据记录器自动记录信息、识别设备性能和环境条件的趋势。这些数据可以提供对潜在问题的洞察,比如温度或电源波动,因此可以在它们成为更大的问题之前加以解决。
许多远程监控系统具有数据记录功能,并存储无限量的信息,可以通过网站或应用程序实时查看这些信息。
6.紧急备份
一个安全的选择是采用带有内置备用电池的监控系统,在发生电源故障时可以持续几个小时。许多远程监控系统将自动监控其所在电路的电源故障。如果他们不提供该功能,应该能够监测指定的电源故障传感器。如果停电或员工意外切断电源,该系统会发出警报,并指示已经断电。如果设备正在使用全球互联网连接,则需要保持网络连接以接收警报。有些设备具有内置冗余,例如电话线或与基于云计算的系统的连接。在这两种情况下,用户都会通过电话、短信或电子邮件收到中断的警报。在此期间收集的所有数据将存储在设备中,并在电源恢复时可用。
如果选择基于云计算的监视系统,需要确保由制造商的团队全天候监视用于创建云平台的基础设施。询问他们是否在多地拥有多个备份,以确保系统永不停机。
务必注意,监视系统的制造商并不是紧急呼叫中心。可以对监控系统进行编程,以在紧急情况下通知相应的人员。此时,数据中心运营商的员工应采取行动。
7.额外费用
许多基于Web或者云计算的系统都提供具有某些限制的免费功能。可能需要订阅才能解锁功能,例如短信、电话警报和无限制的数据记录访问权限。
8.技术支持
数据中心运营商需要从信誉良好的制造商处购买监控系统,该制造商提供保修并提供**的维修服务。另外,需要研究以确保其技术支持团队愿意解决有关监控系统的任何问题。技术支持专家通常可以通过电话诊断和纠正设备设置和编程问题。
这有助于记录对问题的观察,因此技术团队可以了解有关问题的发展趋势和情况,并更好地诊断问题。在理想情况下,如果故障设备需要返家进行维修,则设备制造商可以借用相同的设备。