EN / CN
SITE MAP
关闭
关注嘉富微信公众号
新闻中心
通用数据中心站点运营最佳实践
日期:2021-03-03 04:12:41
数据中心实践

在本文中,我们重点介绍了通用数据中心最佳实践,无论大小或位置如何,这些最佳实践都被认为对所有站点都有利。这些实践是提供高可用性服务的数十年运营经验中吸取的经验教训。

 
数据中心运营管理的总体目标是最大程度地减少服务中断的风险并最大化IT服务的可用性,同时以最低的成本最大程度地利用可用站点资源。本文重点介绍有助于实现这些目标的关键久经考验的实践。
 
通用数据中心最佳实践
IT与设施管理(FM)/机电(M&E)工程之间的有效通信与合作对于服务可靠性和可用性至关重要。让IT和设施团队接受ITL服务交付和服务管理框架的基本原则培训,是实现清晰,明确的通信所必需的一种好方法,这对于确保稳健和可靠的数据中心操作至关重要。这包括
可靠和一致的报告,并及时交付来自各个责任领域的准确信息。

清晰的沟通促进了数据中心内部的紧密工作关系,并有助于在涉及运营可靠性和一致的服务交付的不同团队之间建立明确定义的职责范围。这对于避免误解,降低风险,避免潜在的冲突以及消除危险的假设至关重要。

如果将ITIL部署在组织内部,则设施部门和工程部门应该全心全意地采用ITIL语言,概念和目标,以便积极地使用该框架将严格的要求应用于数据中心中的IT部署和管理。公司范围的ISO标准,KPI和指标也是如此。

通过使用通用语言和集成工具,ITL也可以用作实现真正集成的IT和设施管理团队的第一步。这可以统一站点操作,并消除与跨学科的误解或职责不明确相关的潜在问题。
 
数据中心资源和容量管理
对于任何数据中心运营而言,更广泛的业务必须充分理解并认可为站点选择的风险简介,这一点至关重要。了解业务风险偏好是获得利益相关者满意度和成功交付业务的重要要素。业务完全了解并定义从数据中心交付的每项服务的风险承受能力以及降低风险或接受风险的真实成本,这是关键。

必须与应用程序所有者讨论已部署的服务和设备。应用程序所有者推动了对IT服务的需求和数据中心资源的消耗。但是,在太多情况下,应用程序所有者
“忘记了”在设备不再使用或使用寿命即将结束时通知操作。与预期相反的项目或预期的需求增长通常不会传递给负责管理数据中心容量的人员。

如果没有有效和准确的资产跟踪和资源管理工具,则应执行常规的电源和热审核,以确保有效利用站点资源并且不浪费容量。如果未正确计划,新系统,升级和房间变更可能会带来意想不到的后果,因此监视和充分了解气流,温度和其他环境因素非常重要。现在可以使用结合专家知识的极其有效和直观的工具,以最大程度地减少执行此正在进行的管理工作的开销。
 
数据中心财务管理
除了上述成本控制之外,成本控制始终应是一个重要考虑因素,尤其是在提高效率以及降低功率和冷却成本方面。实现这一点的关键是维护准确的IT和机电基础设施资产登记册。(准确度为95-100%),其中还包括预计的生命周期更换计划和预计的费用。代替有效的资产跟踪工具和政策登记册,应每年至少进行两次审核,以保持准确性,并为可靠的“单一事实来源”做出贡献,不同的系统可依靠该“可靠来源”做出明智的决策,甚至在适当的情况下进行控制。

“真相的唯一来源可能基于联合数据集,该联合数据集可能涉及多个系统,包括那些收集实时信息的系统。

关键运营和资本预算应与非关键设施分开,并且不应与其他建筑物或建筑物组合并。这应该包括一个成文的流程,以确保资金水平足够并可以随时根据业务期望来支持站点基础结构。
 
数据中心有效产能利用率
数据中心的部署应符合基于预期容量利用的既定总体规划。这可能会涉及基于特定用途和设备密度模型的不同部署策略。使用智能工具来建立最佳的机柜,电缆,IT,网络和存储设备布局,可以减少这方面的工作量。这些工具还能够提供自动预配,资产和位置的准确记录以及工作单的创建,以支持和协调本地和远程预配活动。

电源和热管理的指导方针和程序应成为数据中心日常运营不可或缺的组成部分。从温度和湿度设置到新系统和电缆部署的所有要素都应遵循公认的和易于理解的准则和政策,以优化可用的电力利用率以及冷却效率,并最大程度地减少气流阻塞和冷热空气混合。

如果数据中心包含对环境和冷却要求有明显不同的设备(例如,EG磁带存储,磁带简仓,大型机,电信设备,电池等),请将该设备放置在具有单独环境控制措施的单独区域中,以免损害整个数据的冷却能力中心。
 
数据中心统筹管理
防止进行任何计划外的安装,并确保所有设备的安装仅在获得变更管理批准后再进行详细的空间计划和设备规格,然后才能完成。所有位于地板下的通道均应经过变更管理批准。工厂应参与IT变更管理计划和批准,反之亦然。这应该通过一套完整的IT和设施管理(FM)/M&E工程变更管理,事件管理,能力计划程序来完成。IT和FM/M&E工程都应包括在技术空间容量规划中,并在所有IT设备安装中签字。

从一开始,IT,FM/M&E工程和管理人员都应参与设计过程,以实现节省能源并满足可靠性,性能,成本控制和其他要求的解决方案。通过这种包容性参与建立的更广泛的团队应将生命周期成本作为主要的决策工具,IT和FM/E工程和管理人员在统一的管理结构内应具有共同的目标,目的和激励措施。
 
数据中心标准很重要
了解并介绍真正的全球标准(例如ISO/IEC30134系列和新兴的ISO/IECTS22237系列)中的概念。例如,如果正在使用或报告PUE,则所有测量和报告均应符合ISO/IEC30134-2。除了根据此全球标准化KPl的要求进行报告以外,其他任何事情都不是真正的PUE。
维护的目的是将数据中心站点保持在“新状态”。这既可以减少由于设备故障引起的运行风险,又可以确保保持较高的运行效率,从而减少电力消耗并因此降低能源成本。

有效的维护始于完整而全面的调试计划,这对于确保站点基础设施一开始就按照设计规范运行至关重要。尽可能采用预测性(基于条件)以及预防性维护。这种做法应采用趋势分析和生命周期分析,以及上面强调的定期审核。以这种方式操作既可以降低成本,又可以更有效地降低风险。