作者:新天域互联
对大家而言,人工智能不再只是一个未来概念,它正迅速、成功地部署在无数行业中,以优化业务的不同方面。而伴随着AI技术的不断普及,越来越多地企业将他们的网络和计算需求转移到云端,以及从智能手机到机器人的联网智能设备激增,整个计算行业对数据中心资源的需求呈指数级增长,这对于作为存储人工智能所需数据的数据中心是个不小的挑战,特别是已经在高容量工作的数据中心设备。这迫使数据中心不得不添加更多的服务器和硬件,这些服务器和硬件的管理变得越来越复杂,能源消耗成为了数据中心最急待解决的问题。
就在前不久,亦庄某地区数据中心的柴油发电机起火,北京也有几家数据中心因使用柴油发电机发电导致起火。其主要原因是数据中心忽略了政府“限电令”的颁布,数据中心原本以为使用柴油发电机发电已经足够给予服务器的用电,导致起火事故的相继发生,数据中心无法运营更多的服务器和硬件,只能用过柴油发电机发电,不仅仅增大了能源消耗,还将数据中心危险指数升级。
面对AI技术的加入对数据中心有了更高的设施要求,许多公司已经开始致力于消减数据中心的碳足迹的电力解决方案中。前不久,微软进行了一个大胆而又疯狂的实验,利用潜艇技术,并与海洋能开拓者合作,建立了一个水下数据中心,目前正在试运行阶段。一旦运行成功,就可以轻松实现在很短的距离内将数据传输到沿海城市,让人们享受到快速流畅的上网、视频直播、游戏以及其他基于人工智能技术的体验的同时,减少对碳能源的消耗,解决了数据中心用电困难局面,并减少了数据中心的安全风险指数,可谓是一举数得。
人工智能来袭,实现能源实时监控
很多数据中心尝试使用人工智能,那么数据的获取就显得极为重要,但这个获得数据的过程却并不简单。在过去的十多年时间里,数据中心IT专业人员习惯于设备监控和实时警报,但由于数据中心连接着用于供电和散热的不同设备,数据的计量的标准化变得让人难以捉摸。
机器学习计算的基准要求是来自数据中心主要组件的实时数据,其中包括了冷水机组,冷却塔,空气处理机,风机等,也包括了服务器利用率,温度和功耗等指标。机器学习对这些设备及其环境数据产生的数据进行实时分析,详细了解其性能和容量,并确定适当的响应。随着数据中心条件的不断变化,机器学习系统开始从变化中分析,不依靠特定的编程指令来执行其任务,具有极强的灵活性。
目前,数据中心设施内部越来越多的传感器正在从设备收集数据,其中包括备用电源(UPS),配电设备,开关设备和冷却器等。与此同时,越来越多的企业也开始采用高级分析和机器学习来深度监控数据中心能源使用情况。
自动化避免故障发生
机器学习对于数据中心而言并不陌生,很长一段时间,当我们还在试图根据容量和需求改善机器正确尺寸的散热时,机器学习就能够快速帮我们做到这一点,它能够通过使用现有数据和实时监控为数据中心避免事故的发生,减少不必要的损失,最大限度地提高生产力,让数据中心时刻保持冷静。
机器学习的自动化能有效避免因系统故障而导致的事故的发生,这主要基于数据中心计量技术的进步以及云中数据池的出现,智能系统在提高效率的同时,还能发现手动流程无法发现的数据中心运行中的漏洞。例如2016年,达美航空数据中心因电力系统故障停运三天时间事件,约2000次航班,造成航空公司损失1.5亿美元。
而在大型数据中心运营商和主机托管提供商中,动态散热优化是数据中心机器学习最常见的,通过动态冷却优化,数据中心管理人员可以根据环境条件监控和控制设施的冷却基础设施。当设备移动或计算流量激增时,建筑物内的热负荷也会发生变化。动态调整冷却输出以转移热负荷可帮助消除不必要的制冷量并降低运营成本。目前,数据中心运营商正在努力将动态制冷优化的成功扩展到其他领域。
人工智能时代,数据中心开始寻找发展新方向
目前,数据中心的AI技术主要围绕着机器学习监控和自动化设施组件的管理来展开的,如电力和配电元件,冷却基础设施,机架系统和物理安全。企业发现传统的数据中心管理方法并不是最优的,通过使用人工智能,通过机器学习,可以有效简化复杂计算设施的管理。
随着互联网的不断发展,人工智能技术的不断革新,企业开始采用机器学习技术,人工智能将在数据中心运营中扮演更重要的角色。一方面AI需求是未来数据中心需求增长的主要驱动力,另一方面AI技术将帮助数据中心提升运营效率。
人工智能时代,数据中心运营效率大幅提升
将机器学习用于数据中心,为大量新型数据相关决策创造了机会,能够大大提高预测能力。数据中心现有的监控工具是基础设施管理(DCIM)软件,可以提供对数据中心资产,相互依赖性,性能和容量的可视性。而当我们将外部大量汇总数据添加到数据中心DCIM软件中,机器学习便会发挥关键作用。机器学习对大规模数据进行进行实时数据分析,使企业能够将自己的数据中心性能与全球基准进行比较,使数据中心能更得到更深层次的预测性和预防性维护。
未来,机器学习在数据中心的广泛应用将为企业在决定运行某些工作负载的位置时提供更多建树性意见,这对数据中心而言无疑是非常有价值的,特别是如果企业正在围绕最佳执行场所做决定。而AI技术的加入,智能系统可承担更复杂的任务,使数据中心能够根据运行效率最高或最可靠的位置动态调整工作负载。