精确定时和频率同步的重要性
提供准确的定时和频率同步是电信、数据中心、工业自动化、电力设施、多媒体等许多应用运行和性能的基本先决条件。然而,通过基于分组的网络传输来精确定时信号并非没有挑战。例如,全球导航卫星系统GNSS的脆弱性或异构传输技术的使用会严重影响时间同步的传送。此外,网络的不同部分(如无线和传输)通常由不同的运营商(或部门)来管理,这使得评估端到端性能变得复杂。例如,一个运营商(或部门)对网络的错误配置或更改可能会无意中造成网络授时的严重不对称,从而损害网络的其他部分。总之,为确保应用和关键服务以最佳方式运行,对整个网络的同步进行监控,变得越发重要。
网络可视性需求
网络行为和性能的可视化对网络运营商来说一直都颇为关键,因为可视化使网络运营商有能力最大限度地减少服务影响,或至少在出现同步问题时能更快地定位故障。在理想的情况下,网络运营商可以使用包含 GNSS 接收机的本地测试设备,监控所有站点的同步情况来作为参考。但这只有在站点数量有限的情况下才可行。
监控同步替代方案的探索
如果上述的方案只有在站点数量有限的情况下才可行,那替代方案是什么呢?目前正在讨论的是使用路由器和交换机等各种网元以及边界时钟来收集性能监控数据。这些设备可以相对于备份参考或使用本地时钟进行一系列相对时间的测量。目前,一些网络运营商和网络管理员通过专有的网络管理系统来完成这项工作,但这导致每个供应商都要根据自己特定的参数集来收集数据。需要注意的是,网络可能有从数千到数十万不等的监控点,数据中心的监控点可能多达数百万。
IEEE 和 ITU-T 的标准化工作
IEEE 和 ITU-T 等标准化机构在过去几年中一直致力于提供一些标准方法来收集网络数据,以确保数据的同质性和一致性。其中,IEEE 1588-2019附件J(目前已被ITU-T采用,在PTP G.8275标准中为附件F)提供了应收集的性能监控参数列表。这些参数包括根据测量的延迟和时间偏移计算的统计数据,以及发送端和接收端之间延迟的最小值、最大值、平均值和标准偏差等基本统计数据。
同步数据汇总和存储的要求
附件J和F都要求在15分钟和/或3分钟间隔的测量窗口中汇总同步数据,并分别存储前24小时和/或1小时的汇总数据。有了这些数据,就可以检测网络中的变化,监控趋势,并最终确定网络故障问题的根本原因。以这种方式收集数据的一个主要问题是,它并不总是对网络中的时间误差(TE)进行直接测量,而是必须从数据中推断出性能和问题的位置。这需要对数据进行过滤和分析,也可能意味着需要对大量节点进行分析,而这并不总是切实可行的。
案例研究:性能监控数据的利用
为了了解如何利用性能监测数据,Calnex 在一个由路由器和基站组成的小型网络上进行了一些探索性测试。使用 Paragon-X 向网络中注入干扰(通过增加不对称或 "噪音"),导致基站输出的时间误差发生变化。有趣的是,通过查看性能监测数据,可以追溯到网络中出现问题的确切点,而且通过仔细评估数据,还可以检测到不对称的实际变化。换句话说,这些数据可以实时确定网络中影响终端应用性能的节点。
网络监控的其他重要参数
除了ITU-T G.8275附件F中定义的PTP参数外,还可收集其他重要参数,比如主时钟的身份信息,可提供网络行为和拓扑的详细情况。最近,ITU-T还对用于监控同步以太网的参数进行了标准化,以便监控同步分配器和物理层;修订后的ITU-T G.781标准中新加了附件B涵盖了这一内容。
结论:有效网络性能监控的重要性
总之,有效的网络性能及其同步监控解决方案是确保稳健、弹性网络的关键因素。网络运营商对这一解决方案的要求越来越高,而标准对于从收集的数据中获得具有一致性的分析结果至关重要,另外标准也是过滤和分析成千上万个时钟从而防止网络问题的有效方法。