基于虚拟信道的计算机网络流量控制的研究

(整期优先)网络出版时间:2020-09-11
/ 4

 基于虚拟信道的计算机网络流量控制的研究

何花

云南电网有限责任公司楚雄供电局 云南楚雄 675000

摘要 片上通信是高层次集成系统片上设计面临的主要挑战之一。为了解决复杂性和布线难题,Network-on芯片被认为是一种能够提供可靠、高效通信平台的重要解决方案。因此,网络设计被视为定义系统整体性能的关键参数。本文提出了一种在分布式网络中集成集中式路由器的网络设计方案,将我们的结果与使用各种综合流量模式和基准的不同大小的分布式网络进行比较。实验表明,在获得高吞吐量和低延迟性能的同时,该设计方案还通过减少满足等效分布式网络的相同设计约束所需的缓冲区数量,成功地最小化了面积和功耗。

关键词:集成式;分布式;流量;延迟

Research on flow control of computer network based on virtual channel

Abstract On chip communication is one of the main challenges in the design of high-level integrated system on chip. In order to solve the complexity and wiring problems, network on chip is considered as an important solution to provide a reliable and efficient communication platform. Therefore, network design is regarded as a key parameter to define the overall performance of the system. In this paper, we propose a network design scheme to integrate the centralized router in the distributed network, and compare our results with the distributed network of different sizes using various integrated traffic patterns and benchmarks. The experimental results show that, while achieving high throughput and low latency performance, the design scheme also successfully minimizes the area and power consumption by reducing the number of buffers required to meet the same design constraints of the equivalent distributed network.

Keywords: Integrated; distributed;traffic; delay

由于高集成度片上系统(SoC)设计的持续发展、复杂性的增加,以及要求解决集成数十个或数百个IP(如CPU、GPU、DSP、内存等)服务于多个应用程序[1],这些挑战揭示了点拓扑通信和基于总线的体系结构的冲突。Network on chip(NoC)被认为是解决片上系统通信问题的一种可行方法[2],它通过互连路由器连接多个IP块,并通过提供一个可扩展的高吞吐量互连平台来解决各种限制。

作为网络体系结构的一个重要方面,网络拓扑结构的适当选择会影响延迟和功耗方面的性能,因此互连网络中的信道和节点的拓扑结构是一个需要考虑的基本参数[3]。二维网格拓扑由于其在SoC上的自然布局映射、可扩展性和简单路由算法的使用,是最常用的拓扑之一[4]。然而,当网络规模较大时,分布式网络的主要缺点出现了,在这种情况下,延迟将以不令人满意的方式受到影响。

由于将多个核心连接到一个路由器上,在主网内部创建小型网络,实现本地公平仲裁,为需要频繁通信的核心提供便利的环境,因此将核心分割成簇会导致冗余路由器更少、链路利用率更高、本地拥塞更少。由于集中式网络将IP核直接连接到路由器端口[5],支持异构块连接到网络中,因此它被引入来代替常规的分布式网络[6]

本文,我们将集中式网络与基于虚拟信道路由器的网络进行比较,该网络将多个虚拟信道与物理信道相关联,允许其他分组使用在分组阻塞时将空闲的信道带宽。本文结构如下:第一部分简要介绍了研究背景和相关工作;第二部分描述了提出的方案和设计架构;第三节给出了实验评估和结果分析;最后,对本文进行了总结。

1 集中式网络与虚拟信道路由

在拓扑结构中,路由算法和流控制方法在延迟、吞吐量和容错性方面寻求基于NoC的最佳性能指标,同时保持功率和面积限制[7]。然而,以往研究的重点是将分布式网络作为片上通信平台的默认方法。本文的工作重点是在基于集群的方法上实现分布式和集中式方面的合并,以在本地获得最佳性能,该方法集成以实现高性能区域和节能网络。

1.1 分布式网络中的缓冲区管理策略

由于缓冲资源是提高性能的关键因素,权衡设计区域和功耗,现行的办法是使用缓冲组织和大小调整的方法[8]。虚拟信道流控制是以将资源分配与带宽分配分离,并提供了一种解决线头阻塞的方法,在二维网络中,吞吐量增加了4倍。这些方案的组合导致了在运行时动态分配资源的尝试,与静态方法相比,性能提高了25%。但所有这些都以牺牲高逻辑复杂性和功耗为代价[9]。为了实现这一开销,通常的做法是使用一种灵活的路由器来解决每个输入端口缓冲区的限制,从而在热点(HS)流量模式下使饱和率提高了11.4%,但在其他模式下的改进非常有限,这表明应用驱动流量的性能较差。尽管有吸引人的事实和数字,但上述方法都没有考虑在集成数千个IP的大规模SoC上的实际实现。

2 设计概念和模型架构

2.1 基于簇的网络集中方法

在典型的SoC中,许多功能单元集成在同一个芯片上[10]。考虑到图1所示的系统,通信可分为两个层次:集中在本地的应用驱动业务和管理所有系统单元的交互的系统级业务。在每个级别中,有效操作的特定设计约束概述了网络参数的正确配置;包括拓扑、路由和流控制。

5f5b3f7807982_html_ea4a3e3d6a221bd6.png

因此,每个任务的通信模式对任务的特殊映射和所需资源的准确估计的设计和性能有着重大影响[11]。这提供了一个理想的环境,该环境概述了将集中式路由器集成为每个集群内的主要通信平台的优点,以避免大型分布式网络中的性能下降,其中源对和目标对之间的平均跳数随网络大小而变化。

5f5b3f7807982_html_37ea0c8c7b2b4fe0.png

这种方法的结果将是如图2所示的低基数分布式网络,其中核心通信也可以使用集中式交换技术或自定义分布式网络来完成,但是在后一种情况下,在切断源-目的地对之间的平均跳数之后,它将具有最小的延迟。

2.2 集中式路由器架构

我们的集中式路由器采用虚拟通道(VC)流控制,在分片(flit)的基础上传输数据,每个处理单元注入一个分组,分组被分成若干个flit,第一个是包含目的地址的头[12],最后一个flit是表示分组结束的尾。为每个输入端口提供的缓冲资源被分为3个VC,以减少由分组阻塞引起的争用。一旦数据包被存储,路由计算就直接在随后的虚拟分配(VA)和交换机分配(SA)阶段所需的VC状态表中分配请求的输出端口。两个阶段都使用可分离的输入优先分配器,因为即使在高基数路由器中,它也能确保快速分配。它在两个仲裁阶段之后生成一个匹配;第一轮只为每个端口授予一个VC来仲裁一个资源,第二轮从所有传入的请求中选择一个请求。循环(RR)仲裁器用于转移优先级并在所有代理之间实现公平分配[13]。之后,crossbar收集授权的flit和相应的请求输出端口,以完成flit遍历阶段。尾翼离开后,控制单元释放包资源,并将VC的全局状态设置回空闲状态。

2.3 能耗评估

使用表1中参数作为输入进行能耗评估。输入参数可以使用诸如ORION的功率模拟器[14]来计算。

参数

参数描述

5f5b3f7807982_html_d304dd71c4d17219.gif

路由器数量

5f5b3f7807982_html_77eb80f64ba17525.gif

链接数链接数

5f5b3f7807982_html_27d33861d005a3ab.gif

静态路由器电源

5f5b3f7807982_html_f955f53e149a4e61.gif

静态链路功率

5f5b3f7807982_html_7a1db273ddfcd61f.gif

链路穿越能耗

5f5b3f7807982_html_46159423b00e01d.gif

外接链路穿越能耗

5f5b3f7807982_html_2a6f27d36ae4218.gif

管道寄存器写入能耗

5f5b3f7807982_html_d9e1f37256cdec88.gif

缓冲写入能耗

5f5b3f7807982_html_c39ce4e7f9680eb9.gif

缓冲区读取能耗

例如,5f5b3f7807982_html_46159423b00e01d.gif 在每个遍历上递增。然后使用以下方法生成静态功率估计:

5f5b3f7807982_html_3378fadb9915686a.gif (1)

以及动态能量估算:

5f5b3f7807982_html_2a354a207b23cf23.gif (2)

在(2)式中,对角线链接遍历被计算为两个链接遍历。原因是半导体芯片中的物理金属层沿x或y方向布线。因此,虽然对角线链路在一个周期内被遍历,但与平行于轴线的相邻路由器相比,其物理实现要求相邻对角线路由器之间的导线具有双倍长度,与平行于轴线的相邻路由器相比。

3 实验测试与能耗估算

在实验环节,为实现全面的设计评估,我们考虑了通过延迟和吞吐量测量反映的NoC性能

[15]。对16端口和64端口集中式VC路由器的不同网络规模与等效的16元和64元网格进行了比较。为了公平的评估,使用一个部署相同架构的VC路由器与确定性XY路由算法进行比较。两个路由器在相同的工作频率下进行模拟,每个输入端口使用3个VC,每个VC最多可容纳7个分片。标准的模拟和测量环境在系统HDL中实现,并以评估作为均匀随机和热点的多个合成业务模式。此外,重新评估MPEG-4、MWD和VODP等应用驱动的流量模式,以获得实际的和潜在的工业实现。所有的测量都被标准化为分片,以获得最精确的结果。

3.1 性能指标评估

因为统一的流量模式通常说明了设计潜力,从而比以前提出的架构提供了显著的改进。我们的结果反映了16和64端口集中式VC路由器的稳定和一致的性能,与16元和64元的分布式2D网格相比,由于大小调整,性能退化可以忽略不计,后者的吞吐量降低,零负载延迟增加了近50%。此外,我们的设计优于分布式64元网格,吞吐量增加了3倍。即使与16元网格(分布式网络的最佳方案)相比,它也超过了40%左右。

使用位置换探索不同业务模式下作为热点的设计性能揭示了分布式网络的更多局限性,如图5所示。由于目的地的限制,集中式VC路由器在16个端口的情况下保持了其吞吐量,而在64个端口中的吞吐量下降较小(小于8%),因此可以忽略不计,而16元分布式情况下的吞吐量比统一流量性能下降了20%。因此,我们可以推断,在没有预先定义的流量模式的应用中,集中式路由器更可靠,因为它们不易因流量变化而降级。

5f5b3f7807982_html_a2b3b9c5fb84773e.png

在使用MPEG-4、VOPD和MWD基准对应用驱动的业务模式进行的进一步研究中,如图6所示,集中式路由器在所有情况下在零负载延迟、平均吞吐量和饱和速率方面都更有效,其中其性能只受节点业务集中度的影响,而不是分布式的,主要由任务的映射定义的,该映射决定了源-目的地对之间相对于每个任务所需的通信带宽的平均跳数。这表明,在采用连接大量以较低频率工作的IP块的方法以试图降低散热和功耗的系统中,分布式网络也将提供非常差的性能。

5f5b3f7807982_html_181ae494fd48d1b7.png

3.2 能耗评估

我们的主要设计考虑因素之一是对面积和功率的影响,因为我们的研究显示了有趣的特性,进一步支持了我们的动机。由于缓冲区占据了设计区域的大部分,泄漏功率约占节点总功耗的64%,我们必须考虑增加的开销,以满足设计规范和要求,并以额外成本为代价。

5f5b3f7807982_html_e936a6e3bf47141d.png

如图7所示,比较集中式VC路由器,将每个端口的VC数量限制为2VC和1VC,并且在所有情况下,它都显著优于使用每个端口3VC的64元网格。这意味着我们可以使用相应分布式系统中三分之一的资源获得更高的吞吐量集中式网络

4 结论

在我们的工作中,我们提出了一种利用SoCs中片上通信特性的网络设计,在SoCs中,密集的本地通信可以使用集中的网络来完成,在所有评估参数上提供最佳的结果。在获得高吞吐量和低延迟性能的同时,它还通过减少满足等效分布式网络的相同设计约束所需的缓冲区数量,成功地最小化了面积和功耗。

参考文献

  1. 谢枫,孟相如,孟庆微,于兴超.动态路径分裂的虚拟网络重构算法[J].火力与指挥控制,2019,44(11):29-34+40.

  2. 网络功能虚拟化资源配置及优化研究综述[J]. 邵维专,吕光宏.  计算机应用研究. 2018(02)

  3. 面向动态虚拟网络请求的虚拟网络映射算法[J]. 苑迎,王聪,王翠荣,宋欣,吕艳霞.  计算机应用. 2017(01)

  4. 云模型改进惯性权重的混沌交替粒子群算法[J]. 李纪真,孟相如,崔文岩,杨婷.  火力与指挥控制. 2016(05)

  5. 基于负载均衡的虚拟网络映射算法研究[J]. 陈世芳,吕天齐,王小娟.  计算机应用研究. 2016(12)

  6. 面向多节点故障的生存性虚拟网络映射方法[J]. 肖蔼玲,王颖,孟洛明,邱雪松,李文璟.  通信学报. 2015(04)

  7. 区分服务QoP的可生存虚拟网络映射算法研究[J]. 刘光远,双锴,苏森.  通信学报. 2013(12)

  8. 虚拟网络映射问题研究及其进展[J]. 李小玲,王怀民,丁博,郭长国,李小勇.  软件学报. 2012(11)

  9. 节点可重复映射和链路可分流的虚拟网映射算法[J]. 李文,吴春明,陈键,平玲娣.  电信科学. 2010(10)

  10. 田秀霞, 陈希, 田福粮. 基于区块链的社区分布式电能安全交易平台方案[J]. 信息网络安全, 2019(1): 51-58.

  11. VN Embedding:A Survey. Fischer A,Botero J F,Beck M T,et al. IEEE Communications Surveys&Tutorials . 2013

  12. SVNE:Survivable Virtual Network Embedding Algorithms for Network Virtualization. Rahman M,Boutaba R. IEEE Transactions on Network and Service Management . 2013

  13. Simple:survivability in multi-path link embedding. KHAN M M A,SHAHRIAR N,AHMED R,et al. Network and Service Management (CNSM) . 2015

  14. Re No Vat E:recovery from node failure in virtual network embedding. SHAHRIAR N,AHMED R,KHAN A,et al. Network and Service Management (CNSM) . 2016

  15. A virtual network embedding algorithm based on virtual topology connection feature. Cui H,Gao W,Liu J,et al. IEEE 16th International Symposium on Wireless Personal Multimedia Communications . 2013

[16] 张 捷.电力通信及其在智能电网中的应用研究[J].通讯世界,2016,02(12):296.