网络处理器并行性能模型及多线程停顿特性

网络处理器并行性能模型及多线程停顿特性

ID:37556744

大小:989.50 KB

页数:7页

时间:2019-05-25

网络处理器并行性能模型及多线程停顿特性_第1页
网络处理器并行性能模型及多线程停顿特性_第2页
网络处理器并行性能模型及多线程停顿特性_第3页
网络处理器并行性能模型及多线程停顿特性_第4页
网络处理器并行性能模型及多线程停顿特性_第5页
资源描述:

《网络处理器并行性能模型及多线程停顿特性》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第9期时向泉等:网络处理器并行性能模型及多线程停顿特性·59·网络处理器并行性能模型及多线程停顿特性时向泉,苏金树,陈一骄,吴纯青(国防科技大学计算机学院,湖南长沙410073)摘要:对影响多处理器与多线程的网络处理器性能因素进行分析,提出了网络处理器并行性能模型NP3M,给出了影响其性能的主要原因,并对多线程并行数目与处理单元并行以及网络处理器整体系统性能之间的关系进行了研究与实际测试,对NP3M模型进行了验证,并给出了相关的结论。关键词:网络处理器;并行性能模型;多线程;停顿中图分类号:TP393文献标识码:A文章编号:1000-43

2、6X(2007)09-0053-07ParallelperformancemodelfornetworkprocessorsandthecharacteristicsofmultithreadstallsSHIXiang-quan,SUJin-shu,CHENYi-jiao,WUChun-qing(ComputerSchool,NationalUniversityofDefenseTechnology,Changsha410073,China)Abstract:Thefactorsthatimpacttheperformanceofnet

3、workprocessorswithmultiprocessorandmultithreadingwasanalyzed.Thenaparallelperformancemodel--NP3Mwasprposed,andtheprimaryfactorsthatitsperformancedependsonwasdiscussed.Furthermore,therelationshipbetweenmultiprocessor,multithreadingandthewholeperformanceofnetworkprocessorsw

4、asstudied.Lastly,thetestresultsaboutNP3Mwaspresented.Keywords:networkprocessor;parallelperformancemodel;multithreading;stalls第9期时向泉等:网络处理器并行性能模型及多线程停顿特性·59·1引言收稿日期:2007-03-05;修回日期:2007-07-05基金项目:国家自然科学基金资助项目(90604006);国家重点基础研究发展计划(“973”计划)基金资助项目(2003CB314802)FoundationIte

5、ms:TheNationalNaturalScienceFoundationofChina(90604006);TheNationalBasicResearchProgramofChina(973Program)(2003CB314802)当前高性能网络设备研制至少面临2个方面的挑战。其一,网络链路速率的急剧增加给网络设备的报文处理能力造成了巨大的压力。例如,10Gbit/s的网络速度,40Byte报文的到达间隔只有35ns,40Gbit/s的网络,报文到达间隔仅为8ns。在如此短的时间间隔内,要完成报文路由查找、队列管理和QoS等操作在

6、内的完整的数据平面的处理具有极大的难度。其二,网络应用的快速普及,给网络设备的功能提出了更高的要求,从简单的数据转发处理到复杂的报文内容相关的操作(例如对IPSec、协议识别等)。第9期时向泉等:网络处理器并行性能模型及多线程停顿特性·59·网络处理器具有的灵活性和性能接近ASIC的双重优点对解决这2个问题具有优势,因此日益受到网络设备制造商的青睐。网络处理器实际上是一个多核的SOC系统,受限于成本、功耗、芯片面积等因素,主频难以与通用CPU比拟。例如,对于主频为133MHz的网络处理器来说,时钟周期为7.5ns。由于2.5Gbit/s链

7、路上40Byte的报文到达间隔为160ns,因此网络处理器必须在21.3个时钟周期内完成处理才能避免报文丢弃。但是,网络处理器的报文缓冲一般需要采用大容量的DRAM,访问延迟大约为55~70ns(DDR、RDR),因此完成一次访存操作需要大约10个时钟周期,所以在21个时钟周期内,对报文进行线速处理是相当困难的。文献[1~3]通过典型网络应用量化和评估网络处理器处理能力。以路由表查找(RTR)和IP分段(FRAG)为例,其中RTR的计算复杂度为2.1条指令/每字节,对于2.5Gbit/s链路,其计算能力需求为2.5Gbit/s/8×2.1

8、=656MIPS,FRAG的计算复杂度为7.7条指令/每字节,其计算能力需求为2.5Gbit/s/8×7.7=2407MIPS。拥有16个处理单元(主频为133MHz)的网络处理器的处理能力为

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。