《高等计算机体系结构》文献综述gpu发展

《高等计算机体系结构》文献综述gpu发展

ID:21169305

大小:1.78 MB

页数:7页

时间:2018-10-20

《高等计算机体系结构》文献综述gpu发展_第1页
《高等计算机体系结构》文献综述gpu发展_第2页
《高等计算机体系结构》文献综述gpu发展_第3页
《高等计算机体系结构》文献综述gpu发展_第4页
《高等计算机体系结构》文献综述gpu发展_第5页
资源描述:

《《高等计算机体系结构》文献综述gpu发展》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、陈希2012年11月2日北京科技大学《高等计算机体系结构》文献综述题目:GPU的发展研究学院计算机与通信工程学院班级 124班学号 s20121170姓名 陈希时间 2012年11月02日 第7页共7页陈希2012年11月2日一、引言随着半导体工艺的发展,芯片上集成的晶体管数目按照摩尔定律增加,各种处理器的存储和计算能力也因此不断提高。作为最常用的两类处理器芯片,CPU和GPU的性能发展呈现不同的规律。CPU是计算机的主控处理部件,需要应对各种复杂的控制过程,追求的标量性能,注重通用性,因此在其芯片体系结构设计时,不得不将大量的芯片资源用于分支预测、乱序执行等复杂的控制逻辑,从而限制

2、了其计算性能的提升。而GPU原本只负责加速图形计算,功能相对比较单一,芯片的控制逻辑比较简单,主要的芯片资源都用于提升计算性能,因此其计算能力发展更为迅速。例如,AMD公司2009年第一季度发布的专业级流处理GPUFireStream9270[1]的单精度浮点峰值性能达到1.2TFlops,而Intel公司顶级的Core2Extreme9650四核处理器的浮点处理能力仅有96GFlops,可见在计算性能方面,GPU要高出CPU整整一个数量级。计算性能增长的同时,GPU的存储性能也在不断提升,2~4GB的存储容量、256~512位宽的存储总线都为GPU发挥出强大的计算能力提供了充分的保

3、证。除了计算性能外,从性/价比和性能/功耗比上看,GPU相对于通用CPU同样拥有明显的优势。这些特性都使得GPU成为搭建超级计算机的良好选择,可以在有限的系统规模和金钱开销的限制下达到非常高的峰值计算性能,因此越来越受到高性能计算领域的关注。计算性能不断提升的同时,限制GPU广泛应用的另一制约因素)))可编程性,也在不断提高。早期的GPU仅负责图形加速,流水线的功能固定,只能执行有限的几个操作以完成图像的生成。硬件工艺的进步使得GPU内处理单元的结构越来越复杂,功能也越来越灵活,其流水线具备了执行用户自定义程序的能力,从而具备了初步的可编程性。从最初的底层图形API发展到现在高度抽象

4、的CUDA[2]、Brook+[3]以及OpenCL[4],GPU的可编程性得到了极大的提升,已经具备了开发非图形领域应用的基本能力,GPU上的通用计算(GeneralPurposecomputationonGPUs,简称GPGPU[5])也成为体系结构、编程及编译等领域热点的研究方向之一。二、CPU/GPU协同并行计算研究进展a)GPU定义及相关技术GPU英文全称(GraphicProcessingUnit),中文翻译为“图形处理器”。GPU是相对于CPU的一个概念,由于在现代的计算机中图形的处理变得越来越重要,需要一个专门的图形的核心处理器。GPU是显示卡的“大脑”,它决定了该显

5、卡的档次和大部分性能,同时也是2D显示卡和3D显示卡的区别依据。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时。GPU第7页共7页陈希2012年11月2日所采用的核心技术有硬体T&L、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图双重纹理四像素256位渲染引擎等,而硬体T&L技术可以说是GPU的标志。T&L技术是最近在图形加速卡上都可以看得到的规格名称之一,这个名词的原来意义是:Transforming以及Lighting,光影转换。在图形加速卡中,T&L的最大功能是处理图形的整体角度旋转以及光源阴影等三维效果。3D图上有许多的连结点,每一个

6、连结点都可视为一条线的转折点,通过这些连结点,图形芯片可以很清楚地将整个对象的结构辨识出来。然而,这些连结点在这张3D设计图上的位置是固定不动的,换句话说,不管我们从任何一个角度来看这个对象,连结点的位置并没有变动,变动的只有角度的不同。不过,对象图案若只进行到Transforming的阶段,在对象的表面也只有连结点而已,并没有加上颜色色块或任何材质的贴图表现,因此,很像是立体的3D透视图。一般来说,T&L的效能常用「单位时间内所能处理多少个多边形的连结点变化以及光源运算」为基准。像nVidia的GeForce2便能在每秒钟处理2500万个多边形,而有的产品甚至能达到3000万个多边

7、形的效能。纹理压缩中将压缩后的数据存储进显存并不是终结。重要的是需要用显示芯片把这些压缩后的数据进行解压缩,再经过运算贴图到3D模型上。这个过程就需要显示芯片在硬件上支持了,如果不支持,对于压缩后的数据无法识别,照样不能完成纹理压缩,也不能发挥出纹理压缩的优势。凹凸贴图(bumpmapping),又称为皱面贴图,是一项计算机图形学技术,在这项技术中每个待渲染的像素在计算照明之前都要加上一个从高度图中找到的扰动。这样得到的结果表面表现更加丰富、细致,更加接近

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。