欢迎来到天天文库
浏览记录
ID:1391113
大小:61.50 KB
页数:3页
时间:2017-11-11
《韶关平板电脑批发-epai中国大学生团队创业计划》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、计、整个US和Shader簇内的MIMD化执行。AMD历代着色器演进在GeForce8800GTX之后,AMD经过数月的延迟后推出了代号R600的RADEONHD2900XT核心,这款产品和NVIDIA的新品一样使用了统一渲染架构,不同之处在于2900XT的64个SIMD着色器内包含了5路超标量(superscalar)的运算单元(ALU),我们习惯性称其拥有320个流处理器。组织形式方面,SIMD单元采用超标量+VLIW(甚长指令)设计,虽然从数量上看规模庞大(共拥有320个ALU,8800GTX为28个),但是执行效率在实际运算特别是通用计算中会发生不可忽视地衰减。为方便讨论,
2、在后文分析中,我们将更多地把着色器Shader称为流处理器StreamProcessor。产品:ATIRadeonHD4850显示芯片传统GPU发展与着色器管线●传统GPU发展与着色器管线根据第一章的讲解,我们了解到渲染一个复杂的三维场景,需要在一秒内处理几千万个三角形顶点和光栅化几十亿的像素。早期的3D游戏,显卡只是为屏幕上显示像素提供一个缓存,所有的图形处理都是由CPU单独完成。图形渲染适合并行处理,擅长于执行串行工作的CPU实际上难以胜任这项任务。所以那时在PC上实时生成的三维图像都很粗糙。995年设计完成的3dfxVoodoo用自己的深度缓冲区(z-buffer)和纹理映射
3、(texturemapping)技术将3D渲染速度提升到当时的顶峰。999年发布GeForce256图形处理芯片时首先提出GPU的概念,Geforce256所采用的核心技术有硬体T&L、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬体T&L技术可以说是GPU的标志。传统的GPU渲染流水线从DirectX9开始,ATI抢先发布了代号R300的Radeon9700,这款GPU产品以简洁明快的设计风格赢得了用户的一致好评,首款DX9图形芯片,256Bit的显存位宽,9700凭借8条管线理所当然的坐上了3D之王的宝座。正是在由微软DirectX9
4、开启的R300时代,图形芯片厂商意识到了渲染管线的重要性。无论是顶点处理器数量还是像素渲染管线数量都成为各家厂商竞争的重点标准。如果说DirectX8中的Shader单元还是个简单尝试的话,DirectX9中的Shader则成为了标准配置。除了版本升级到2.0外,DirectX9中PS单元的渲染精度已达到浮点精度,游戏程序设计师们更容易更轻松的创造出更漂亮的效果,让程序员编程更容易。在图形处理中,最常见的像素都是由RGB(红绿蓝)三种颜色构成的,加上它们共有的信息说明(Alpha),总共是4个通道。而顶点数据一般是由XYZW四个坐标构成,这样也是4个通道。在3D图形进行渲染时,其实
5、就是改变RGBA四个通道或者XYZW四个坐标的数值。为了一次性处理个完整的像素渲染或几何转换,GPU的像素着色单元和顶点着色单元从一开始就被设计成为同时具备4次运算能力的算数逻辑运算器(ALU)。“管线”的由来——个时钟周期4次运算顶点着色单元(VertexShader,VS)和像素着色单元(PixelShader,PS)两种着色器的架构既有相同之处,又有一些不同。两者处理的都是四元组数据(顶点着色器处理用于表示坐标的w、x、y、z,但像素着色器处理用于表示颜色的a、r、g、b),顶点渲染需要比较高的计算精度;而像素渲染则可以使用较低的精度,从而可以增加在单位面积上的计算单元数量。
6、在ShaderModel4.0之前,两种着色器的精度都在不断提高,但同期顶点着色器的精度要高于像素着色器。数据的基本单元是Scalar(标量),就是指一个单独的值,GPU的ALU进行一次这种变量操作,被称作D标量。由于传统GPU的ALU在一个时钟周期可以同时执行4次这样的并行运算,所以ALU的操作被称作4DVector(矢量)操作。一个矢量就是N个标量,一般来说绝大多数图形指令中N=4。所以,GPU的ALU指令发射端只有一个,但却可以同时运算4个通道的数据,这就是SIMD(SingleInstructionMultipleData,单指令多数据流)架构。传统意义上像素渲染流水线(P
7、ixelShaderPipeline)应该是像素着色器(PixelShaderProcessor,简称PSP):纹理处理单元(TextureModelUnit,简称TMU):像素输出处理单元(RenderBackEnd,简称RBE)=::。这个比例在DirectX9.0c末期的Radeon900系列中被打破,因为ATI的工程师们认为在未来游戏中显卡PixelShader部分的ALU算术指令所占的比例将越来越大,TMU纹理贴图指令所占的比例将缩小。所谓3:架构就是指Ar
此文档下载收益归作者所有