统一架构是相对于过去
顶点着色器(Vertex Shader)和
像素着色器(Pixel Shader)分离式架构而言的全新架构。
应用于NVIDIA的新一代
图形处理器GeForce 88OO系列与原有的GPU相比最大的特色就是采用了统一架构(Unified Architecture).
在DirectX 8时代,GeForce 3将
顶点着色器和像素着色器引入了
渲染管线,前者负责控制3D物体的几何形状和光照阴影,后者负责处理物体表面的色彩和纹理,他们均靠
显卡的硬件执行,相对于之前的T&L转换与光照引擎,顶点和像素着色器不仅进一步释放了CPU的运算能力,而且还能创建出动态水波,织物的褶皱等以往无法实现的3D效果,为游戏开发者提供了巨大的创造空间,因此顶点着色器和像素着色器架构贯穿了整个DirectX8和DirectX 9时代!
随着3D游戏的逼真程度逐渐提高,GPU的渲染任务越来越繁重,图形厂商普遍采用提高核心频率和增加渲染管线的方式保证性能,顶点着色器和像素着色器的数量虽然随之增加,但由于两者功能的不同并且根据GPU渲染管线“生成顶点→设置三角形→像素纹理
贴图→光栅混合缓冲→显存”固有工作流程,分离式的架构的弊端逐渐显露出来。举例来说,假如一个场景的几何运算很多,而纹理材质运算相对简单的话,就会出现
顶点着色器的繁忙而
像素着色器空闲的状况。资源浪费的是其无法避免的缺陷。
统一架构能彻底解决这一问题,在GeForce 88OO的统一架构中,传统的
渲染管线被称为“Stream Processing”的流线处理模式替代,更关键的是取消了专用的
顶点着色器和
像素着色器,取而代之的是统一的可编程流线处理器,GeForce8800最多具有128个流线处理器,任何一颗都可以运用于执行顶点,像素,几何和物理着色操作,由于具有可编程的特性,将来他还能被用于其它运算能力。分离式架构渲染流程中的“生成顶点→设置三角形→像素纹理贴图→光栅混合缓冲→显存”现在全部统一由流线处理器完成,而且这些流线处理其采用并行的计算方式,因此可以提供两倍于G71的像素填充能力,12倍于G71的顶点建模能力。总之采用统一架构的GPU具有空前的效率!