正在阅读：双核不可阻挡!首款双核处理器Tegra2详解双核不可阻挡!首款双核处理器Tegra2详解

2011-03-31 02:38 出处：PConline原创作者：登徒浪子责任编辑：heminggui

Tegra 2 GeForce处理架构及功耗介绍

　　双核处理器或许让消费者对于Tegra 2的功耗问题比较担心，而双核处理器再加上GeForce内核，顿时让很多人对于Tegra 2的功耗问题更加怀疑和关注。的确，现在手机续航时间短已经成为智能手机的一个普遍现象，而Tegra 2同样也绕不开功耗的问题，下面我们就来看看Tegra 2中的GeForce内核架构以及它如何实现功耗的控制。

　　GeForce架构是一种固定函数管线架构，包括完全可编程的像素和顶点着色器，以及一个先进的纹理单元，可支持高品质的各向异性过滤。

Tegra 2处理器中的GeForce架构

　　GeForce包含四个像素着色器内核和四个顶点着色和内核，专用于高速顶点和像素处理。GPU管线在像素管线中使用FP20数据精度的80位RBGA像素格式，在顶点管线中则使用FP32 精度的80位RBGA像素格式。它还实现了一种独一无二和专有的各向异性过滤 (AF) 算法，该算法优于许多台式机GPU所使用的AF技术。该架构支持各种高级特性，例如高动态范围 (HDR) 照明、多重渲染目标 (MRT)，并且两种纹理支持均不会带来功耗。该架构同时支持 DXT 和 ETC 纹理格式。

　　虽然GeForce架构是一种类似于OpenGL ES 2.0标准定义的管线架构，但它还包含一些特殊特性和自定义功能，可显著降低功耗并提供更高的性能和图形质量。Tegra 2移动处理器中实现的一些独特特性包括：

　　1、Early‐Z 支持，专用于过滤掉不可见的像素。

　　2、集成像素着色器 (Pixel Shader) 和混合单元 (Blend Unit)，可实现编程灵活性和更高的性能。

　　3、像素缓存、纹理缓存、顶点和属性缓存，可减少内存操作。

　　4、独特的 5 倍覆盖采样抗锯齿 (CSAA) 技术，可在更低的内存带宽下实现更高的图像质量。

　　5、高级各向异性过滤 (AF)，可实现高细节纹理。

　　6、内部开发的自定义内存控制器，可提高 GPU 性能和降低功耗。

　　7、实现超低功耗的众多电源管理功能。

Early–Z 技术

　　现代GPU使用Z缓冲（也称作深度缓冲）来跟踪该场景中的可见但由于被其他像素遮挡而不需要显示的像素。每个像素在Z缓冲中都有相应的Z信息。单一3D帧会经过处理并转换为2D图像，以便在显示器上显示。该帧由从主机发送至GPU的顶点顺序流构成。多边形将由顶点流组配而成，并且会生成和呈现2D屏幕空间像素。

　　在指定时间单元（如1/60秒）内构建单一2D帧的过程中，多个多边形及其相应像素可能会覆盖相同的基于2D屏幕的像素位置。这经常被称作深度复杂性，并且现代游戏的深度复杂性可能达到 3、4 或者更高，即在覆盖相同 2D 屏幕位置的帧中呈现 3 个、4 个或更多像素。

　　想象首次在顶点流中处理构成某块墙的多边形（和由此产生的像素），以构建场景。接下来，处理位于墙前面的一把椅子的多边形和像素。对于特定的2D屏幕像素位置，观众最终只能看到一个像素，即椅子的像素或墙的像素。椅子离观众更近，因此会显示它的像素。（请注意，某些对象可能是透明的，并且透明对象的像素可以与背景中已有的不透明或透明像素相混合，或者与之前帧的帧缓冲区中的已有像素相混合）。

缓冲示例

　　OpenGL ES2.0 逻辑管线定义的针对各像素数据的 Z 比较会在像素经过像素着色器处理之后执行。在像素着色处理之后评估像素的问题在于，像素必须遍历几乎整个管线才能最终确定堵塞且需要丢弃的像素。对于拥有数百或数千处理步骤的复杂着色器程序，所有处理都浪费在永远不会显示的像素上！更重要的是，在移动设备中，处理这些像素涉及 GPU 和共享系统内存之间大量事务。由于系统内存位于片外，因此内存操作会显著消耗电源并且会迅速耗尽电池电量。

　　GeForce中的Early‐Z实现是高端台式GeForce中所使用的实现的优化版本。Early‐Z操作会测试所有像素的Z深度并仅将可见像素传递给像素着色器块。通过执行Early‐Z操作，GeForce架构会仅获取通过Z测试的可用像素的Z值、颜色和纹理数据。Early‐Z效率极高，可准确检测出和丢弃隐藏像素。

　　Early‐Z处理的主要优势在于它不仅可通过减少GPU与片外系统内存之间的内存流量来显著降低功耗，而且速度也要快于其他 Z 比较算法。大多数情况下，高效的Early‐Z都可以识别和丢弃隐藏像素。但在极少数情况下，对于一些特殊场景程序员可能需要在像素着色完成之后隐藏像素。对于这些极少数的情况，GeForce管线实现了一种后期阶段深度计算，并混合于集成像素着色器和混合单元中。

像素和纹理缓存可减少内存操作

　　传统的OpenGL GPU管线指定纹理、深度、颜色等像素信息存储在系统内存（或帧缓冲存储器）中。在像素处理阶段，像素信息会在内存之间来回移动。这就需要在片外系统执行大量内存操作，从而消耗大量电能。GeForce架构实现了片上像素、纹理和属性缓存，以及独特的缓存管理算法，不仅可减少系统内存操作，而且还可以最大限度地利用这些缓存。

　　像素缓存用于存储像素的片上Z值和颜色值，并且适应于所有重复访问的像素，比如用户界面组件。此外，由于像素颜色和深度数据在许多其他图形场景图像中的良好空间及时间局部性，像素缓存可提供非常理想的缓存命中率，并且可降低访问系统内存的需要。

　　纹理数据具有良好的空间和时间局部性。特定像素通常会在双线性过滤等纹理过滤操作过程中使用许多相同的纹理元素（像素）作为相邻像素，并且纹理经常在图像的至少一些帧中保持相同。因此，在片上缓存纹理数据有助于重用纹理数据以及显著减少通过访问系统内存来获取纹理数据。