手机
手机 手机资讯 手机评测 技术分析第2期:四核处理器Tegra3详介绍
01月 20

技术分析第2期:四核处理器Tegra3详介绍

编辑:登徒浪子 来源:pconline
放大 缩小 打印 邮件 收藏本页 游吧论坛

曾经以为诸如手机这样的移动设备,单核处理器已经足够搞定它们了,哪怕不够提高一点频率肯定是没问题的,曾经以为双核只是PC上的神器,手机无论如何也很难与其沾边;然而,很多我们曾经以为的东西在一转眼间之间都变成了现实,单核处理器不再完全满足手机需要,出现在PC上的双核处理器也同样出现在了手机上,并且大有加速赶超的意思。

年初Tegra 2处理器率先揭开了双核手机大幕,于是在今年一年的时间里我们看到了大批双核手机登场,可以说2011年定义为双核手机元年一点也不过分;现如今,作为双核手机元年的2011尚还有一段时间才正式结束,但是我们已经能嗅到四核手机的味道了,来自于NVIDIA的Tegra 3处理器已经蓄势待发。


寻求性能与功耗的平衡

Tegra 3处理器最明显的特征是它拥有比Tegra 2更多的核心,也是目前首个基于移动设备设计的四核处理器,或者更准确的说应该是4+1核处理器,因此它在四颗主核心的基础上加入了一颗协处理器,以达到降低功耗和保持续航的目的。4+1处理器?听起来似乎有些噱头,这样的设计理念和思路是什么?它和Tegra 2处理器相比能带来哪些改变和提升?它能保持性能和功耗的平衡点吗?带着这一连串的疑问,我们不妨来深入了解一下全球首款四核移动处理器Tegra 3。

4颗主核心+1颗协核心寻求性能功耗平衡点

待机、续航时间短一直是智能手机用户比较发愁的一件事,特别是在大屏横行的当下更是如此,在双核处理器面世之初就有不少人担心它的功耗和续航问题,如今Tegra 3的处理核心更多了,功耗和续航问题再次成为人们关注的重点,Tegra 3如何保持性能功耗平衡点,下面我们来了解一下Tegra 3的架构图以及设计思路和方案。


Tegra 3处理器核心图

Tegra 3处理器采用“Kal-El”作为核心代号,从上面的核心图中可以看到Tegra 3一共有五颗处理核心,单独位于最上端的处理器就是4+1处理器中的1,也就是前面提到的协处理器,而就是NVIDIA专门为保持功耗和性能的平衡所采用的可变对称多重处理(vSMP)技术。


4+1核心设计

可变对称多重处理(vSMP)技术是指第五颗协核心利用专门的低功耗硅工艺制造而成,能够以低频率运行活动待机模式下的任务、音乐播放乃至视频播放;四颗主要芯片以标准的硅工艺制造而成,可以达到更高的频率,同时在运行诸多任务时比双核解决方案功耗更低。这五颗CPU核心均采用ARM Cortex A9架构,它们可以根据工作负荷而单独地启动和关闭。协核心对于操作系统是透明的,这与当前的异步SMP架构不同,这意味着操作系统和应用程序均不知道这个核心的存在,然而却能够自动利用。


根据负载打开不同的处理器

情况一,当机器处于待机、音频播放、视频播放等简单应用时,系统将只调用协处理器,主频从0到500Mhz;

情况二,当机器处于简单网页浏览、简单2D游戏时,系统将调用一颗标准核心,其他核心休眠;主频从0到1.4GHz;

情况三,当机器处于Flash网页浏览以及多任务处理以及视频聊天等,系统将调用两颗标准核心,其他核心休眠,主频从0到1.3GHz;

情况四,当机器处于全负荷的情况下,四个标准核心全部启动,主频从0到1.3GHz。

●低功耗协核心

协核心是利用低功耗工艺技术设计而成的,却拥有和Cortex A9 CPU相同的内部架构,因为他利用低功耗工艺技术制造,以低频率模式运行,所以功耗低于采用高速工艺技术制造的主CPU核心,协核心在500MHz以下工作时可实现高于主核心的每瓦特性能,因此协核心的最高工作频率不高于500MHz。


移动CPU功耗——性能曲线图

协核心主要用于移动设备处于活动待机状态及执行后台任务,同时它还用于不需要强劲CPU处理能力的应用程序;与协核心不同,CPU主核心需要极高频以保证高性能,因此它采用高工艺技术制造而成,这种技术让主核心能够在较低的工作电压下将频率提升至比较高的水平,因此主核心能够在不大幅增加动态功耗的情况先实现高性能。

●操作系统透明化

Android 3.x (Honeycomb) 操作系统内置了针对多重处理的支持,而且能够利用多个CPU核心的性能。 然而,该操作系统会假定所有可用的CPU核心均能够实现相同的性能,并且根据这一假设来为可用的核心调度任务。 因此,为了让操作系统随时掌握协核心和主核心的管理过程,Kal-El 处理器针对协核心和主要的四个CPU核心既采用了基于硬件的管理,又采用了基于低级软件的管理。


功耗曲线

专利的硬件与软件CPU管理逻辑单元不断监控CPU的工作负荷,以便自动而动态地启用和禁用CPU协核心和主核心。 打开和关闭协核心以及主核心的决定完全取决于当前的CPU工作负荷水平以及CPU频率控制子系统所得出的CPU工作频率推荐值。该子系统嵌入在操作系统内核之中。 该项技术不需要对应用程序或操作系统进行任何改动。

Tegra 3带来更好的用户使用体验

前面介绍了Tegra 3处理器在架构上的优化改进及优势,这些对于我们普通消费者来说可能并不直观,下面我们就通过数据对比的方式来给大家展示四核Tegra 3得应用优势。

更快地网页载入速度

目前不少浏览器采用了多线程技术,能够产生多个并发进程,这样浏览器中的每个标签页均为一个单独的进程,每个进程又管理着各自的多个线程,因此标签式浏览器会占用比较大的CPU资源,下面我们通过几组数据来了解在网络浏览时CPU的使用情况,以及四核对比双核处理器的优势所在。


CPU网络浏览时四核CPU系统中的 CPU 使用情况

从图中可以看到,浏览器使用了四核CPU的全部四个核心,而这种并行处理的效果是,与采用双核CPU的移动设备相比,网络浏览体验快多了。 对于这些支持标签式浏览的浏览器,四核CPU还能够发挥出更高的性能。


标签式网络浏览期间四核CPU的使用情况


Moonbat JavaScript 基准测试程序上的四核性能优势

图中显示了当网络浏览器打开多个标签页时,四个CPU核心的使用情况。 事实上,标签式浏览形式会占用相当大的CPU处理能力,而且如图所示,这种浏览可能会占用四核CPU的全部四个核心。

更好地满足高性能应用需求

多核处理器的一个重要优势是能够为高要求应用以及使用场合提供更强的性能,例如照片编辑、视频转码、网络浏览以及多线程游戏。下面通过两组数据来了解一下四核Tegra 3在这方面的优势。


Coremark多核 CPU基准测试结果

Coremark 是一款流行的移动CPU基准测试程序,该程序的测试结果体现了运行多媒体应用时的性能情况,Coremark 显示,四核CPU的性能几乎是双核CPU移动处理器的 2 倍、几乎是单核CPU的4倍。


Photaf 3D Panorama照片处理应用程序上的性能提升

Photaf 3D Panorama是一款评价很高的Android应用程序,该程序让用户能够自动拍摄3D全景照片并将捕捉到的图像拼接起来以备即时查看。在检测边缘以及拼接图像的过程中会涉及大量图像处理,从性能测试结果显示,该处理器在处理和显示所捕捉的全景图像方面几乎比双核CPU移动设备快2倍。


多线程 Linpack CPU基准测试程序上的性能提升

Linpack是一款使用比较广泛的CPU基准测试程序,当处理器运行媒体处理等极耗CPU资源的任务时,该程序可以很好地测量处理器性能。多线程Linpack基准测试程序的测试结果显示,四核处理器的性能几乎比同等双核处理器高出60%,而专为四核处理器而优化的实际应用程序在四核处理器上能够实现更大的性能提升。

更强大的多任务处理能力

移动设备用户一般会同时运行多个应用程序,在这种任务量繁重的多任务处理情况下,单核CPU不仅被多个任务耗尽了处理能力,而且还必须以峰值频率工作才能应付繁重的工作负荷,而在基于四核CPU的移动设备上,操作系统能够根据当前的CPU负荷以及任务/活动的优先级,将工作负荷动态分配给合适的CPU核心。当同时运行多个任务时,如果有多个核心能够用来执行这些任务中排队的请求,那么便可以更快地完成这些请求的执行。

4+1核心架构的优势所在

高速缓存一致性: 因为 vSMP 技术不允许协核心与主核心同时启用,所以在这些以不同频率运行的核心之间不涉及高速缓存同步的补偿问题。 协核心与主核心共享同一个二级高速缓存,我们通过对该高速缓存进行编程,使其以相同的速度为协核心和主核心返回数据。

操作系统效率Android 操作系统假定所有可用的CPU核心均相同,能够实现相近的性能,操作系统按照这一假定的情形来为这些核心调度工作负荷。 当多个CPU核心中的每一个都以不同的异步频率运行时,就会导致这些核心能够实现不同的性能。 这样会造成操作系统在任务调度上效率不高。 与之相比,vSMP 技术则始终让所有活动的核心均保持相近的同步工作频率,从而实现优化的操作系统任务调度。 即便当 vSMP 从协核心切换至另一个或多个主核心时,CPU管理逻辑单元也会确保无缝的过渡,最终用户完全觉察不到这种过渡,而且这种过渡也不会造成操作系统的调度补偿。

功耗优化:在基于异步时钟的CPU架构中,每个核心一般均处于不同的电源层上,以便根据工作频率来调整每个核心的电压。 这会导致整个电压层的信号线以及电源线噪声增大,会对性能造成负面影响。 因为每个电压层均可能需要自己的稳压器,所以这些架构并不像增加CPU核心数量那样易于扩展。 增加稳压器会提高材料单 (BOM) 成本以及功耗。 如果所有核心均使用同一个电压轨,那么每个核心将以最快核心所需的电压运行,如此一来,便失去了可降低功耗的“电压平方”效应优势

比双核更低的功耗、更高的功耗性能比

在我们的印象中多核处理器因为核心数量的增加,相应地在功耗上也要比单核处理器更大,不过对功耗管理来说,核心数量多胜过核心数量少。 例如,四核 CPU 在所有性能水平上均比双核 CPU 的功耗低。之所以会出现这种结果是因为,四个核心能够以更低的频率运行,因此与双核 CPU 相比,在处理同样的任务量时,四核的电压更低。 因为功耗与电压的平方成比例,所以 CPU 整体功耗可实现大幅下降,然而却依然能够完成相同的任务量。

即便在全部四个 CPU 核心均以1GHz 频率运行时,Kal-El 处理器也比双核处理器竞争产品的功耗更低。因为 Kal-El 中的高性能 CPU 核心采用高速工艺技术,所以这四个核心在工作电压比竞争处理器更低的情况下,依然能够以更高的频率工作。因为动态功耗与工作电压的平方成比例,所以Kal-El处理器即便在以更高的频率工作时,也能够大幅节省电力。

游戏性能更出色:GPU核心8颗提升至12颗

图形处理可谓是NVIDIA的老本行了,因此GPU对于NVIDIA来说可谓是驾轻就熟,Tegra 2内置的GPU具备8个处理核心,这次Tegra 3内置的GPU处理核心由之前的8颗升级到了12颗,由此带来了图形性能的成倍增长,并且NVIDIA将很多在桌面显卡上的技术应用到了这里。


GPU中拥有12个核心


Tegra 3将支持3D技术

3倍到底是个什么概念?我们用实际例子展现新型GPU带来的变化。如下面两张图所示,倘若使用搭载Tegra 3处理器的产品进行游戏娱乐,游戏中的水波纹、物理特效、阴影效果都会更加突出、明显,用户会身处一个更加逼真的使用环境中。


游戏效果更加出色


游戏效果更加出色

从另一个大家熟悉的游戏帧数方面来对比,Tegra 3的优势同样十分明显。


高级游戏从四核移动处理器中获得的性能效益

游戏体验越来越出色,随之而来需要下载的内容肯定也是与日俱增,过大的下载量肯定会让很多潜在用户选择放弃。为此,Tegra 3提供实时动态纹理生成技术,该技术允许游戏开发者编写游戏代码,以使游戏中所需的纹理根据游戏的情节和状态实时创建。由于是即时生成纹理的,因此不必在购买时提供。通过这项技术,游戏开发者可以将游戏文件的大小减小几个数量级。这个实时动态纹理生成对性能要求非常高,要求具备多核CPU的性能,这一点,Tegra 3的四核优势就不用多说了。


游戏中的场景变化全部动态生成

基于四核CPU移动设备的推出,或许会成为移动游戏的一个拐点,更加逼真的体验效果将会树立移动游戏体验的新标竿,而这一切新标竿都由Tegra 3设定。

online评测室总结

关于Tegra 3处理器我想可以总结为三点:一是更多的处理核心,更优化的设计方案;二是更好的功耗控制;三是更好更快的使用体验。对于移动处理器来说,功耗待机是一个非常重要的问题,Tegra 3在增加处理器核心的基础上采用协处理器这种4+1的设计方案,既保持了处理器对于高性能的需求,同时协处理器的出现也平衡了在低负载时候手机的耗电。


Tegra 3的优势所在

五倍于Tegra 2的性能更低的处理器功耗,三倍的GPU处理器速度,立体3D显示技术这些都是Tegra 3所具备的优势。


更低的功耗更长的续航

Tegra 3在整体续航时间方面相比Tegra 2都有提升,不过从上面的功耗图中可以看到在视频播放方面Tegra 3的续航要比Tegra 2高出61%,可以连续播放12个小时的视频。

前面我们在文章提到Tegra 3的4颗主核心和协核心是不能同时打开的,并且主核心只能以单核、双核和四核得方式打开,看起来非常智能的Tegra 3似乎还可以更加智能一些,如果主核心和协核心能够同时打开,并且根据需要实现任意组合搭配,这样的设计方案是否更节能呢?当然,这只是笔者的想法而已。


多核移动处理器还在继续

从NVIDIA未来产品规划图中可以看到,NVIDIA对于未来移动处理器已经规划到了2014年,从目前Tegra 3拥有多达四颗处理核心来看,未来移动设备处理器似乎大有赶超PC处理器的趋势。

  • 技术分析第2期:四核处理器Tegra3详介绍
打印 邮件 收藏本页 帮肋
推荐阅读
相关阅读