Yonah是英特尔处理器
酷睿core的开发代号。采用Yonah核心CPU的有双核心的Core Duo和单核心的Core Solo,另外Celeron M也采用了此核心,Yonah是Intel于2006年初推出的。
处理器简介
这是一种单/双核心处理器的核心类型,其在应用方面的特点是具有很大的灵活性,既可用于桌面平台,也可用于移动平台;既可用于双核心,也可用于单核心。Yonah核心来源于移动平台上大名鼎鼎的处理器
Pentium M的优秀架构,具有流水线级数少、执行效率高、性能强大以及功耗低等等优点。Yonah核心采用65nm制造工艺,
核心电压依版本不同在1.1V-1.3V左右,封装方式采用PPGA,接口类型是改良了的新版Socket 478接口(与以前台式机的Socket 478并不兼容)。在
前端总线频率方面,Core Duo和Core Solo都是667MHz,而Yonah核心Celeron M是533MHz。在二级缓存方面,Core Duo和Core Solo都是2MB,而即Yonah核心Celeron M是1MB。Yonah核心都支持
硬件防病毒技术EDB以及节能省电技术EIST,并且多数型号支持虚拟化技术Intel VT。但其最大的遗憾是不支持64位技术,仅仅只是32位的处理器。值得注意的是,对于双核心的Core Duo而言,其具有的2MB二级缓存在架构上不同于所有X86处理器,其它的所有X86处理器都是每个核心独立具有二级缓存,而Core Duo的Yonah核心则是采用了与IBM的多核心处理器类似的缓存方案----两个核心共享2MB的二级缓存!共享式的二级缓存配合Intel的“Smart cache”共享缓存技术,实现了真正意义上的缓存数据同步,大幅度降低了数据延迟,减少了对前端总线的占用。这才是严格意义上的真正的双核心处理器!Yonah核心是共享缓存的紧密型耦合方案,其优点是性能理想,缺点是技术比较复杂。不过,按照Intel的规划,以后Intel各个平台的处理器都将会全部转移到Core架构,Yonah核心其实也只是一个过渡的核心类型,从2006年第三季度开始,其在桌面平台上将会被Conroe核心取代,而在移动平台上则会被Merom核心所取代。
Merom相比Yonah,从原来的13级管线增加至14级,在提升频率方面起到一定的作用 缓存方面,Merom分成4MB和2MB的L2两种版本,与Yonah保持一致的是,不管4MB还是2MB,都由双核心共享,这样双核运算需要的数据就可以共享了。不过在
L2缓存的访问入口方面,Merom已经从Yonah的8路提升16路(Athlon 64同样是16路)。 解码器方面,Merom比Yonah增加一个Simple解码器,令解码效率进一步提高。不过在复杂运算方面,AMD Turion 64内置的3个Complex解码器会更加优胜(例如在Science Mark 2.0科学运算中); 指令集方面,Merom在Yonah的Micro Fusion(微指令集融合)技术基础上更上一层楼,添加Macro Fusion(宏指令集融合)技术。这种宏指令集融合技术比微指令集融合技术的应用更为广泛,如If和Jump指令结合,以增加执行效率; 执行单元方面,Merom比Yonah多出一个FPU和一个IEU(IEU也是我们平常说的ALU),因此在一个时钟周期里,可以向执行单元传输3个微指令集,而Yonah只能传输2个。不过这三个FLU当中,是有固定的任务分配的。浮点乘运算必须由第三个FPU执行、浮点加运算只能由第二个只能执行,而浮点减运算则相对自由,只要第二和第三FPU是空闲在下一个周期还是空闲的就被能利用上。除此以外,传输通道从Yonah的64位升至128位,这样要执行一个SSE3的指令的话,就只需要一个时钟周期了。
技术分析
总体介绍
Yonah双核心拥有1亿5千1百万晶体管,保持
Pentium M较少的14 级流水线架构,因此频率虽然只有2.16GHz,但效能却直追3GHz以上的
Pentium D双核心处理器,核心内部拥有2MB
L2 Cache供两颗核心同用,称为Intel Smart
Cache技术,有助减低Intel旧有双核心架构出现的Cache读取的严重延迟,除此之外,核心特别加强了
SSE/
SSE2 Micro Ops Fusion运理能力、而且首次在行动处理器中加入
SSE3指令集,主要针对多媒体的效能改善,另外Floating Point部分亦有一定程度的强化增强3D游戏的执行效果。外频方面,Yonah将会由上代Pentium M
Dothan核心533MHz FSB提升至667MHz FSB,以更高的频宽应付双核心带来更大的数据传送。
Yonah亦是首颗支持Intel
Virtualization功能的行动处理器,它可以令系统能够同时间支持多个操作系统,可惜的是它并不支持
EM64T功能,算是唯一的美中不足。虽然65奈米拥有较低的功耗表现,但由于Yonah的双核心始终因为晶体管数量上升而功耗亦较上代单核心的Dothan较高,为了提高电池的续航能力,Intel亦加入了Enhanced Intel Deeper Sleep功能,以减低不必要的电源消耗,令Yonah双核心的实际使用时间与上代Dothan大致相当。
接口设计
Yonah核心的Pentium M针脚定义改为478 pins和上代Pentium M的479pins略有不同,就算是单核心版本的Yonah也未必能在i915G/PM芯片组上运行。此外,早前Intel公布有关Yonah处理器数据时,它的处理器接口为mPGA 478或BGA 479,因此不少读者会误以为Yonah兼容旧有Socket 478的Pentium 4主机板,但大家留心对比,Pentium 4处理器的针脚排列和Pentium M Yonah核心并不相同,因此两者互不兼容。
Pentium M Yonah双核心处理器,在内部架构上作出了大幅改良,全新的Smart Cache架构有效加强双核心的效率,传统的双核心设计每个独立的核心都有自己的L2 Cache,但Yonah双核心的Smart Cache架构则是透过核心内部的Shared Bus Router共享相同的L2 Cache,因此当CPU 1运算完毕后把结果存在L2 Cache时,CPU 0便可透过Shared Bus Router读取CPU 1放在共享
L2 Cache上数据,大幅减低读取上的延迟并减少使用FSB频宽,更加入L2 & DCU Data Pre-fetchers及Deeper Write output缓冲
存储器,增加了Cache的命中率。就算是现时K8的双核心L2 Cache架构,也是比不上Smart Cache设计,因为共享L2 Cache能进一步减少了Cache Misses的情况,当CPU 0在读取自己的L2 Cache,发现没有该笔数据才会要求读取CPU 1的L2 Cache数据,情况等同于CPU 0的L3 Cache,而共享的L2 Cache设计却没有以上需要。
优秀的Smart Cache设计
Smart Cache架构还有很多不同的好处,例如当两颗核心工作量不平均时,如果独立L2 Cache的双核心架构有机会出现其中一颗核心工作量过少,L2 Cache没有被有效地应用,但另一颗核心的L2 Cache却因工作量重,L2 Cache容量没法应付而需要用上系统内存,要注意的是它并无法借用另一颗核心的L2 Cache空间,但SmartCache却没有这个问题,因为L2 Cache是共享的。
Shared Bus Router除了更有效处理L2 Cache读取外,还会为双核心使用FSB传输时进行排程,新加入的Bandwidth Adaptation机制改善了双核心共享FSB时的效率,减少不必要的延迟,其实这个Shared Bus Router设计确实有点像K8的System Request Interface及Crossbar Switch的用途。
另外,SmartCache架构用在行动处理器亦有很大的优势,例如系统工作量不多或是处于闲置状态,Yonah处理器可以把其中一颗核心关掉,以减少处理器的功耗,不过却可以保持2MB L2 Cache运是保持工作,而且Shared Bus Router更可以因应L2 Cache的需求量改变L2 Cache的大小,在不必要时关掉部份L2 Cache以减低功耗,但在独立L2 Cache的双核心,如果要把其中一个Cache关掉,则必需要把其中一颗核心的L2 Cache数据移交出来,而且Cache亦会和核心同时被关闭,而且更没法因应需求实时改变或关掉部份L2 Cache的容量以减低功耗。
Enhanced Intel Deeper Sleep技术
新一代Pentium M Yonah
双核心
处理器,将会被加入强化的休眠模式称为Enhanced Intel Deeper Sleep,在C-State闲置状态中新增加强版C4模式。已往Pentium M处理器可以在处理器被闲至时,由C0的Active活跃状态进入C1的HALT暂止模式减慢处理器的频率,再进一步可由C1的HALT进入STOP CLOCK令处理器完全停止工作,当处理器在一段时间在STOP CLOCK状态没有被回复过来,系统将会进入C3/C4的Deep Sleep及Deeper Sleep状态。
Deep Sleep及Deeper Sleep可把在停止工作的处理器电压降低,进一步减低电力消耗令电池更长寿,但却不能完全把处理器完全被停止,因为处理器停止工作,但其实处理器内的L1及L2还被储存着数据,把整颗处理器停掉将令L1及L2数据流失,无法把系统由Deep Sleep状态下回复至Active,不过新一代Pentium M双核心处理器Yonah的Enhanced Intel Deeper Sleep支持把L1及L2的数据备份进系统内存,因此处理器可以被完全停止,需要时只要把系统内存的L1及L2数据,回复至处理器便可,Intel透露Enhanced Intel Deeper Sleep将比Deeper Sleep省电30%以上。
无线网卡配置
在无线网卡上INTEL将现有的2915ABG替换为新型的3945ABG,3945ABG体积更加小巧,只有原来的2915ABG的一半大小,这对于那些轻薄小巧的便携型
笔记本来说确实是好消息,而对于普通的
笔记本电脑意义不大,同时3945ABG的集成度更高,原来制造一块2915ABG需要将近300个元件,现在在3945ABG上只要90个就可以搞定了。
基本上,3945ABG只是现有2915ABG的改良版,规格细节上差异不大,改良的重点集中在讯号处理及WoWLAN(Wake on WLAN)上,像很多媒体大惊小怪的Cisco Compatible Extensions(Cisco延伸的安全性规范),其实英特尔现在的产品就已经支持了。
不过,对于无线网络而言,好用的
软件其实是非常重要的,却经常被人所忽略,尤其是现在无线网络的安全问题已经被人所重视,但如果安全设定并不方面易用,导致乏人问津,问题等于没有解决。
从这个角度而言,3945ABG最重要者,莫过于英特尔PROSet/Wireless Software v10.0,以及支持且采用Cisco Business Class Wireless Suite(商用等级的无线网络软件套件)与Avaya的SIP Softphone(SIP协议的软件网络电话),这些将改进安全性、易用性与无线
VOIP的可用性。
Yonah的产品线基本上包括标准电压版(SV:Standard Voltage)、低电压版(LV:Low Voltage)、超低电压版(ULV:Ultra Low Voltage)三种不同功耗的版本,这与Dothan的划分相同。Intel对OEM厂家表示TDP将会有所提高,主要是受双核心的影响,SV版为31W(现时该版本的Dothan为27W)、LV版15W(现时该版本的Dothan为12W)。
不过,影响电池驱动时间的平均耗电与现时的Dothan相比估计没有太大的变化。如果平台总的平均耗电没有增大的话,与Sonoma相比其实就是有所改善。支持这种说法的理由主要有几个,首先Yonah的节电技术是经过大幅改良的,引入了称为Intel Dynamic Power Coordination的节电技术,通过这一技术,两个核心切换到节电模式时既可同时控制也可分别进行控制。CPU根据OS的状态而提供了多个节电模式。如Banias代处理器分为C0(普通使用)、C1(Halt指令生效时的待机状态)、C2(频率停止)、C3(睡眠)、C4(进一步的睡眠)等5种状态。
Yonah的两颗核心可以根据各自核心的CPU负荷,独自切换节电模式,而且还可以同时进入到同一个模式。如CPU的处理量并非太大,而处于电池驱动状态下时,其中一颗核心以C0(普通使用)模式运行而另一颗核心则可以以C2(频率停止)运行。但是Yonah并未为两个核心分别配置提供频率的PLL以及电压转换器(VoltageRegulator),因此单个核心无法单独进入需要降低CPU电压的C3或C4模式,也无法使用CPU电压/频率需要变化的
SpeedStep技术,总的来说就是无法使用两个核心的电压/频率需要分别控制的方式进行节电,因为需要2个电压变换器和PLL。
不支持64bit指令集以及Hyper Threading技术
Yonah支持开发代号为Vanderpool技术的Intel Virtualization Technology,但并不支持总称为X64的64bit指令集EM64T以及Hyper Threading技术(HT)。
关于这方面Intel移动业务部移动平台组的拉马解释,“不支持EM64T和HT技术并非技术层面上的问题,纯粹是市场上的原因”,由于现时支持X64的软件仍相当欠缺,因此Yonah不支持X64也是理所当然的事,同时当初支持X64的64bit软件也只是以工作站等高端领域为目标。而对于内存插槽只有2条的笔记本电脑来说,内存容量需要增加到4GB所需过程要比台式机要长的多,因此这样的选择是相当合理的。
实际上,在后一代
移动处理器Merom 上,已经开始支持这两项技术。
技术比较
英特尔Yonah与Merom
继服务器处理器WoodCrest及桌面处理器Conroe陆续面市后,新一代
Core微架构移动处理器Merom亦正式登场,虽然Intel声称全新
Core微架构整合Mobile架构的省电高效率及上代桌面Netburst的功能,并为多核心应用作出优化,但Core微架构却很难找到半点Netburst的影子,由于其设计接近90%是基于Mobile架构的Yonah而作出改良,仅保留Netburst架构的Prefectching,英特尔此举明显希望为上代Netburst的失误给予完美的下台阶。
尽管Intel Core微架构是基于Mobile平台的Yonah核心所设计,但却有超过7成的架构和线路被重新改良,并加入5项主要的改革,包括Intel Wide Dynmaic Execution、Intel Intelligent Power Capability、Intel Advanced Smart Cache、Intel Smart Memory Access及Intel Advanced Digital Media Boost。
Intel Wide Dynamic Execution -- Merom处理器拥有4组Decoder (3 Simple decoders + 1 Complex Decoders),比上代Yonah核心多出1组(2 Simple Decoders + 1 Complex Decoders) 可多处理1组Simple Coder指令,进一步提升每周期的执行效率及提升处理器的能源效益。
虽然Merom的Pipeline Stage由Yonah的13 Stage轻微上升至14 Stage,但Merom的Branch Predictor Bandwitdh提升20Bytes(Yonah为16Bytes), 因此其分支预测的能力及准确性效率保持相若。
此外,Merom处理器不单保留了Micro-op Fusion技术,并同时追加全新的 Macro-Fusion 技术,在旧世代的微架构中,每个指令被送来时其译码及执移动作是完全独立的,但Intel Core微架构可以让常见的指令组,例如1个Compare指令配随后拥有1个Jump指令,组合成单一的Micro-Op指令,这令Merom处理器在特定情况下每个周期有运算5组指令,据Intel表示,大部份x86程序,约每10至15个指令就会出现1组可透过Macro -Fusion被组合,因此减少了程序执行所需运算时间、提升性能却不会增加处理器的功耗,为此Intel亦改良ALU(Arithmetic Logic Unit)部份以支持Macro-Fusion技术。
Intel Intelligent Power Capability -- Merom处理器的晶体管数目对比Yonah大幅提升,功耗消耗亦会相对增加,而为令Merom处理器的功耗表现保持于合理水平,Merom加入Ultra Fine Grained省电设计,细微的逻辑控制机能独立开关各运算单元,只有需要时才会被开启,避免闲置时出现不必要的功耗浪费,称为 Sleep Transistors技术,此外,把核心各个Buses及Array采用独立控制其VCC电压,当此部份被闲置时,将会被运作于低功耗模式中,因此Merom处理器在功耗表现可保持和Yonah处理器相约。
Intel Adcanced Smart Cache -- 早在Yonah处理器中,Intel已加入了Smart Cache架构,通过核心内部的Shared Bus Router共享相同的L2 Cache,而Merom进一步加强Prefetch能力,每颗核心均拥有3个独立Prefetchers (2 Data and & 1 Instruction) 及2个L2 Prefetchers,能同时地侦出Multiple Streaming及Strided Acess Patterns,L2 Cache方面比Yonah倍增至 16-Way 256Bit 4MB容量,但Latechy却保持在12-14ns之间,令Merom处理的Cache架构性能进一步提升。
Intel Smart Memory Access -- 为了提升内存读取效率, Merom处理器加入全新的内存读取技术称为Memory Disambiguation,透过Out of Order过程把内存读取次序作出分析,当发现某数据是完全独立,则可让它提早执行以减少处理器的等候时间减少闲置,同时减低内存读取的延迟值。
Intel Adavanced Digital Media Boost -- Merom处理器拥有128Bit-SIMD interger arithmetic及128bit SIMD双倍精准度Floating-Point Operations。传统的处理器设计只有64Bit的SIMD interger arithmetic及Floating-Point Operations,因此在执行 128Bit的SSE、SSE2及SSE3指令时,需要把指令分拆为2个64Bit指令,并需要2个频率周期完成,但Core微架构则只需要1个频率调期便能完成,执成效率提升达1倍,现时SSE指令集已经十分普遍地用于主流的软件中,包括绘图、影像、音像、加密及数学运算等用途,单周期128Bit处理器能力以频率以外的方法提升性能,令处理器拥有高能源效益表现。
英特尔Yonah与Dothan
Yonah相对于Dothan的改进:
Yonah相对于Dothan最明显的改进是它的双核心。不过由于Yonah采用的是65nm工艺,因此虽然有两个核心但是它的尺寸却和一个核心的Dothan一样大。换句话说,Intel制造出一个双核心的Yonah和制造单核心Dothan几乎是一样的成本。这样说的主要原因并不是它的尺寸,事实上Yonah虽然有两个核心,但是它的二级缓存仍然是2M。和Pentium D不同,Yonah的2M 二级缓存并不是分离成两个1M的二级缓存,而是双核心共享一个完整2M二级缓存。这是一个非常重要的差别,这意味着Yonah远不是把两个Dothan合并在一起那么简单。
Yonah的主要性能改进围绕在SIxx FP和FP性能方面,这是目前的Dothan和Pentium 4相比的两个最大弱点。共有三点改进:首先的改进是,Yonah的解码器可以解码
SSE指令,而不管指令的类型。改进解码的宽度可以快速改善处理器的性能。其次是SSE/SSE2运行,目前Yonah可以使用Micro Ops Fusion engine,这可以有益于增强性能和低电量消耗。Yonah的两个核心都支持SSE3指令,非常类似于Pentium 4 E(Prescott)。第三,Yonah的浮点运算性能也有了一些改进,浮点运算性能的改进对于处理器的游戏性能有非常大的影响。
Yonah和Dothan的性能对比测试:
Yonah的性能在实际应用中究竟比Dothan有多大的提升,我想这是人们非常感兴趣的问题。接下来我们就对Yonah和Dothan的性能进行一个对比测试,不过遗憾的是由于我们的Yonah的频率是2.0GHz,而用于对比的Dothan的频率是2.13GHz。因此我们无法获得同频率的公平性能对比。
我们首先进行的是缓存反应时间测试,使用的是ScienceMark 2.0,这项测试时钟频率高低并没有影响。从图表可看到Yonah的一级缓存反应时间和Dothan一样,但是二级缓存要比Dothan慢。我认为这可能是由于Yonah采用了最新的二级缓存动态调节技术的原因。这项技术是为了节省电能消耗对双核心共享二级缓存进行的优化,在系统需求低的时候Yonah会自动调节二级缓存的尺寸,从而使二级缓存反应时间变慢。
1、最高频率的Yonah双核处理器,其性能比Sonoma平台上频率最高的Dothan核心处理器(2.26GHz)高出68%以上
2、在相同的显卡配置下,最高频率的Yonah双核处理器在Quake 4测试中帧频达到76FPS,而2.26GHz的Dothan核心处理器成绩只有41FPS——Yonah处理器相比Dothan处理器,在FPS性能上平均提高50%~70%
3、Yonah双核处理器前端总线提高到667MHz,而Dothan核心的处理器只有533MHz
4、在PCMark05测试中,最高频率的Yonah双核处理器,得分比Sonoma平台上频率最高的Dothan核心处理器(2.26GHz)高出31%
5、在3DMark05测试中,最高频率的Yonah双核处理器,得分比Sonoma平台上频率最高的Dothan核心处理器(2.26GHz)高出105%
6、在SPECint测试中(测试处理器整数运算性能),最高频率的Yonah双核处理器,得分比Sonoma平台上频率最高的Dothan核心处理器(2.26GHz)高出68%
虽然Yonah双核处理器性能强大,不过Intel却在功耗问题上并没有明确表态。当被问到Napa平台相比Sonoma平台,电池使用时间是变长还是变短时,Intel表示由于采用Napa平台的笔记本电脑产品还没有完成,声称还不清楚具体结果。不过Intel希望Napa平台在电池使用时间上能超过的Sonoma平台,Intel表示虽然Yonah处理器的功耗更高,但是相关部件的电力利用率提高了28%以上,这为提高电池使用时间创造了有利条件。Intel希望采用Napa平台的14、15英寸的笔记本电脑,能将电池标准使用时间提高到5小时。
测试评价
新的处理器接口
Intel在Yonah上使用了新的接口,因此与Pentium M不兼容。在推出Pentium M的时候,Intel同时推出了一种全新的处理器接口,Socket 479,比当时Pentium 4使用的Socket 478多一根针,就是这一根针彻底打消了将Pentium M用在Pentium 4主板上的可能性。
尽管Yonah针脚数量与Pentium M是一样的,都是479根,但是布局完全不同了,这也就以外着两种处理器根本不可能用在同样的主板上,更何况芯片组等也不兼容。
同样的大小,双倍的内核
相对于Dothan,Yonah最明显的改进是双内核。得益于65nm的制造工艺,双核的Yonah和单核的Dothan内核面积基本相同,这对Intel意味着生产Yonah比Dothan成本差不了多少。
核面积没有增大的另外一个重要原因是二级缓存没有增大,和Dothan一样是2MB。与Pentium D不同,Yonah中2MB的二级缓存没有分成两个单独的1MB缓存,两个内核共享2MB二级缓存。这是非常重大的不同,意味着Yonah并不是简单粘在一起的两个Dothan。
Yonah内核的改进集中于浮点运算,这正是Pentium M比Pentium 4瘸腿的地方。
第一个改进是Yonah的三个解码器都能够执行各种类型的
SSE指令,处理器解码器带宽的增加能极大的提高整体性能。
其次,所有SSE和
SSE2操作都能够使用Yonah中的微操作融合(Micro Ops Fusion)引擎。这项改进能在提高性能的同时保持很低的功耗。但具体的性能细节只能到明年Yonah产品大量上市后才能得到。另一个方面的改进是Yonah的两个内核都支持
SSE3,就象Pentium 4E(Prescott)。
除了这些,Intel还采取了很多措施提高浮点运算性能,而浮点运算主要用于游戏,可见Intel在Yonah上如此功夫意图深远。
SSE和浮点运算的改进Intel合称Digital Media Boost。这个名字将来可能会象MMX一样好笑,但对于来说还是很有有震撼力。