SSE 4.1_集成在英特尔芯片中的指令集 - 威林百科weilinceramic.com

SSE 4.1

集成在英特尔芯片中的指令集

集成在英特尔芯片中的指令集的名字，较之SSE4指令集，新指令集多了47条，因此被称为SSE4.1。SSE 4.1指令的引入，进一步增强了CPU在视频编码/解码、图形处理以及游戏等多媒体应用上的性能，增幅最大可达70%。

产品介绍

完整的SSE4(Streaming SIMD Extensions 4，流式单指令多数据流扩张)指令集共包含54条指令，其中的47条指令已在45nm的Core 2上实现，称为SSE 4.1。

SSE 4.1指令的引入，进一步增强了CPU在视频编码/解码、图形处理以及游戏等多媒体应用上的性能。

SSE 4.1版本的指令集新增加了47条指令，主要针对向量绘图运算D游戏加速、视频编码加速及协同处理的加速。英特尔方面指出，在应用SSE4指令集后，45纳米 Penryn核心额外提供了2个不同的32位向量整数乘法运算支持，并且在此基础上还引入了8位无符号最小值和最大值以及16位、32位有符号和无符号的运算，能够有效地改善编译器编译效率，同时提高向量化整数和单精度运算地能力。另外，SSE4.1还改良了插入、提取、寻找、离散、跨步负载及存储等动作，保证了向量运算地专一化。

SSE4.1还加入了6条浮点型运算指令，支援单、双精度地浮点运算及浮点产生操作。其中IEEE 754指令可实现立即转换运算路径模式，大大减少延迟，保证数据运算通道的畅通。而这些改变，对于进行3D游戏和相关的图形制作是具有相当深远的意义。除此之外，SSE4.1指令集还加入了串流式负载指令，可提高图形帧缓冲区的读取数据频宽，理论上可获取完整的缓存行，即单次性读取64位而非原来的8位，并可保持在临时缓冲区内让指令最多带来8倍的读取频宽效能提升。对于图形处理器与中央处理器之间的数据共享起到重要作用。

SSE4.1指令集指令集主要是针对图形及视频编码方面进行了优化，特别是引入了8位无符号最小值和最大值以及16位、32位有符号和无符号的运算，能够有效地改善编译器编译效率，大大减少视频解码处理的时间。所以顺着这个思路，编辑决定把集成有SSE4.1指令集的Penryn核心与传统的处理器进行视频解码速度的对比，由此可以直观的分析出性能提升的幅度。

指令集

45纳米加入了SSE4.1指令集，令处理器的多媒体处理能力得到最大70%的提升。SSE4加入了6条浮点型点积运算指令，支持单精度、双精度浮点运算及浮点产生操作，且IEEE 754指令 (Nearest, -Inf, +Inf, and Truncate) 可立即转换其路径模式，大大减少延误，这些改变会对游戏及 3D 内容制作应用有重要意义。此外，SSE4加入串流式负载指令，可提高以图形帧缓冲区的读取数据频宽，理论上可获取完整的快取缓存行，即每次读取64Bit而非8Bit，并可保持在临时缓冲区内，让指令最多可带来8倍的读取频宽效能提升，对于视讯处理、成像以及图形处理器与中央处理器之间的共享数据应用，有着明显的效能提升。

SSE4指令集让45nm Penryn处理器增加了2个不同的32Bit向量整数乘法运算单元，并加入8位无符号(Unsigned)最小值及最大值运算，以及16Bit及32Bit有符号 (Signed) 运算。在面对支持SSE4指令集的软件时，可以有效的改善编译器效率及提高向量化整数及单精度代码的运算能力。同时，SSE4改良插入、提取、寻找、离散、跨步负载及存储等动作，令向量运算进一步专门。

效能对比

作为在指令集方面的最大改进，SSE 4.1增加了47条指令，着重改善多媒体方面的性能，而据英特尔官方人士称，在SSE 4.1指令集的测试中，使用最新的Divx编码压缩视频，即使相比更高主频的酷睿处理器，Penryn核心处理器依旧可以领先105%以上。为了测试SSE 4.1指令集的实际效能，采用支持SSE 4.1指令集的Divx 6.8编码器，以VirtualDub为平台，压缩一部1080P的影片，测试SSE 4.1指令集带来的改进。

但是测试结果可以说非常不理想，在开启了SSE 4.1支持之后，压缩时间从104分钟增长为123分钟，反而延长了18.27%。看来即使是最新的Divx，对于SSE 4.1的支持依旧不太理想。SSE 4.1指令集带来的改进，只能是期待真正支持的软件发布，才能进行全面的测试。

主流中端PK，Penryn是进步还是倒退

根据了解到的资料，T8300作为未来的主流中端处理器，将要在未来全面取代的T7500处理器，但是这两强的性能究竟孰胜孰负，我们就这两款处理器进行一下全面的比拼。

在比较中，微架构得到改进的Penryn理论性能得到了不小的增幅，在Sisoftware Sandra中取得了9%-26%的增幅，多媒体方面也改进不少，CineBench取得了11%-16%的增幅，是相当可喜的增长。不过在整机性能方面，则可以说是基本持平，差距很小。类似的还有游戏，处理器的发展远远领先于游戏和显卡的发展，相比处理器而言，笔记本的显卡更是游戏的绝对瓶颈。需要注意的是，搭配Penryn处理器的平台，内存性能取得了5%-7%的增长，这是一个相当不错的成绩，而续航时间16%的增长更是让我们欣喜不已，表明英特尔的45nm工艺相当的成熟，功耗得到了很好的控制，而3MB的缓存，相比T7500的4MB自然也省电不少。

整体而言，T8300的整体性能还是要略胜于T7500，续航方面的改进则更具意义。对于主流机型，在Merom平台普遍可以实现150-200分钟的续航，假设升级为Penryn之后续航时间同幅度增长，即将实现175到230分钟的续航，续航时间可以延长近半小时，无疑还是非常具有意义的。

处理器

酷睿2 四核处理器采用了45nm工艺制程，其优点在于进一步的压缩了处理器线路与晶体管的尺寸，紧凑的方式会使处理器在游戏、高清视频等方面实现更高的性能表现，同时也让CPU功耗更低，这更加适合用户进行影音娱乐，因为在看高清电影时，不仅需要处理能力更流畅，也更喜欢电脑运行更安静，相比上一代酷睿2处理器，45nm酷睿2四核处理器在获得40%性能提升的同时也把功耗降低了40%，这让酷睿2四核电脑更加适合高清娱乐，同时更低的功耗，也让厂商可以把家用电脑做的更小、更时尚，噪音也更小，寿命也更长。

相比普通双核电脑，酷睿2 四核电脑的性能翻倍，功耗却控制的更低，那么是否意味着，它的成本也翻倍呢？实际上并非如此，由于45纳米技术的不断成熟，酷睿2四核CPU的售价已经不再非常高，甚至有的酷睿2四核CPU与双核CPU持平，譬如酷睿2双核E8000系列和四核Q8000系列的价格差距就相当小，使得众多PC厂商纷纷推出酷睿2四核台式机。而从市售产品情况来看，酷睿2四核的分布非常广泛，有4000元以内的低价机型，也有5000元左右的主流娱乐机型，更有价格8000元甚至万元的高端机型，而且性价比表现都非常不俗，对于消费者而言，则可以根据个人实际应用需要，买到一款适合自己的酷睿2四核电脑。

酷睿2 E8200散片

酷睿2 E8200仍采用LGA775接口，生产批次为O748A127，是专供OEM的正式版处理器。最大工作电压为1.225V，产品封装地仍然是马来西亚工厂。

酷睿2 E8200的实际主频为2.66GHz，共享式L2缓存容量为6MB，前端总线为1333MHz，外频为333MHZ，倍频为8，供电需符合06规范。该产品采用最新的45nm工艺制造，采用Wolfdale核心架构，由4.1亿个晶体管组成，相比之前65nm的2.91亿个晶体管有了很大的提升，其支持MMX、SSE、SSE2、SSE3、SSSE3、SSE4.1多媒体指令集，具备EM64T 64位运算指令集、EIST节能技术。

[编辑点评]：由于其采用的是45nm工艺，这样就很好的控制节能和静音等因素，同时也提高其超频能力。

酷睿2 Q9300散片

酷睿2 Q9300处理器采用了45nm工艺制造，接口为LGA775，它的主频为2.5GHz，外频为333MHz，倍频为8。它的前端总线为1333MHz，L2缓存容量高达6MB，供电需符合05A标准。

该产品采用45nm制程工艺，核心属于Yorkfield，市场上的大部分P35主板都可支持。从外观上看，酷睿2 Q9300与酷睿2双核系列没有较大差别，但由于其基于45nm生产工艺，而且拥有较高的主频和L2缓存，相信其会带来更大的性能提升。另外，官方还没有这款产品的详细资料。

Q9300和其他9系列产品相比，在二级缓存上是有所缩减的。Q9450、Q9550拥有12MB的二级缓存，而Q9300只具备6MB的二级缓存，整整缺少了一半，这可能是Intel有意屏蔽了Wolfdale二级缓存后的结果，配合全新的倍频模式，Intel能够将产品的定位更加精确化，甚至每20美元的间隔都将出现一款Intel的产品。而其他的主要参数，Q9300和9系列产品都是完全一样的。

和Q6600的参数相比，Q9300有着明显的优势。在制造工艺上，Q9300采用了更加先进的45nm制造工艺，而Q6600则是65nm制造工艺的产物；在前端总线部分，Intel将Q9300的前端总线升级到1333MT/s，Q6600为1066MT/s；二级缓存方面，Q6600的二级缓存达到了8MB，Q9300只有6MB；晶体管数量上二者的差距也很大，Q9300是由两颗4.1亿晶体管的Wolfdale拼装而成，Q6600则是由两颗2.91亿晶体管的Conroe拼装而成。

而对于Q6600而言，Q9300最大的进步就是增加了SSE4.1指令集。在具备新指令集的应用类软件中，Q9300能够表现得更加得心应手。

[编辑点评]：作为Q6600的取代者，Q9300即将成为Intel最廉价的4核心处理器。和之前的Q6600相比，Q9300有着不争的优势：全新的制造工艺、前端总线速度的提升、SSE4指令集的应用、电源管理的完善以及处理器微架构的改变。Q9300的二级缓存被缩减到6MB，但是在性能实测中，6MB的二级缓存并不影响Q9300的表现。

优点

高温的确是硬件的杀手，不但会导致系统不稳定，更严重的可能造成芯片内部的晶体结构损坏，而对温度尤为敏感的硬件就要数CPU了。一款搭配普通的风扇也能工作的十分稳定的处理器特别被一些玩家与家庭用户所关注，那么对于担心处理器长时间使用会过热的朋友不妨一起来关注一下Intel Core 2 (酷睿2)Duo E7400这款双核处理器。

Intel 的酷睿2 Duo E7400是出自Intel 新的45nm体系中的产品，采用了Wolfdale核心，提供了强劲性能的同时将TDP控制在了65W，这一点是市面双核处理器所无法比拟的。

Intel Core 2 Duo E7400拥有2.8GHz的时钟频率，FSB总线速度为1066MHz，3MB的L2 Cache，尽管没有与E8400的6MB L2 Cache差距不小，但是全速的Cache设计使其在有游戏中的表现于E8400差距并不是非常悬殊，同时也更好地控制了发热量。支持指令集有：MMX、SSE、SSE2、SSE3、SSSE3、SSE4.1、EM64T，丰富的指令集是E7400拥有出色的实际应用表现。

眼前天气渐热，考虑到自身凉爽舒适的同时，朋友们也肯定考虑到自己的爱机能不能在这个夏天继续稳定工作吧，高主频、大缓存必然会带来一定性能的提升，但是功耗和发热量也随之增高，一款保证用户工作效率同时又拥有低发热量和低功耗的处理器更是值得关注一下。

对比特点

SSE4.1指令集效能对比测试

作为近年来在指令集方面的最大改进，SSE 4.1增加了47条指令，着重改善多媒体方面的性能，而据英特尔官方人士称，在SSE 4.1指令集的测试中，使用最新的Divx编码压缩视频，即使相比更高主频的酷睿处理器，Penryn核心处理器依旧可以领先105%以上。为了测试SSE 4.1指令集的实际效能，我们采用支持SSE 4.1指令集的Divx 6.8编码器，以VirtualDub为平台，压缩一部1080P的影片，测试SSE 4.1指令集带来的改进。

主流中端PK，Penryn是进步还是倒退

参考资料

http://www.51nb.com/viewnews-39010-page-7.html..

http://www.sosol.com.cn/html/2009/20097/200972_165481_7.html..

http://notebook.pconline.com.cn/testing/acc/0801/1200218_4.html..

最新修订时间：2023-06-29 21:06

条目作者

小编

资深百科编辑

概述

产品介绍

参考资料