K6:K6 CPU的設計指數相當高,MMX技術,片內壹級緩存更多(32K指令和32K數據),流水線更深,可以並行處理更多指令,運行時鐘頻率更高。AMD在整數運算上無疑是非常成功的。由於K6擁有更大的L1緩存,隨著頻率的增加,它可以實現比奔騰MMX更顯著的性能提升。K6在運行需要使用MMX或FP(浮點指令)的應用時略顯落後。與同頻率的奔騰MMX相比,即使是沒有MMX的奔騰也差很多,這使得K6在壹些3D遊戲中的表現遠不如英特爾。此外,AMD的MMX單元壹次只能處理壹條指令,而英特爾的MMX單元可以處理兩條指令。因此,K6在執行MMX指令和浮點指令時性能很差。
AMD的K6在處理壹些MMX運算時,處理周期比Intel的CPU短,但是單次運算的吞吐量是壹樣的,更短的處理周期並不能彌補K6不能同時處理兩條MMX指令的不足。雖然英特爾的MMX CPU可以同時處理兩條MMX指令,但其MMX單元只包含壹個乘法單元和壹個移位單元,因此無法同時執行這些關鍵操作。同時,只有壹個MMX指令運算存儲器和整數寄存器才能在浮點處理中發揮作用,所以K6在某些運算上的處理周期還是比Intel短,但是每兩個時鐘周期只能啟動壹個運算,Intel芯片每壹個周期都可以啟動壹個。最終的結果是,對於很多浮點運算,AMD芯片的吞吐量只能達到Intel芯片的壹半。
K6系列CPU I * * *有五個頻率,分別是:166 MHz/200 MHz/233 MHz/266 MHz/300 MHz。五款機型均采用66mhz外接頻率,但後期的233mhz/266mhz/300mhz通過升級主板的BIOS可以支持100 MHz外接頻率。倍頻方面,K6系列從2.5到4.5,核心電壓分別為2.9V、3.2V、2.2V,特別值得壹提的是他們的壹級緩存提高到了64KB,是MMX的兩倍,這也是K6的整數性能優於MMX的原因。
1998年中期,AMD最新的K6-2處理器正式上市。這是第壹個采用3Dnow的!基於微軟Windows操作系統兼容的X86微處理器技術。它采用了全新的矽晶體制造技術(C4倒裝芯片),這是由IBM開發的。它將矽晶體的精度提高到0.25微米,並將K6的原始管芯尺寸從168mm2減小到68mm2。同時晶體數量增加了50萬(達到930萬),其他結構基本和K6壹樣,L65,438+0。此外,它的工作電壓從2.9V/3.2V降至2.2V..AMD在推出K6-2 CPU的時候率先加入了3Dnow!浮點/3D加速技術,64位雙通道浮點緩沖區,21全新3Dnow!指令集,添加SIMD(單指令,多數據)。還有AMD的3Dnow!技術,隨著K6-2的推出,立刻獲得了遊戲廠商、軟件廠商、顯卡驅動的支持,成為重要的工業標準。
K6-3處理器使用0.25微米線程,由2130萬個晶體管組成。K6-3處理器采用三層結構設計。K6-3處理器核心有64K壹級緩存(1級)和256K二級緩存(2級),主板配有三級緩存(3級)。K6-3處理器的壹層和二層緩存壹共***320K,都內置在處理器芯片的核心,和處理器的時鐘頻率相同,這個緩存的執行速度和處理器是全速的。K6-3的三級結構設計可以支持主板上的1024K三級緩存。在Super 7結構的主板上,三級緩存的時鐘頻率為100MHz。相比奔騰II只有32K壹級緩存和512K半速二級緩存,AMD的三級緩存結構可以增加系統的緩存容量,提高系統的整體性能。
K6-3處理器現在支持3D了!指令集3D現在!該指令集類似於英特爾的KNI(Katmai New Instruction)指令集,使用增加指令的方法來加速多媒體處理,如3D繪圖和需要大量浮點運算的應用程序。
由於成本和良率的問題,K6-3處理器在臺式機市場並不是很成功,所以會逐漸從臺式機市場消失,會逐漸進入筆記本市場。AMD將推出專門用於筆記本電腦的K6-3+處理器版本。K6-3+采用0.18微米線程,芯片內置二級緩存。此外,筆記本K6-3+將具有自動升降壓的雙模功能(AMD代號為Gemini),類似於英特爾接下來將推出的筆記本處理器。使用室內交流電源時,K6-3+處理器時鐘頻率高;如果使用電池供電,K6-3+處理器會自動降速以延長電池壽命。
真正讓AMD驕傲的是最初代號為K7的速龍處理器。Athlon有壹個超標量Risc內核,具有超標量、超級流水線和多流水線。采用0.25μ m工藝,集成2200萬晶體管,芯片面積184 mm,目前已經推出了更先進的0.18μ m做工的速龍。下壹步是采用銅線技術。AMD在制造技術上從未落後於英特爾。(athlon.jpg攝)
Athlon包括三個解碼器、三個整數執行單元(IEU)、三個地址生成單元(AGU)和三個多媒體單元(浮點運算單元)。Athlon可以在同壹個時鐘周期執行三條浮點指令,每個浮點單元就是壹個完整的流水線。K7包括三個解碼器,將解碼後的宏操作指令(K7將X86指令解碼為宏操作指令,並將不同長度的X86指令轉換為相同長度的宏操作指令,可以充分發揮RISC內核的威力)送到指令控制單元,指令控制單元可以同時控制(保存)72條指令。然後將指令發送到整數單元或多媒體單元。整數單元可以同時調度18條指令。每個整數單元是壹個獨立的流水線,調度單元可以預測指令的分支,並無序執行。K7的多媒體單元(也稱為浮點單元)有壹個可以重命名的堆棧寄存器。浮點調度單元可以同時調度36條指令,浮點寄存器可以存儲88條指令。在三個浮點單元中,有壹個加法器和壹個乘法器,這兩個單元可以執行MMX指令和3DNow指令。還有壹個浮點單元負責加載和保存數據。由於K7強大的浮點單元,AMD處理器第壹次在浮點方面超過了英特爾處理器。
速龍內置128KB全速緩存(L1緩存),外置1/2頻率、512KB容量的L2緩存,最高可支持8MB L2緩存。大型緩存可以進壹步提高服務器系統所需的巨大數據吞吐量。
速龍的封裝和外觀與奔騰II的SECC卡帶相似,但速龍采用的是Slot A接口規範。Slot A接口源於Alpha EV6Bus,時鐘頻率高達200MHz,使得峰值帶寬達到1.6gb/s,在內存總線上仍然兼容傳統的100MHz總線,目前的PC-100 SDRAM仍然可以使用,保護了用戶的投資,降低了成本。未來還可以使用性能更高的DDRSDRAM,類似於Intel推的800MHz RAMBUS的數據吞吐量。EV6總線最高可支持400MHz,可以完美支持多處理器。都有天然的優勢。要知道Slot1只支持雙處理器,SlotA可以支持4處理器。SlotA看起來和傳統242pin的Slot1很像,就像Slot1反過來是180度,但是它們在電氣規範和總線協議上完全不兼容。插槽1/Socket 370的CPU無法安裝在插槽A插槽的速龍主板上,反之亦然。
AMD為了進壹步拓展3Dnow!軟件平臺的支持範圍,同時關閉原3Dnow!與SSE相比,Athlon處理器提供了增強的3Dnow!技術,增加了24條新指令。其中,19控制指令完全兼容英特爾針對現有64位MMX緩沖區在奔騰III的SSE指令中增加的視頻操作和快速內存預讀指令。因此,為奔騰III的SSE指令集開發的軟件,只需稍加修改,就可以成功轉移到速龍上,發揮強大的MMX緩沖的SIMD加速性能。另壹方面,Athlon增加了五條新指令,可以使CPU像DSP芯片壹樣直接處理模擬/數字信號的轉換。它可用於軟調制解調器、ADSL網絡轉換和傳輸以及杜比AC-3解碼。到目前為止,英特爾的CPU還沒有提供類似功能的指令。顯然,在新壹代處理器指令集的開發上,AMD再次發揮了創新精神。
說了這麽多,Athlon處理器的實際性能如何?對比同樣是600MHz的速龍和600 MHz的奔騰III(至強目前只達到550MHz),速龍(CPUMark99,WinStone99)的整數性能比同頻率的奔騰III快10%左右。對於Athlon來說,浮點性能更令人印象深刻。雖然WinBench99的FPUmark測試值只快了8%左右,但是跨平臺的工業評測標準SPECfp_base95的測試結果卻快了38%左右。3D性能方面,3D WinBench的軟件如3D Winmark、3DMark 99 Max都領先36 ~ 38%。運行3D Studio Max R3.0時,速龍平臺的渲染速度比奔騰ⅲⅲ快33%左右。因為奔騰ⅲ和奔騰ⅲ至強的區別在於L2緩存(至強是全速L2緩存)的容量和速度,如果我們對比只有512KB L2緩存的入門級至強處理器,在運行大部分軟件時,至強只有整數性能比奔騰ⅲ快,浮點性能完全壹樣。所以,在速龍vs奔騰ⅲ&;L2緩存設計的至強Athlon以1/2頻率的實測結果,在任何軟件性能上都全速擊敗了L2緩存設計的至強處理器。
最近AMD推出了Athlon帶800MHz速龍800MHz處理器仍然是SlotA結構,但所有新的速龍處理器都是K75核心。800MHz速龍處理器采用了0.18微米鋁工藝,晶圓面積為102平方厘米。與采用0.25微米線程制造的舊Athlon處理器相比,800MHz處理器的發熱量更低。
根據AMD公布的速龍處理器和奔騰ⅲ處理器的性能測試數據,在Business Winstone 99(Windows NT 4.0)中,速龍800MHz的測試值為42.5,速龍750MHz為465,438+0.4,奔騰733MHz為465,438+0.3。在WinBench 99CPUmark 99中,速龍800MHz的測試值為71.9,速龍750MHz為67.9,奔騰III 733 MHz為65.8;在WinBench 99 FPU WinMark部分,速龍800MHz的測試值為4370,速龍750MHz為4103.3,奔騰III 733 MHz為3890。
所以AMD把速龍處理器定位在至強級別,價格定位在至強和奔騰ⅲⅲ之間,希望進入商業、高端工作站和服務器的市場,這應該是壹個非常有競爭力的市場策略。
奔騰:就是著名的“奔騰”處理器。是Intel在1993推出的新壹代高性能處理器。它的內部代號是P54C。奔騰包含多達365,438+百萬個晶體管,內置16K壹級緩存。時鐘頻率最初是60MHz和66MHz,最後達到200MHz。由於奔騰出色的制造工藝,超頻非常好,就是它的時鐘頻率可以提高1~2,使得超頻逐漸普及。同時,其浮點性能壹舉超越競爭對手Cyrix和AMD。從此,英特爾保住了浮點的桂冠,直到AMD推出Athlon芯片。由於以上原因,奔騰拿下了586級CPU的大部分市場份額。從奔騰75開始,CPU的socket技術正式從之前的Socket4轉變為同時支持Socket5和Socket7,其中Socket7沿用至今,AMD後來發展為Super7,這就是後話了。
奔騰Pro:1996年英特爾推出的第6代X86 CPU。Pentimu Pro包含多達550萬個晶體管,奔騰Pro的壹級(片內)緩存是8KB指令和8KB數據。值得註意的是,Pentimu Pro的壹個封裝除了奔騰Pro芯片之外,還包括壹個256KB的二級緩存芯片,運行頻率與處理器相同。兩個芯片通過高帶寬內部通信總線互連,與系統總線無關。Pentimu Pro最引人註目的是它擁有壹項名為“動態執行”的創新技術,這是奔騰突破超標量架構後的又壹次飛躍。Pentimu Pro主要用於服務器。
奔騰MMX:1996年底推出了奔騰系列的改進版,內部代號P55C,也就是我們通常所說的奔騰MMX。MMX技術是英特爾新發明的多媒體增強指令集技術,英文全稱可翻譯為“多媒體擴展指令集”。奔騰MMX可以說是1999年初之前電腦市場占有率最高的CPU產品。奔騰MMX系列只有三個頻率:166MHz/200MHz/233MHz。壹級緩存由奔騰的16KB提升至32KB,核心電壓2.8v,倍頻分別為2.5、3、3.5。插槽都是Socket 7。
pnt iumⅱ:1997 5月,英特爾推出了與奔騰Pro同級別的產品奔騰ⅱ。奔騰CPU有很多分支和系列產品,其中第壹代產品是芯片代號Klamath。它運行在66MHz總線上,有四個主頻:233MHz、266MHz、300MHz和333MHz。PentiumII采用了與Pentium Pro相同的32位內核結構,加速了段寄存器的寫操作,增加了MMX指令集。英特爾采用CMOS技術,將750萬個晶體管集成到203平方毫米的矽片上。總線方面,奔騰ⅱII處理器采用雙獨立總線結構,即後端總線技術。壹條總線連接到L2高速緩存,另壹條總線連接到內存。為了降低成本,奔騰ⅱII采用了片外的外部緩存,運行速度可以達到CPU自帶時鐘的壹半。在接口技術方面,為了打敗競爭對手,獲得更大的內部總線帶寬,奔騰ⅱ第壹次采用了專利的Slot1接口標準。它沒有采用陶瓷封裝,而是在印刷電路板上制作了CPU和二級緩存。封裝就是所謂的SEC(單邊接觸盒式)卡盒。奔騰CPU有壹個32KB的片內L1高速緩存(16K指令/16K數據)。57 MMX指令;八個64位MMX寄存器。L2緩存是片外同步突發SRAM緩存,512K四路級聯。
賽揚:賽揚是英特爾為奔騰II提出的廉價版本。其核心技術與PentiumII相同。這是占領低價個人電腦市場的壹次嘗試。可以說是英特爾為了搶占低端市場而特別推出的。當然,英特爾也不願意被AMD和Cyrix搶走低端市場的肥肉。賽揚處理器就像沒有L2緩存的奔騰ⅱII。賽揚最初采用0.35微米工藝制造,外部頻率為66MHz,包括266MHz和300MHz。然後來了333MHz,從此采用0.25微米的制造工藝。原來的賽揚犯了壹個錯誤,就是去掉了賽揚的二級緩存。所以它的表現並不理想,成了玩家手中的雞肋。唯壹的好處就是非常抗超頻。隨後,英特爾糾正了這壹錯誤,在賽揚中集成了128KB全速緩存,並且全部采用0.25微米制造工藝。為了區別於最初的賽揚300,它把300MHz集成了128KB緩存的賽揚300A稱為賽揚300 a,後來推出的所有賽揚都內置了128KB二級緩存。
為了進壹步降低成本,英特爾又回到了廢棄的插座結構,因為賽揚的二級緩存是內置的,也就是沒有外置的後端總線,所以把賽揚安裝在壹塊PCB上純粹是多余的。於是英特爾把賽揚做成插座結構,但不再是Socket7而是全新的Socket370。370意味著它有370個管腳,比Socket7 CPU的321管腳多49個,所以兩個插座不兼容。為了讓原Slot1的用戶能夠使用Socket370結構的CPU,出現了Socket370到Slot1的轉換卡。Socket370結構的賽揚,除了接口以外,內核都是壹樣的。賽揚不支持英特爾最新的SSE指令集,但其結構優於奔騰III。賽揚的L2緩存只有奔騰II和奔騰III的四分之壹,但速度與處理器相同。這樣壹來,賽揚的處理器在運行壹般計算負載的應用時,比同級別的奔騰II略差。賽揚和奔騰II/III的另壹個區別是總線速度:賽揚的總線速度目前還是66MHz,總線速度為100MHz的賽揚會在後面出現。
Xeon: Xeon處理器,主要用於高端NT服務器,說明Intel對服務器CPU市場的高額利潤垂涎已久,希望從中分壹杯羹。至強系列處理器擁有x86時代從未有過的強大功能。它與前幾代英特爾微處理器結構兼容;PentiumII處理器在P6微結構中采用雙獨立總線結構和動態指令執行技術。至強處理器內置512KB甚至2MB字節的L2緩存,運行的總線速度與CPU相同。我們看到至強的SEC box是PII的兩倍高,因為它有壹個內置的全速L2緩存。至強最多支持8個處理器,接口不再是Slot1,而是Slot2接口。支持至強的芯片組是英特爾的440GX。
Intel Pentium III:Pentium III的時鐘速度從Pentium II的頂級450MHz躍升,但這並不是Intel這款最新處理器被看重的原因。之所以引起人們的關註,是因為它在多媒體性能上的增強,可以加快需要密集處理和運行的程序。PentiumIII增加了70個其他處理器沒有的指令集:SSE新指令——專為提高3D圖形性能、3D音效和語音識別而設計。此外,奔騰III兼容MMX指令、SSE指令和同步浮點運算,因此為遊戲制造商和其他程序開發者提供了更多更新的多媒體應用。
最新的奔騰ⅲ處理器是壹款代號為Coppermine的CPU,采用0.18微米工藝,包括Slot 1(圖片copperpic.jpg)和new FC-PGA(圖片fcpga1.jpg)兩個型號,外部頻率分別為100MHz和133MHz。為了有效降低處理器成本,英特爾在改用0.18微米工藝後,可以將L2緩存集成到芯片中,其L2緩存容量將提升至256K;類似內置128K的賽揚,可以采用插座結構。銅礦可以封裝在插座槽FC-PGA(倒裝芯片-PGA)中,以降低制造成本。根據英特爾的產品規劃時間表,2000年3月,所有奔騰III處理器將轉換為FC-PGA封裝,即奔騰III處理器將采用與賽揚處理器相同的Socket 370架構,現有的插槽為1架構的奔騰III處理器將成為歷史。在Pentium III處理器從Slot 1架構過渡到Socket 370架構的過程中,Intel仍然會供應Slot 1架構的新Pentium III處理器,而Slot 1架構的新Pentium III處理器的處理器電路板上已經消失了二層緩存,全部集成到Coppermine core中。