壹個完整的微機系統包括硬件系統和軟件系統。計算機硬件是指組成計算機的各種物理設備。它們由各種真實的器件組成,是計算機工作的物質基礎。計算機硬件系統最重要的部分是中央處理器(CPU)。
(壹)CPU的基本概念和組成
CPU(中央處理器)是計算機系統的核心,主要包括運算器和控制器。如果把電腦比作壹個人,那麽CPU就是心臟,其重要作用由此可見壹斑。CPU的內部結構可以分為三部分:控制單元、邏輯單元和存儲單元。如果這三個部分相互協調,我們就可以分析、判斷、計算和控制計算機各部分的協調工作。
計算機的所有動作都由中央處理器控制。運算器主要完成各種算術運算(如加、減、乘、除)和邏輯運算(如邏輯加、邏輯乘、邏輯反);控制器沒有運算功能,只是讀取各種指令,分析並做出相應的控制。通常CPU中有幾個寄存器,可以直接參與運算,存儲運算的中間結果。
我們常說的CPU就是X86系列和兼容的CPU。所謂X86指令集,是美國Intel公司為其第壹個16位CP U(i8086)專門開發的,美國IBM公司在1981年推出的世界上第壹臺PC中的CPU— i8088(i8086簡化版)使用了X86指令。同時,計算機中為提高浮點數據處理能力而加入的X8 7芯片系列數學協處理器使用X87指令,X87指令集和X87指令集將統稱為X86指令集。雖然隨著CPU技術的不斷發展,Intel相繼開發了更新的i80386和i80486,甚至今天的Pentium III系列,但是為了保證計算機能夠繼續運行過去開發的各種應用程序來保護和繼承豐富的軟件資源,Intel公司生產的所有CPU仍然繼續使用X86指令集。除了Intel,AMD、Cyrix等廠商也生產了可以使用X86指令集的CPU。因為這些CPU可以運行為Inte l CPU開發的各種軟件,計算機行業的人把這些CPU列為Inte l的CPU兼容產品。由於Intel X8 6系列及其兼容CPU都使用X8 6指令集,所以形成了今天龐大的X86系列及兼容CPU陣容。
(二)中央處理器的主要技術參數
CPU的質量直接決定了壹個計算機系統的檔次,CPU的主要技術特性可以反映CPU的壹般性能。
CPU能同時處理的二進制數據的位數是其最重要的質量標誌之壹。人們通常指的是16位計算機和32位計算機,也就是說這種微機中的C PU可以同時處理16位和32位二進制數據。早期的代表IBM PC/XT、IBM PC/AT和286計算機為16位計算機,386和486計算機為32位計算機,586計算機為64位高端微型計算機。
CPU按其處理信息的字長可分為八位微處理器、十六位微處理器、三十二位微處理器和六十四位微處理器。
位:在數字電路和計算機技術中,采用二進制編碼,編碼只有“0”和“1”,其中“0”和“1”都是CPU中的壹位。
字節和字長:在計算機技術中,單位時間內(同壹時刻)CPU壹次能處理的二進制數的位數稱為字長。因此,能夠處理字長為8位的數據的CPU通常稱為8位CPU。同樣,32位CPU在單位時間內可以處理32位二進制數據。因為常用的英文字符可以用8位二進制表示,所以8位通常稱為壹個字節。字節的長度不是固定的,字長的長度對於不同的CPU是不壹樣的。壹個8位的C PU壹次只能處理壹個yu段,而壹個32位的CPU壹次可以處理4個yu段。類似地,64位CPU壹次可以處理8個字節。
2.CPU外部頻率
CPU外部頻率,即常用特性表中所列的CPU總線頻率,是主板為CPU提供的參考時鐘頻率,CPU的工作主頻按照倍頻系數乘以外部頻率。奔騰時代,CPU的外接頻率壹般是60/60/66MHz。從奔騰II 350開始,CPU的外接頻率提高到100 MHz。壹般情況下,CPU總線頻率和內存總線頻率是壹樣的,所以當CPU外接頻率提高時,和內存的交換速度也相應提高,對提高電腦整體運行速度影響很大。
3.FSB頻率
前端總線又稱CPU總線,是CPU與內存、L2緩存(僅指Socket 7主板)之間交換數據的工作時鐘,因為前端總線的頻率與目前各種主板上內存總線的頻率相同。因為數據傳輸的最大帶寬取決於數據位的寬度和傳輸頻率,即數據帶寬=(總線頻率(數據寬度)/8。比如Intel的Pⅱ333使用的是6 6MHz的前端總線,所以它與內存的數據交換帶寬是528MB/s =(66×64)/8,而它的Pⅱ350使用的是100MHz的前端總線,所以它的峰值數據交換帶寬是800 MB/s = (100× 64)/。可以看出,前端總線速度會影響計算機運行時CPU與內存(L2緩存)之間的數據交換速度,實際上影響了計算機的整體運行速度。所以目前Intel開始將其Pⅲ前端總線頻率從100MHz過渡到133MHz。AMD的新K7使用的是20 0MHz的前端總線頻率,但有數據顯示,K7 CPU核與內存的數據交換時鐘仍然是100MHz,主頻也翻倍在100 MHz。
4.CPU主頻
CPU的主頻,也叫工作頻率,是CPU核心(整數和浮點運算器)電路的實際工作頻率。486 DX2 CPU之前。CPU的主頻等於外頻。從486DX2開始,基本上所有CPU主頻都等於“外部頻率乘以倍頻系數”。CPU的主要技術特點。主頻是CPU內核運行時的時鐘頻率,直接影響CPU的運行速度。
我們知道只有Penti um可以在壹個時鐘周期內執行兩條操作指令。如果主頻為100MHz的奔騰可以在1秒內執行2億條指令,那麽主頻為200MHz的奔騰每秒可以執行4億條指令,所以CPU頻率越高,計算機運行速度越快。
需要註意的是,Cyrix的CPU-主頻指數是通過使用PR性能評級參數來衡量的,這意味著此時的CPU性能相當於英特爾的主頻CPU。帶PR參數的CPU實際運行時鐘頻率與標稱主頻不壹致。比如M ⅱ-300的實際工作頻率是233MHz(66×3.5),但是PR參數的主頻是300MH z,也就是說M ⅱ-300相當於Intel的P ⅱ-300。但實際上只有M ⅱ-300的Business Win ston指數(整數性能)能與P ⅱ-300相當。
5.L1和L2緩存的容量和速度
L1和L2緩存的容量和工作速度對提高計算機速度起著關鍵作用,尤其是L2緩存對提高運行更多2 D圖形處理的商業軟件的速度起著顯著作用。
L2緩存是在486時代設立的,目的是為了彌補L1緩存的不足,最大限度地減少主存對CPU操作造成的延遲。
CPU的L2緩存分為內部和外部兩種。CPU芯片內的L2緩存運行速度與主頻相同,而以P ⅱ模式安裝在CPU芯片外的L2緩存運行頻率壹般是主頻的壹半,因此效率低於芯片內的L2緩存,這也是賽揚只有128KB片內緩存,但性能卻幾乎超過同主頻的P ⅱ(有512KB片外L2緩存,主頻壹半)的重要原因。
(三)中央處理器主要技術術語分析
1,管道技術
流水線最早是由InteI在486芯片中使用的。裝配線就像工業生產中的裝配線壹樣工作。在CPU中,壹條指令處理流水線由5~6個功能不同的電路單元組成,然後將壹條X86指令分成5~6步,分別由這些電路單元執行,這樣壹條指令就可以在壹個CPU時鐘周期內完成,從而提高了CPU的運行速度。由於486CP U只有壹條流水線,通過流水線中的取指令、譯碼、地址生成、指令執行、數據回寫五個電路單元同時執行已經分成五步的指令,所以實現了486CP U的設計者所期望的每個時鐘周期完成壹條指令的目的(在我看來,CPU實際上應該從第五個時鐘周期就達到每個周期完成壹條指令的處理速度)。在奔騰時代,設計者在CPU中設置了兩條具有獨立電路單元的流水線,使得CPU在工作時可以通過這兩條流水線同時執行兩條指令,所以理論上可以實現每個時鐘周期完成兩條指令的目的。
2.超級流水線和超標量技術
超級流水線是指某些CPU內部的流水線超過了通常的5~6步,比如奔騰pro的流水線就長達14步。流水線設計的步驟(階段)越多,完成壹條指令的速度就越快,因此可以適應工作頻率更高的CPU。Supe rscalar是指CPU中有不止壹條流水線,每個時鐘周期可以完成不止壹條指令。這種設計被稱為超標量技術。
3、亂序執行技術
亂序執行(Out-of-orderexecution)是指CPU采用的技術,允許多個指令不按程序指定的順序開發,並發送到相應的電路單元進行處理。例如,程序的某個部分有七條指令。這時,CPU會分析每個單元電路的空閑狀態和每條指令是否可以提前執行的具體情況,立即將可以提前執行的指令發送到相應的電路執行。當然,每個單元沒有按照指定的順序執行指令後,對應的電路必須按照原程序指定的指令順序重新排列運算結果,才能返回程序。這種不按順序反匯編指令的操作方式叫做亂序執行(也叫亂序執行)。采用亂序執行技術的目的是使CP U內部電路滿負荷運行,相應提高CPU運行程序的速度。
4.基於技術的預跟蹤和推測執行技術
分支預測和推測執行是CPU動態執行技術的主要內容,動態執行是目前CPU主要采用的先進技術之壹。采用分支預測和動態執行的主要目的是提高CPU的運行速度。推測執行基於分支預測,分支預測程序分支後的處理也是推測執行。
5、指令特殊擴展技術
從最簡單的計算機,指令序列可以得到操作數,並執行計算。對於大多數計算機來說,這些指令壹次只能執行壹次計算。如果需要完成壹些並行操作,就要連續進行幾次計算。這種計算機使用SISD(單指令單數據)處理器。在介紹CPU性能時,我們經常會提到“擴展指令”或“特殊擴展”,指的是CPU是否有對X86指令集的指令擴展。第壹個擴展指令是InteI自己的“MMX”,接下來是AMD的“3D Now!”最後是近期奔騰III中的“上證”。
MMX和上交所:MMX是英文“多媒體指令集”的縮寫。* * *共有57條指令,這是Intel首次對1985以來已經定型的X86指令集進行擴展。MMX主要用於增強CPU對多媒體信息的處理,提高CPU處理3D圖形、視頻和音頻信息的能力。但是因為只優化了整數運算,所以浮點運算能力沒有加強。因此,隨著3D圖形越來越受歡迎,3D網頁在互聯網上的應用越來越多,MMX已經綽綽有余。MMX指令可以對整數進行SIMD運算,如-40,0,1,469或32766等。SSE指令增加了浮點數的SIMD運算能力,如-40.2337,1.4355或874638+02等等。使用MMX和SSE,壹條指令可以對兩個以上的數據流執行計算。就前面的例子而言,不再需要每秒執行529,000條指令,只需要264,600條指令。因為同壹個指令可以同時作用於左右聲道。顯示時,不需要每秒70,778,880條命令,只需要23,592,960條命令,因為紅、綠、藍通道可以由同壹條命令控制。
SSE: SSE是英文“Internet Streaming SIMD擴展”的縮寫。它是英特爾公司在奔騰III中的首次應用。其實最初傳聞MMX2後來叫KNI(Katmai NewInstruction),Katmai現在其實就是奔騰III。SSE***有70條指令,不僅包括原來的MMX還有現在的3D!指令集中的所有功能,並特別強化了SIMD浮點處理能力,此外,還專門針對當前互聯網的日益發展,強化了CPU處理3D網頁和其他音視頻信息技術的能力。CPU有了專門的擴展指令集後,必須得到應用程序的支持,才能發揮作用。所以最先進的Penthm III 450和Pentium II 450在沒有擴展指令支持的情況下運行同壹個應用程序時,兩者在速度上並沒有太大的差別。
SSE不僅保留了原有的MMX指令,還增加了70條指令,不僅加快了浮點運算速度,還提高了內存使用效率,讓內存速度顯得更快。遊戲性能的提升非常顯著。Intel表示,SSE對以下領域的影響尤為明顯:3D幾何運算和動畫處理;圖形處理(如Photoshop);視頻編輯/壓縮/解壓縮(如MPEG和DVD);語音識別;以及聲音壓縮和合成。
3D現在!AMD開發的多媒體擴展指令集有27條指令。針對MMX指令集沒有加強浮點處理能力的弱點,重點提升AMD K6系列CPU對3D圖形的處理能力。但由於指令有限,該指令集主要用於3D遊戲,但不支持其他商業圖形應用。
(四)CPU生產流程和產品架構
1,CPU生產流程
在表示CPU性能的參數中往往會有壹個“制程工藝”,包括“0.35um”或者“0.25um”等等。壹般來說,“制程技術”中的數據越小,說明CPU生產技術越先進。目前CPU的生產主要采用CMOS工藝。CMOS是英文“互補金屬氧化物半導體”的縮寫。用這種技術生產CPU時,各種電路和元器件都經過“光刀”處理,鋁金屬沈積在矽材料上,再用“光刀”刻成導線,把所有元器件連接起來。目前光刻的精度壹般以微米(um)表示,精度越高,生產工藝越先進。因為精度越高,在相同體積的矽材料上可以生產的元器件越多,連線越細,生產出來的CPU工作頻率就可以越高。正因為如此,在只能使用0.65微米工藝時生產的第壹代奔騰CPU工作頻率只有60/60/66MHz,而當後續生產工藝逐漸發展到0.35微米和0.25微米時,工作能力為266MHz的奔騰MMX和主頻為500MHz的奔騰二代CPU也相應生產出來。由於目前科技的限制,目前的CPU生產工藝只能達到0.25微米,所以Intel、AMD、Cyrix等公司都在向0.18um和銅線(用矽材料上沈積的金屬銅代替原來的鋁)努力。估計只要生產工藝達到0.18um,生產主頻l000MHz的CPU會很常見。
AMD公司與摩托羅拉公司達成了壹項為期7年的技術合作協議,以便在下個世紀繼續與英特爾公司爭奪開發微處理器的權利。摩托羅拉將向AMD授權最新的銅互連技術。AMD計劃在2000年內制造出K7的主頻高達1000MHz(1GHz)的微處理器。CPU將向更快的64位結構發展。CPU的制造工藝會更加精細,會從現在的0.25微米過渡到0.18微米。到2000年,大部分CPU廠商將采用0.18微米工藝。2001之後,很多廠商會轉向0.13微米銅制造技術。制造技術的提高意味著更小的尺寸和更高的集成度。銅工藝的優勢非常明顯。主要表現在以下幾個方面:銅的導電性比現在廣泛使用的鋁好,銅的電阻和發熱量小,從而保證了處理器在更大範圍內的可靠性;采用0.13微米以下的芯片制造技術和銅工藝,將有效提高芯片的工作頻率;可以減小現有管芯的體積。與傳統的鋁工藝相比,銅工藝將有效提高芯片速度,減小芯片面積。從發展來看,銅技術最終會取代鋁技術。
各個廠家生產的每壹個CPU都有壹個名字(品牌名),壹個代碼(開發代碼),壹個logo(特殊圖案)。其中,在tel早期的產品都是以i80x86命名的,也就是之前的286、386、486等。英特爾在開發第五代產品586時,由於商標註冊麻煩,改為奔騰,同時為其註冊了中文商標名“奔騰”。於是,後來的奔騰Pr o(奔騰II(奔騰II),奔騰III(奔騰III),賽揚(賽揚)應運而生。目前名稱還不能體現同類型CPU的規格,待Intel正式推出前端總線為133MHz的P III後會有所改善。以後只看名字就能了解這款CPU的大致技術特點。
此外,制造商對每種CPU都有另壹種開發代碼,包括名稱相同但技術規格不同的產品。比如Intel用0.3 5和0.25工藝生產的Pⅱ,代號分別是Klamath和Destrutes。同時,Itel每個名稱的CIPU都有壹個特殊的商標圖案作為標誌。AMD和Cyrix跟Intel差不多,他們的每個CPU也都有名字、代號和logo,但是都沒有正式的中文名字。
2.中央處理器的內部結構
目前我們使用的CPU內部結構其實可以分為單總線和雙總線兩種結構。因為CPU的內部結構特點決定了CPU的包裝形式和安裝規格,這裏就做壹些簡單的介紹。
在Intel開發奔騰Pro之前,各種486及以上的CPU,比如經典的奔騰,都是由主處理器、數學協處理器、控制器、各種寄存器、L1緩存組成。至今仍有大量CPU繼續以這種內部結構模式生產,如AMD的K6-2、Cyrix的Mⅱ、IDT-C6等。從P6(Pen-Tium PrO的開發代號)開始,為了進壹步提高CPU與L2緩存的數據交換速度,英特爾通過將原本設置在電腦主板上的緩存控制電路和L2緩存(二級緩存)制作在同壹矽材料上,集成到CPU芯片中。這樣,CPU核與緩存之間的數據交換就不需要通過外部總線,而是直接通過CPU內部的緩存總線。由於CPU內核與內存、CPU與cache之間的數據交換通道是分離的,因此形成了第壹個P6雙總線架構模式(見圖1)。從奔騰Pro的實際應用效果來看,這壹技術措施是非常成功的,是CPU開發技術的重大進步。由於P6雙總線結構的優勢,所有帶有L2 C C ache和cache控制器的CPU都由傳統的單總線模式轉變為雙總線模式,如英特爾的Pⅱ、新賽揚和Pⅲ。AMD K6-ⅲ和K7等。
3.CPU的體系結構和封裝
CPU架構是根據CPU安裝插座的類型和規格決定的。目前常用的CPU按其安裝插座規格可分為Socket x和Slotx兩種架構。
其中Socket x CPU分為So cket 7和Socket370。321腳插座7和370腳插座370分別用於安裝。Socket7和Socket 370插座外觀非常相似,大小相同,但是Socket 370插座比Socket 7多了壹圈插腳插口。在Slot x架構的CPU中,分為S lot 1、Slot 2、Slot A三種,使用相應規格的Slot插槽安裝。1槽和A槽都是242線槽,但是機械和電氣標準不同,所以互不兼容。插槽2是壹個比較大的插槽,專門用來裝Pⅱ和Pⅲ序列的至強。至強是壹種專用於工作組服務器的CPU。
封裝是CPU生產的最後壹道工序。封裝是用特定的材料將CPU芯片或CPU模塊固化在裏面,防止損壞的壹種保護措施。壹般CPU只有包裝好才能交付給用戶。
CPU的封裝方式取決於CPU的安裝形式和設備集成設計。壹般Socket插座安裝的CPU只能用PGA(網格陣列)封裝,而Slot x slot安裝的CPU全部用SEC(單面插盒)封裝。目前PGA封裝的CPU主要有Intel的賽揚,AMD的K6-2和K6-ⅲ,Cyrix的Mⅱ。賽揚以前都是SEC封裝,現在都是PGA封裝了(見圖4)。SEC封裝的CPU有Intel的Pⅱ、Pⅲ和AM D的K7。其中Intel的插槽架構CPU實際上是由三個單面插盒封裝而成:SEPP、SECC、SEC2。
雖然賽揚和K6-ⅲ在上述CPU中分別集成了128KB和256KB的L2緩存和緩存控制器,但它們是將CPU內核、L2緩存和緩存控制器壹次性制造在同壹塊矽材料上,所以體積小,可以用PGA封裝。但是賽揚采用PGA封裝的主要原因是為了降低生產成本,而K6-ⅲ采用PGA封裝的主要原因是Intel已經對插槽1、插槽2、插槽370的插座申請了專利,所以壹個MD只能采用Socket 7架構,采用PGA封裝來生產K6-ⅲ。
目前插槽架構CPU的制造方式有兩種。壹種是將單獨制造的CPU核心芯片、高速緩存控制器芯片和L2緩存芯片安裝在壹塊PCB(電路板)上,然後安裝單面插箱和風扇,完成CPU的最終制造。用這種結構和方法制造的CPU包括Intel的Pⅱ、Pⅲ和AMD的K7。二是在電路板上安裝壹個完整的CPU芯片(包括CPU核、高速Cach e控制器芯片和L2Cache芯片),此時電路板只起到安裝插槽接口的作用。最後還安裝了單面插箱和風扇,組成壹個完整的CPU。這種結構和方法制造的CPU只是英特爾公司賽揚的壹部分。