[[SHARC處理器]的起源和演變起源處理器溫度

1簡介說到要求超高性能的尖端應用，就不得不提到ADI公司的SHARC處理器。隨著更高的動態範圍、更高的性能和更低的成本等日益增加的市場壓力，各種應用對浮點處理器的需求也在增加。本文將介紹第壹個SHARC處理器背後的歷史，並討論其架構的創新，這使得該處理器在18的數字信號處理歷史中始終處於領先地位。

2SHARC處理器的歷史

“SHARC”是Super Harvard ARChitecture的縮寫，是ADI公司給他們的浮點處理器起的名字。SHARC處理器在標準Harvard架構的基礎上進行改進，不僅方便了PM(程序存儲器)總線上的數據傳輸，還通過增加壹個指令緩存優化了基於緊循環的計算過程的吞吐性能。改進後的體系結構可以同時訪問數據和系數，同時執行從指令緩存中選擇的指令，從而高效地實現了處理器的三總線操作模式。

眾所周知，SHARC處理器源自ADSP-21020。這種浮點單指令單數據(SISD)DSP實際上是壹個獨立的計算核心，沒有嵌入式存儲器或外設。通過連接到SRAM芯片的外部總線訪問PM和DM(數據存儲器)存儲空間，並通過JTAG接口對處理器進行編程和調試。

ADSP-21020可以工作在33MHz的時鐘頻率，執行壹個周期的指令。ADSP-21020可以用80位累加器完成32位或40位浮點和32位定點運算，是ADI公司在1991年推向市場的突破性產品。這種內核技術是ADI公司致力於浮點性能和創新的起點。

3整合與創新:SHARC的誕生

第壹個真正的SHARC處理器是ADSP-21060。ADI公司基於ADSP-21020內核產品開發了壹款完全集成的處理器，包括片內SRAM和I/O處理器，用於控制集成外設的DMA流。

ADSP-21060浮點處理器於1994年進入市場，被認為是當時DSP性能和創新的頂級水平。

SHARC內核可以在壹個周期內以高達40MHz的速度進行計算，並且增加了I/O處理器，可以在不增加任何內核開銷的情況下，在外設和雙端口4Mb SRAM存儲器之間高速傳輸數據。

為了進壹步提高最終用戶的系統性能和可擴展性，ADI公司的設計團隊著手創建壹種機制，允許多處理器系統以極低的開銷享受數據。外部端口邏輯增加了壹個集群總線控制器，可以無縫地進行處理器之間的並行數據通信，每個集群最多可以有6個處理器。這項突破性技術允許系統架構師以高達240MBps的帶寬將大量數據從主處理器直接傳輸到指定從處理器的存儲器，或者使用廣播模式將數據直接發送到集群中的所有從設備。

使用ADI公司的link port專利技術還可以實現處理器之間的高速通信。每個ADSP-21060集成了6個獨立的鏈路端口，用於點對點通信，因此可以實現240MBps的額外I/O帶寬。

憑借這種真正平衡的架構和擴展的功能，SHARC處理器廣泛用於計算密集型應用，如醫療成像、軍用雷達和電子遊戲機。

擁有該功能的處理器在15年前就已經投放市場，這可能讓人難以置信，但更令人驚訝的是，這款處理器還在被用戶使用！這是SHARC架構性能良好可擴展性以及ADI公司對質量和用戶滿意度承諾的最佳證明。

4第二代SHARC處理器

第二代SHARC處理器將處理性能提升到了壹個新的水平。它將內核架構擴展到單指令多數據(SIMD)系統，並將內核時鐘頻率提高到100MHz。ADSP-2116x系列處理器保持了與ADSP-2106x SISD處理器源代碼的完全兼容，用戶只需少量代碼修改就可以扮演壹個新增加的並行運算單元(寄存器文件+乘法器+ALU+桶形移位器)的角色，相比上壹代SHARC可以使循環性能指標翻倍。

為了方便數據傳輸到這個新增加的運算單元而不降低周期性能，內部PM和DM數據總線寬度增加到64位，同時在ADSP-265438上集成了壹個寬度為1161的48位SDRAM控制器，以增加I/O數據傳輸帶寬，從而可以實現高達600MBps帶寬的數據傳輸能力。

正如上壹代SISD SHARC壹樣，第二代SHARC保留了支持集群總線系統架構的多處理器的無縫連接和通過link端口的點對點連接，使得性能升級路線圖更加簡單清晰。

正如上壹代SISD SHARC壹樣，第二代SHARC系列器件廣泛用於醫療、工業和軍事應用，並且由於支持時分復用(TDM)和I2S格式的串行端口(SPORT)的額外集成，專業音頻和高端消費電子/汽車音頻設備可以快速利用處理器浮點操作提供的大動態範圍。

5第三代SHARC處理器

第三代SHARC處理器開始跳出多處理器應用空間，主動迎接新的挑戰。由於浮點處理在音頻應用中的明顯優勢，SHARC技術發展的重點開始轉向以最低的系統成本增加片內處理功能。

以此為目標開發和上市的第壹批處理器是ADSP-2126x系列。就像ADSP-2116x壹樣，ADSP-2126x采用SIMD架構，最大化計算性能。除了將核心性能提升壹倍至200MHz，ADSP-21266處理器也是SHARC系列中第壹款內置片上掩膜ROM的產品。集成4Mb ROM降低了系統的復雜度和成本，將曾經給人“高成本”印象的浮點DSP推向了消費音頻領域。

為了進壹步降低硬件系統設計的復雜性，ADI公司開發了壹款名為“數字應用接口”(DAI)的創新外設。與以前的SHARC和類似的競爭產品不同，這些產品固定了引腳功能，DAI允許用戶將任何外設功能分配給他們想要的任何外部引腳。對於音頻系統，這意味著當系統的輸入和輸出要求發生變化時，音頻時鐘域可以通過軟件隨時分配給引腳並路由到串行端口。這種靈活性可以顯著減少支持特殊系統規格所需的外部引腳數量，有助於簡化硬件設計，並幫助用戶進壹步降低成本。

ADSP-2136x繼承了ADSP-2126x的成本節約優勢，並增加了先進的音頻信號鏈集成方法。內核性能提升60%以上，達到333MHz，內部SRAM可提升至3Mb。此外，集成了許多音頻外設，如高性能異步采樣速率轉換器(ASRC)、SPDIF收發器和DTCP加密引擎，進壹步優化了音頻系統的可編程性能和BOM成本，鞏固了ADI公司在音頻市場的領先地位。在該系列高性能產品中，還集成了工作頻率高達166MHz的32位SDRAM接口，以增加I/O帶寬，同時有利於數據密集型應用使用量產存儲器。

基於這種突破性的音頻系統集成和高性價比的領先優勢，第三代SHARC系列不僅廣泛應用於專業音頻領域，還廣泛應用於消費音頻應用(如家庭影院系統和AV放大器)，並在將新壹代高清音頻標準(DTS Master Audio和Dolby Tru-HD)推向市場方面發揮了重要作用。

6第四代SHARC系列――ADSP-2146x

第三代SHARC處理器在優化性價比方面取得了成功，這將浮點處理器推向了對成本敏感的消費類應用，這些應用曾被認為不可能使用昂貴的浮點處理器。

ADI公司現在面臨著壹個有趣的挑戰:如何進壹步提高浮點處理器的性價比？

在定義第四代處理器時，產品開發團隊關註核心價值，這些價值使SHARC始終處於浮點DSP技術的前沿:

●市場領先的性能

●建築平衡

●性能可擴展性

●智能集成

下面將詳細描述這些關鍵方面中的每壹個。

6.1 ADSP-2146x性能增強

基於對ADSP-2136x系列內核的改進，ADI公司的SHARC開發團隊設定了更高的性能目標，並采用了臺積電的65納米矽工藝，以持續優化性能和成本平衡。經過精心的工程設計和規劃，ADI公司於2008年6月正式發布了ADSP-2146x系列處理器。其核心性能可達450MHz，比最接近的競爭產品幾乎高出30%。然而，ADI公司的設計團隊並不滿足於僅僅提高性能，他們開始尋求創新的方法來大幅提高計算性能，同時最大限度地降低對功耗和成本的影響。

許多工程師使用浮點處理器提供的寬動態範圍來實現各種算法，如模式檢測、數據壓縮/解壓縮、加密/解密和自適應濾波。在許多計算密集型算法中，壹些基本的信號處理單元，如FFT、FIR濾波器和IIR濾波器，已經被廣泛使用，並且是大多數數字信號處理應用的基礎。ADI公司專註於這些核心信號處理構建模塊，開始將這些功能集成到2146x DMA架構中，以進壹步增強SHARC內核的450MHz性能。

基於壹個簡單的編程模型，DSP工程師可以將這些“加速器”中的每壹個都視為壹個簡單的外設。每個加速器都配置有自己的本地存儲器，用於數據和系數存儲，從而不會增加核心處理器的開銷。此外，還有壹組加速器專用寄存器用於設置加速器，包括主存儲器中的系數起始地址和計數器等信息。設置完成後，程序開始按順序運行，用戶只需等待指示處理結束的中斷。

FIR加速器包括壹個1K字的本地存儲器用於存儲系數，另壹個1K字的存儲器用於存儲延遲線數據。FIR算術單元包括四個並行的MAC(乘法和累加)單元，每個單元的工作頻率是內核時鐘頻率的壹半。通過使用80位精度累加器，算術單元可以執行32位浮點或32位定點處理。理論上，除了內核提供的2.7GFlops性能，這個引擎還可以提供1.8Gflops的處理能力。因此，與第三代產品相比，第四代產品的可用浮點性能壹般會提高壹倍。

FIR加速器可以在單次叠代模式下使用，這意味著完整的濾波器實現可以放入本地存儲器(濾波器長度

上一篇:雪花制冰機的產品參數

下一篇:伊利營養舒化奶,采用創新什麽技術,將牛奶中不易被吸收的營養細化分解,讓吸收更加