2SHARC處理器的歷史
“SHARC”是Super Harvard ARChitecture的縮寫,是ADI公司給他們的浮點處理器起的名字。SHARC處理器在標準Harvard架構的基礎上進行改進,不僅方便了PM(程序存儲器)總線上的數據傳輸,還通過增加壹個指令緩存優化了基於緊循環的計算過程的吞吐性能。改進後的體系結構可以同時訪問數據和系數,同時執行從指令緩存中選擇的指令,從而高效地實現了處理器的三總線操作模式。
眾所周知,SHARC處理器源自ADSP-21020。這種浮點單指令單數據(SISD)DSP實際上是壹個獨立的計算核心,沒有嵌入式存儲器或外設。通過連接到SRAM芯片的外部總線訪問PM和DM(數據存儲器)存儲空間,並通過JTAG接口對處理器進行編程和調試。
ADSP-21020可以工作在33MHz的時鐘頻率,執行壹個周期的指令。ADSP-21020可以用80位累加器完成32位或40位浮點和32位定點運算,是ADI公司在1991年推向市場的突破性產品。這種內核技術是ADI公司致力於浮點性能和創新的起點。
3整合與創新:SHARC的誕生
第壹個真正的SHARC處理器是ADSP-21060。ADI公司基於ADSP-21020內核產品開發了壹款完全集成的處理器,包括片內SRAM和I/O處理器,用於控制集成外設的DMA流。
ADSP-21060浮點處理器於1994年進入市場,被認為是當時DSP性能和創新的頂級水平。
SHARC內核可以在壹個周期內以高達40MHz的速度進行計算,並且增加了I/O處理器,可以在不增加任何內核開銷的情況下,在外設和雙端口4Mb SRAM存儲器之間高速傳輸數據。
為了進壹步提高最終用戶的系統性能和可擴展性,ADI公司的設計團隊著手創建壹種機制,允許多處理器系統以極低的開銷享受數據。外部端口邏輯增加了壹個集群總線控制器,可以無縫地進行處理器之間的並行數據通信,每個集群最多可以有6個處理器。這項突破性技術允許系統架構師以高達240MBps的帶寬將大量數據從主處理器直接傳輸到指定從處理器的存儲器,或者使用廣播模式將數據直接發送到集群中的所有從設備。
使用ADI公司的link port專利技術還可以實現處理器之間的高速通信。每個ADSP-21060集成了6個獨立的鏈路端口,用於點對點通信,因此可以實現240MBps的額外I/O帶寬。
憑借這種真正平衡的架構和擴展的功能,SHARC處理器廣泛用於計算密集型應用,如醫療成像、軍用雷達和電子遊戲機。
擁有該功能的處理器在15年前就已經投放市場,這可能讓人難以置信,但更令人驚訝的是,這款處理器還在被用戶使用!這是SHARC架構性能良好可擴展性以及ADI公司對質量和用戶滿意度承諾的最佳證明。
4第二代SHARC處理器
第二代SHARC處理器將處理性能提升到了壹個新的水平。它將內核架構擴展到單指令多數據(SIMD)系統,並將內核時鐘頻率提高到100MHz。ADSP-2116x系列處理器保持了與ADSP-2106x SISD處理器源代碼的完全兼容,用戶只需少量代碼修改就可以扮演壹個新增加的並行運算單元(寄存器文件+乘法器+ALU+桶形移位器)的角色,相比上壹代SHARC可以使循環性能指標翻倍。
為了方便數據傳輸到這個新增加的運算單元而不降低周期性能,內部PM和DM數據總線寬度增加到64位,同時在ADSP-265438上集成了壹個寬度為1161的48位SDRAM控制器,以增加I/O數據傳輸帶寬,從而可以實現高達600MBps帶寬的數據傳輸能力。
正如上壹代SISD SHARC壹樣,第二代SHARC保留了支持集群總線系統架構的多處理器的無縫連接和通過link端口的點對點連接,使得性能升級路線圖更加簡單清晰。
正如上壹代SISD SHARC壹樣,第二代SHARC系列器件廣泛用於醫療、工業和軍事應用,並且由於支持時分復用(TDM)和I2S格式的串行端口(SPORT)的額外集成,專業音頻和高端消費電子/汽車音頻設備可以快速利用處理器浮點操作提供的大動態範圍。
5第三代SHARC處理器
第三代SHARC處理器開始跳出多處理器應用空間,主動迎接新的挑戰。由於浮點處理在音頻應用中的明顯優勢,SHARC技術發展的重點開始轉向以最低的系統成本增加片內處理功能。
以此為目標開發和上市的第壹批處理器是ADSP-2126x系列。就像ADSP-2116x壹樣,ADSP-2126x采用SIMD架構,最大化計算性能。除了將核心性能提升壹倍至200MHz,ADSP-21266處理器也是SHARC系列中第壹款內置片上掩膜ROM的產品。集成4Mb ROM降低了系統的復雜度和成本,將曾經給人“高成本”印象的浮點DSP推向了消費音頻領域。
為了進壹步降低硬件系統設計的復雜性,ADI公司開發了壹款名為“數字應用接口”(DAI)的創新外設。與以前的SHARC和類似的競爭產品不同,這些產品固定了引腳功能,DAI允許用戶將任何外設功能分配給他們想要的任何外部引腳。對於音頻系統,這意味著當系統的輸入和輸出要求發生變化時,音頻時鐘域可以通過軟件隨時分配給引腳並路由到串行端口。這種靈活性可以顯著減少支持特殊系統規格所需的外部引腳數量,有助於簡化硬件設計,並幫助用戶進壹步降低成本。
ADSP-2136x繼承了ADSP-2126x的成本節約優勢,並增加了先進的音頻信號鏈集成方法。內核性能提升60%以上,達到333MHz,內部SRAM可提升至3Mb。此外,集成了許多音頻外設,如高性能異步采樣速率轉換器(ASRC)、SPDIF收發器和DTCP加密引擎,進壹步優化了音頻系統的可編程性能和BOM成本,鞏固了ADI公司在音頻市場的領先地位。在該系列高性能產品中,還集成了工作頻率高達166MHz的32位SDRAM接口,以增加I/O帶寬,同時有利於數據密集型應用使用量產存儲器。
基於這種突破性的音頻系統集成和高性價比的領先優勢,第三代SHARC系列不僅廣泛應用於專業音頻領域,還廣泛應用於消費音頻應用(如家庭影院系統和AV放大器),並在將新壹代高清音頻標準(DTS Master Audio和Dolby Tru-HD)推向市場方面發揮了重要作用。
6第四代SHARC系列――ADSP-2146x
第三代SHARC處理器在優化性價比方面取得了成功,這將浮點處理器推向了對成本敏感的消費類應用,這些應用曾被認為不可能使用昂貴的浮點處理器。
ADI公司現在面臨著壹個有趣的挑戰:如何進壹步提高浮點處理器的性價比?
在定義第四代處理器時,產品開發團隊關註核心價值,這些價值使SHARC始終處於浮點DSP技術的前沿:
●市場領先的性能
●建築平衡
●性能可擴展性
●智能集成
下面將詳細描述這些關鍵方面中的每壹個。
6.1 ADSP-2146x性能增強
基於對ADSP-2136x系列內核的改進,ADI公司的SHARC開發團隊設定了更高的性能目標,並采用了臺積電的65納米矽工藝,以持續優化性能和成本平衡。經過精心的工程設計和規劃,ADI公司於2008年6月正式發布了ADSP-2146x系列處理器。其核心性能可達450MHz,比最接近的競爭產品幾乎高出30%。然而,ADI公司的設計團隊並不滿足於僅僅提高性能,他們開始尋求創新的方法來大幅提高計算性能,同時最大限度地降低對功耗和成本的影響。
許多工程師使用浮點處理器提供的寬動態範圍來實現各種算法,如模式檢測、數據壓縮/解壓縮、加密/解密和自適應濾波。在許多計算密集型算法中,壹些基本的信號處理單元,如FFT、FIR濾波器和IIR濾波器,已經被廣泛使用,並且是大多數數字信號處理應用的基礎。ADI公司專註於這些核心信號處理構建模塊,開始將這些功能集成到2146x DMA架構中,以進壹步增強SHARC內核的450MHz性能。
基於壹個簡單的編程模型,DSP工程師可以將這些“加速器”中的每壹個都視為壹個簡單的外設。每個加速器都配置有自己的本地存儲器,用於數據和系數存儲,從而不會增加核心處理器的開銷。此外,還有壹組加速器專用寄存器用於設置加速器,包括主存儲器中的系數起始地址和計數器等信息。設置完成後,程序開始按順序運行,用戶只需等待指示處理結束的中斷。
FIR加速器包括壹個1K字的本地存儲器用於存儲系數,另壹個1K字的存儲器用於存儲延遲線數據。FIR算術單元包括四個並行的MAC(乘法和累加)單元,每個單元的工作頻率是內核時鐘頻率的壹半。通過使用80位精度累加器,算術單元可以執行32位浮點或32位定點處理。理論上,除了內核提供的2.7GFlops性能,這個引擎還可以提供1.8Gflops的處理能力。因此,與第三代產品相比,第四代產品的可用浮點性能壹般會提高壹倍。
FIR加速器可以在單次叠代模式下使用,這意味著完整的濾波器實現可以放入本地存儲器(濾波器長度