

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著集成電路技術(shù)的快速發(fā)展,數(shù)字通信技術(shù)也得到不斷更新?lián)Q代,因此對(duì)通信設(shè)備的性能提出更高要求。同時(shí),為了滿(mǎn)足不同用戶(hù)的需求,現(xiàn)在仍然是多種通信標(biāo)準(zhǔn)共存,從而進(jìn)一步加劇了通信設(shè)備開(kāi)發(fā)的成本和周期。數(shù)字信號(hào)處理器(Digital Signal Processor,DSP)作為通信系統(tǒng)中典型信號(hào)處理設(shè)備,人們對(duì)其實(shí)時(shí)性要求也不斷提高,其中代表性的算法有QR分解、離散余弦變換(Discrete Cosine Transform,DCT)、逆離散
2、余弦變換(Inverse Discrete Cosine Transform,IDCT)、直接數(shù)字頻率合成(Direct Digital Frequency Synthesizer,DDS)和快速傅里葉變換(Fast Fourier Transform,FFT)等。為了能夠?qū)崿F(xiàn)信號(hào)實(shí)時(shí)處理,人們現(xiàn)在趨向于將這些算法硬件實(shí)現(xiàn)并固化在DSP中。與此同時(shí),功耗逐漸成為制約系統(tǒng)性能的一個(gè)關(guān)鍵因素,尤其是對(duì)便攜式通信設(shè)備而言。坐標(biāo)旋轉(zhuǎn)數(shù)字計(jì)算方法
3、(Coordinate Rotation Digital Computer,CORDIC)由于能夠基于簡(jiǎn)單的移位和加法操作實(shí)現(xiàn)一系列的超越函數(shù),包括乘法、除法、對(duì)數(shù)函數(shù)、三角函數(shù)和開(kāi)平方等,因此基于CORDIC算法實(shí)現(xiàn)DSP中典型算法的硬件加速和低功耗研究是當(dāng)前熱點(diǎn)方向。
本文以計(jì)算精度、面積、速度和功耗為優(yōu)化目標(biāo),分別對(duì)CORDIC算法、QR分解、DCT/IDCT變換、DDS技術(shù)和FFT變換展開(kāi)深入研究,主要研究成果和創(chuàng)新性
4、包括以下幾點(diǎn):
1)由于傳統(tǒng)CORDIC算法存在旋轉(zhuǎn)角度覆蓋范圍受限、循環(huán)迭代次數(shù)過(guò)長(zhǎng)、縮放因子補(bǔ)償邏輯、角度數(shù)據(jù)路徑和計(jì)算精度低的不足,本文基于Scaling-free(SF) CORDIC算法提出了自適應(yīng)編碼CORDIC算法(Adaptive Recoding CORDIC,ARC),其采用自適應(yīng)編碼方法對(duì)旋轉(zhuǎn)角度進(jìn)行編碼,使得旋轉(zhuǎn)角度最低十位有效數(shù)據(jù)位中每相鄰兩位最多只存在一位有效位為1,從而有效減少了循環(huán)迭代次數(shù)。為了
5、進(jìn)一步加快循環(huán)迭代過(guò)程,本文又在ARC算法基礎(chǔ)上提出了改進(jìn)自適應(yīng)編碼CORDIC算法(Enhanced Adaptive Recoding CORDIC,EARC),其采用改進(jìn)自適應(yīng)編碼算法對(duì)旋轉(zhuǎn)角度的最高三位有效數(shù)據(jù)位進(jìn)行編碼,使得其最低兩位有效數(shù)據(jù)位至多也只存在一位有效數(shù)據(jù)位為1。此外,本文提出了改進(jìn)的向量模式CORDIC算法,其采用三角變換消除了第一級(jí)迭代的同時(shí)利用自適應(yīng)編碼加速了縮放因子補(bǔ)償過(guò)程。與最先進(jìn)的Hybrid CORD
6、IC算法相比,EARC算法位錯(cuò)位置(Bit Error Position,BEP)提升4位,減少硬件資源開(kāi)銷(xiāo)17.7%,計(jì)算速度提升23%,而且功耗節(jié)省17%。與ARC算法相比,EARC算法的面積減少8.56%,計(jì)算速度提升11.1%,而且功耗降低12.3%。與商業(yè)向量模式CORDIC相比,改進(jìn)向量模式CORDIC算法在保持計(jì)算精度的前提下減少66.3%的硬件資源,計(jì)算速度提升1.8倍和降低71.6%的功耗。因此,ARC算法、EARC算
7、法以及改進(jìn)向量模式CORDIC算法性能均得到提升,尤其是速度和功耗。
2)為了提升QR分解系統(tǒng)陣列結(jié)構(gòu)性能,本文通過(guò)在Chen Architecture第二行增加一個(gè)旋轉(zhuǎn)模式CORDIC計(jì)算單元得到Zhang Architecture,其縮短了QR分解流水線(xiàn)建立時(shí)間。為了進(jìn)一步降低計(jì)算結(jié)果的更新時(shí)間,本文又提出了Enhanced Architecture,其在Zhang Architecture結(jié)構(gòu)第三行增加了一個(gè)旋轉(zhuǎn)模式CO
8、RDIC計(jì)算單元。與此同時(shí),提出了由系統(tǒng)陣列結(jié)構(gòu)中改進(jìn)向量模式CORDIC計(jì)算單元的控制信號(hào)同時(shí)實(shí)現(xiàn)對(duì)旋轉(zhuǎn)模式CORDIC計(jì)算單元控制的機(jī)制,有效加速了QR分解過(guò)程。與Chen Architecture相比,Zhang Architecture保持計(jì)算精度的同時(shí)節(jié)省了5%的硬件資源以及吞吐率提升了2.28倍。與Zhang Architecture相比,Enhanced Architecture在犧牲3.65%資源的代價(jià)下,吞吐率提升1.
9、5倍,硬件效率提升1.45倍和減少24.5%功耗。甚至當(dāng)選定Enhanced Architecture的信號(hào)翻轉(zhuǎn)率為最差情況100%而Zhang Architecture的信號(hào)翻轉(zhuǎn)率為最佳狀況12.5%時(shí),Enhanced Architecture的功耗開(kāi)銷(xiāo)仍比Zhang Architecture少。結(jié)果表明,Zhang Architecture和Enhanced Architecture的吞吐率和硬件利用率改進(jìn)明顯,并且適用于低功耗環(huán)
10、境中。
3)為了降低DCT和IDCT變換的計(jì)算量,本文首先通過(guò)模塊劃分機(jī)制提出了基于向量旋轉(zhuǎn)的第一種統(tǒng)一DCT/IDCT結(jié)構(gòu)??紤]到計(jì)算單元受限的應(yīng)用,本文又采用三角函數(shù)變換在First Unified DCT/IDCT結(jié)構(gòu)基礎(chǔ)上提出了第二種統(tǒng)一DCT/IDCT結(jié)構(gòu)。同時(shí),針對(duì)改進(jìn)結(jié)構(gòu)中的CORDIC計(jì)算單元,采用了ARC算法與傳統(tǒng)CORDIC算法相結(jié)合的模式以提升計(jì)算精度和消除數(shù)據(jù)相關(guān)性。此外,本文提出了基2近似縮放因子逼近
11、方法,極大程度地減少了量化誤差。在DCT模式下,與Lee結(jié)構(gòu)相比,本文所提的兩個(gè)統(tǒng)一DCT/IDCT變換結(jié)構(gòu)的峰值信號(hào)噪聲比(Peak Signal-to-Noise ratio,PSNR)提升超3.8dB,面積節(jié)省超10.8%,關(guān)鍵路徑延遲降低超5.06%以及功耗節(jié)省超9.18%。在DCT/IDCT模式,與Huang結(jié)構(gòu)相比,本文所提出的第一種統(tǒng)一DCT/IDCT和第二種統(tǒng)一DCT/IDCT分別提升PSNR值1dB和2dB,減少38.
12、3%和42.8%的硬件資源開(kāi)銷(xiāo),以及減少35.4%和34.4%的功耗。所以,無(wú)論是在DCT模式還是DCT/IDCT模式下,本文所提的兩個(gè)統(tǒng)一DCT/IDCT結(jié)構(gòu)的性能優(yōu)勢(shì)突出。
4)由于DDS中的相幅轉(zhuǎn)換模塊需要實(shí)時(shí)完成三角函數(shù)值的計(jì)算,同時(shí)FFT需要能夠快速實(shí)現(xiàn)蝶形計(jì)算單元中的復(fù)數(shù)乘法操作,所以本文基于ARC算法和EARC算法設(shè)計(jì)實(shí)現(xiàn)了高效的DDS和FFT,它們分別以犧牲無(wú)雜散動(dòng)態(tài)范圍(Spurious Free Dynam
13、ic Range,SFDR)和信號(hào)噪聲比(Signal-to-Noise ratio,SNR)為代價(jià)消除了用于存儲(chǔ)三角函數(shù)值的RAM和用于存儲(chǔ)旋轉(zhuǎn)因子的ROM。與商業(yè)DDS相比,ARC DDS和EARC DDS分別節(jié)省17.7%和27.2%的功耗。與商業(yè)FFT相比,ARC FFT的計(jì)算速度提升了1.23倍并減少60.1%功耗。與ARC FFT相比,EARC FFT的性能得到進(jìn)一步提升。因此,基于ARC算法和EARC算法設(shè)計(jì)實(shí)現(xiàn)的DDS和
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- AES密碼算法加速器的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 抗功耗分析攻擊的高速ECC算法加速器.pdf
- 并行查詢(xún)加速器的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于FPGA的深度學(xué)習(xí)加速器設(shè)計(jì)與實(shí)現(xiàn).pdf
- 低功耗應(yīng)答器的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于LTE協(xié)議的通信加速器Turbo譯碼設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于COM的機(jī)械設(shè)計(jì)加速器的研究與實(shí)現(xiàn).pdf
- 基于CSNS直線(xiàn)加速器的質(zhì)子治療FFAG加速器的物理設(shè)計(jì).pdf
- 基于Zynq的LS-SVM算法加速器設(shè)計(jì).pdf
- 低功耗Viterbi譯碼器的設(shè)計(jì)與實(shí)現(xiàn).pdf
- EB固化低能電子加速器加速管設(shè)計(jì)與實(shí)現(xiàn).pdf
- 在線(xiàn)學(xué)習(xí)算法的加速器設(shè)計(jì)研究.pdf
- 基于Openflow協(xié)議的FPGA網(wǎng)絡(luò)加速器系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 高速、低功耗維特比解碼器算法研究與電路實(shí)現(xiàn).pdf
- 基于CORDIC算法的高性能FFT設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于多位觸發(fā)器技術(shù)的SoC低功耗設(shè)計(jì)與實(shí)現(xiàn).pdf
- 低功耗多功能應(yīng)答器硬件設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于FPGA的CORDIC算法研究與實(shí)現(xiàn).pdf
- 低功耗水聲應(yīng)答器的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 無(wú)線(xiàn)傳感器網(wǎng)絡(luò)低功耗節(jié)點(diǎn)設(shè)計(jì)與實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論