日本在线www-日本在线播放一区-日本在线不卡免费视频一区-日本在线不卡视频-成人影院久久久久久影院-成人影院一区二区三区

最新廣告
關注中國自動化產業發展的先行者!
工業智能邊緣計算2025年會
CAIAC 2025
2025工業安全大會
OICT公益講堂
當前位置:首頁 >> 案例 >> 案例首頁

案例頻道

用Spartan-3A DSP器件實現汽車應用中的塊匹配
  • 企業:控制網     領域:工廠信息化     行業:金融/保險    
  • 點擊數:2095     發布時間:2008-08-11 13:09:28
  • 分享到:

  汽車工程師采用多種智能技術幫助人們安全駕駛汽車。汽車系統中的主要技術包括雷達、超聲和攝像/視覺感測。這些技術統稱駕駛員輔助 (DA) 系統,用于在惡劣條件和危險路況下協助安全駕駛。

  第一代攝像 DA 系統目前可見于各種生產用車型。這類系統大多為駕駛員提供車輛周邊環境的視頻圖像。最常見的是泊車/倒車輔助系統,這種系統用后視攝像頭拍攝本車后面的景物,并且在收音機/導航系統的屏幕上或者在儀表板中的小型顯示器上顯示圖像。

  第二代攝像系統正處于開發測試階段,目前使用有限。第二代系統并非僅為駕駛員提供圖像,而是運用圖像處理與解析從視頻流中提取信息,并且對車輛環境進行表征和評估。必要時駕駛員會收到相應警示。

  隨著工程師們獲取車輛環境表征方面的實際經驗,未來的 DA 技術會更復雜,將為消費者提供更強大的實用工具并且增強其它汽車子系統的性能。圖 1 概括了目前和未來的多種 DA 功能。

  

  高級處理要求

  DA 系統的處理要求可能超過目前汽車級串行 DSP 處理器的能力。另外,為了提高消費價值,在一套視覺傳感器上捆綁多種 DA 功能的需求日益高漲。

  例如,前瞻視覺模塊可能需要同時支持車道偏離警示、智能大燈控制和標志識別功能,而所有這些都需要不同的處理算法。因此,對于用 FPGA 通過原始圖像數據處理、配置靈活性和器件可縮放性來提供系統價值,DA 市場提供了實實在在的機會。

  視覺 DA 系統的圖像處理與解析功能可以包括空間/時間濾波、鏡頭失真校正、圖像清晰化、對比度增強、邊沿檢測、圖像匹配、物體識別和物體跟蹤,在某些情況下還包括圖形疊加。尤其值得關注的是一種支持運動估計或立體視差計算的圖像匹配功能。

  為了說明 FPGA 處理的性能價值,我們來考慮這樣一個視覺系統:以 30 Hz 幀速率 (fps) 生成視頻的寬幅 VGA 分辨率成像器件(752 x 480 像素),而且需要估計幀間物體運動(或流動)。有一種算法(也適用于立體視差計算)是將圖像劃分為若干個塊(如大小為 4 x 4 像素),然后判斷第一幀中各圖像塊對第二幀中指定搜索區(如 20 x 20 像素)內某位置的匹配條件。

  一種常用的匹配條件是用算子 SAD(絕對差和)求出第一幀圖像中的4x4塊與第二幀圖像上搜索區內的像素之間的像素灰度最小絕對誤差 (MAE)。

  4 x 4 塊匹配示例需要 250 MMAE/s(每秒百萬次 MAE 計算)以上的性能,因為 (752 像素) x (480 行) x (20 x 20 像素搜索區) x (30 fps)/(4 x 4 像素塊大小) = 270,720,000 MAE/s。MAE 表示 4 x 4 像素塊的最終匹配誤差,而 SAD 是指根據四個獨立元素對進行計算得到的絕對差和。所以,每 MAE 需要四次 SAD 運算。

  處理選項

  由汽車設計工程師決定的處理選項包括超長指令字 (VLIW) DSP-CPU 和 FPGA。FPGA 的處理能力遠遠高于任何現有的 VLIW DSP-CPU。這是由于 FPGA 的架構:大量并行功能單元(包括可編程 MAC)使 FPGA 的性能比任何 DSP 都高出 10-30 倍(具體性能取決于所實現的應用),即使 FPGA 的時鐘頻率比 DSP-CPU 的時鐘頻率低得多。

  VLIW DSP-CPU 處理器中的 SAD 和 MAE 計算

  在一個 32 位架構的單指令多數據 (SIMD) DSP-CPU 中可實現四個 8 位像素視頻數據單元的 SAD 運算,因此,僅在一個周期內即可有效執行相當于11條基本指令的運算,如圖 2 所示。

  

  例如,Nexperia PNX1500 媒體處理器配有 32 位 TriMedia VLIW-CPU,對于具有二周期延遲的 8 位像素,可以在一個時鐘周期內執行兩條四路 SAD 指令。算上超長指令字,就是每時鐘周期最多五條基本RISC/SIMD指令,其中只有兩條可以是SAD指令(在TriMedia數據手冊中稱為“8meii”)。

  所以,對 4 x 4 大小的塊進行 MAE 計算需要五個時鐘周期,如表 1 所示:兩個周期用于兩條四路 SAD 指令的流水線處理(周期 1 用于 sad1/sad2,周期 2 用于 sad3/sad4);三個周期用于部分結果的累加(周期3、4 和 5)。因此,如果只處理一個塊,則一個 300 MHz 的 Nexperia PNX1500 處理器的處理能力最高可達 60 MMAE/s。

  

  如果每次處理一個以上 4 x 4 塊,最高性能可略有提高。例如,可以在七個周期內計算兩個并行4x4塊的 MAE,這時性能可達85.71MMAE/s;而處理三個塊需要九個周期,即性能為100MMAE/s。

  可并行處理的最大塊數分別受限于任意長指令字中允許的 SIMD SAD 運算次數、VLIW-CPU的通用寄存器數和優化編譯器的調度算法。如果繼續增加塊數,整體性能會趨于飽和,因此我們考慮并行處理的 MAE 不超過三個。

  TI 的 TMSD320DM6437 數字媒體處理器每周期有一條由八次基本 RISC 運算組成的長指令,分別通過兩條數據通路,各通路每周期有四個時隙。其 VLIW-CPU 每周期最多可執行兩條 SAD 指令(在 TI DM6437 數據手冊中稱為“subabs4”),各指令有一個周期的延遲。但是,要累加部分結果,就必須使用常數 0x01010101 執行具有三周期延遲的 SIMD MAC 運算(稱為“dotpsu4”)。

  所以,600 MHz 的 TI DM6437 DSP-CPU 可以用七個周期計算一個 MAE(如表 2 所示),因此對于 4 x 4 像素塊的最高性能為 85.71 MMAE/s。如果并行處理兩個塊,就需要九個周期,性能為 133.33 MMAE/s;而三個塊需要11個周期,性能為163.64 MMAE/s,這仍然低于我們的 250 MSAD/s 要求。

  

  VLIW DSP-CPU 性能不足

  至此,我們一直假定每像素 8 位,這很適合 32 位架構的 DSP-CPU 處理器。然而,新型 CMOS 圖像傳感器的分辨率范圍較高,即每像素 12 到 14 位。對于這些數據類型,32 位架構的傳統四路 8 位子字 SIMD 不夠有效,必須換用雙路 16 位半字 SIMD,其中的子字并行度僅為二。因此,由于計算一個 MAE 需要較多時鐘周期,最高性能大幅度下降。

  表 3 所示為在 TI VLIW DSP-CPU 上使用 16 位子字指令計算 SAD 時可能的偽匯編代碼,假定延遲正確且函數發射時隙允許執行這種指令。因此,一個 4 x 4 的塊需要八個周期,而并行處理兩個和三個塊分別需要 10 個和 12 個周期。這時,相應的最高性能分別為 75 MMAE/s、120 MMAE/s 和 150 MMAE/s。這些數字都比使用 8 位子字指令得到的數字小。

  

  Spartan-3A DSP FPGA 的 SAD 和 MAE 性能

  為了填補Spartan-3和Virtex-4 器件之間的處理性能空白,Xilinx 推出的Spartan 3A-DSP 1800A和3400A FPGA采納了 Virtex-4 器件中的 DSP48 Slice 的修改版。另外,3A-DSP 器件包括大量片上存儲器(Block RAM)。這兩方面增強加上針對大量應用制訂的價位使 3A-DSP 器件非常適合汽車視覺 DA 系統。

  圖3所示為Spartan-3A DSP 1800 (XC3SD1800A-4FG676)器件上的四路12 位像素的 SAD 計算方案。此方案是使用 System Generator for DSP 設計流程(Xilinx 提供的 Simulink 工具中的數字和周期都精確的可綜合庫)完成的。所需資源數量是 121 個 Slice(236 個 LUT 和 140 個觸發器)。將此結構復制四次并且加上部分結果,即得到整個 4 x 4 塊的計算方案,該方案需要 508 個 Slice(990 個觸發器和 606 個 LUT),具有一個周期吞吐量(這意味著可從任意時鐘周期開始計算新的 MAE)和七個周期延遲。

  

  如果使用 150 MHz 時鐘頻率(該器件最高時鐘頻率為 250 MHz),只需要兩個并行結構(約占器件面積的 6%)即可達到300 MMAE/s的性能,從而滿足示例應用的250 MMAE/s 性能要求。這樣可以節省大量資源用來實現其它圖像處理功能、數據路由通道、存儲器接口控制器以及一個用于串行處理和外部通信的 32 位 MicroBlaze 嵌入式處理器。

  作為參考,仍然用 150 MHz 頻率,Spartan 3A-DSP 1800A 器件僅使用整個 FPGA 器件的 70%, 即可并行處理多達 23 個塊(70% x 16,640 Slice/508 Slice/塊 = 23 塊)。與此對應的最高性能是 3,529 MMAE/s,這至少要比 600 MHz 的 TI DSP-CPU 的最高性能高 25 倍。

  結論

  以汽車視覺應用為例說明了如何利用中型低成本 Xilinx FPGA的可編程并行處理能力提供超過VLIW DSP-CPU 的處理性能。表 4 列出了分析結果。

  

  值得注意的是對于 12 位像素數據的 4 x 4 塊的 MAE 計算,Spartan-3A DSP 的性能僅以四分之一時鐘速度即可達到 TI TMS320DM6437 的兩倍。另外,FPGA 的資源占用率僅為 6%,因此可以在同一器件上實現其它圖像處理功能(必要時可采納并行處理)。

  另一方面,VLIW DSP-CPU 在 SAD 計算期間被完全占用,消耗串行處理器長指令的可用時隙,因此很少有機會同時執行其它功能。

  我們對于 FPGA 的估算時鐘頻率相當保守(以 150 MHz 對 250 MHz),對于運動估算的搜索區也是如此(搜索區越大,需要計算的 MAE 的數量就越多)。例如,30 x 30 的搜索區需要 609 MMAE/s 的性能(遠遠超過 VLIW DSP-CPU 的能力),然而卻僅占用 1800A 器件上 Slice 的 12%。

  最后需要說明的是,在實現 MAE 時根本未使用 DSP48 MAC 單元:因為據估計,如果用四個 DSP48 單元取代由 100 個 Slice 組成的加法器樹,則一個 12 位輸入數據 MAE 的 4 x 4 塊會占用 400 個 Slice(782 個觸發器和 400 個 LUT)和四個 DSP48。

  因此,Spartan-3A DSP 1800A 器件非常適合需要極高處理性能、靈活性和可縮放性的視覺應用,如未來型汽車駕駛員輔助系統中的視覺應用。

熱點新聞

推薦產品

x
  • 在線反饋
1.我有以下需求:



2.詳細的需求:
姓名:
單位:
電話:
郵件:
主站蜘蛛池模板: 欧美激情中文字幕一区二区-欧美激情在线精品video-欧美激情影院-欧美激情一区二区三区在线-欧美激情一区二区三区视频高清-欧美激情一区二区三区视频 | 欧美成人精品动漫在线专区-欧美成人精品区综合A片-欧美成人精品三区综合A片-欧美成人精品一区二区综合A片-欧美成人另类-欧美成人猛片AAAAAAA | 亚洲尹人-亚洲伊人久久综合影院2021-亚洲伊人久久在-亚洲伊人久久网-免费网站在线观看人数在哪里看的-免费网站在线观看国产v片 | 国产91av视频在线-国产91av在-国产91av在线-国产91av在线播放-国产91chinese在线观看-国产91l在线播放 | 99只有精品-99这里只有精品在线-99这里只有精品视频-99这里只有精品66视频-欧美国产视频-欧美国产日韩综合 | 97av在线,五月婷婷综合基地,国产精品永久在线,国产精品主播视频,欧美les免费观看网站,青青青草国产 | 欧美成人免费xxx大片,91在线视频一区,精品日韩一区二区三区,欧美日韩 在线播放,欧美在线aa,亚洲专区路线一路线二天美 | 日韩专区第一页-日韩中文字幕在线亚洲一区-日韩中文字幕在线观看视频-日韩中文字幕在线播放-日韩中文字幕一区二区不卡-日韩中文字幕一区 | 99国产精品欧美久久久久久影院,日本不卡中文字幕,国产片在线观看播放,日韩国产欧美在线观看,久久综合狠狠综合久久97色,婷婷在线影院 | 日本特黄一级-日本特黄特色aa大片免费-日本特黄特色aaa大片免费-日本特黄特黄aaaaa大片-二级特黄绝大片免费视频大片-二级片在线观看 | 极品丝袜小说全集-极品丝袜乱系列在线阅读-极品丝袜老师h系列全文阅读-极品手交handjobtattoo-亚洲男人网-亚洲男人天堂影院 | 国产视频自拍一区-国产手机精品一区二区-国产手机视频在线-国产手机视频在线观看-国产手机在线播放-国产手机在线观看精品视频 | kedou.xxx-lutube成人福利在线观看-luxu259在线中文字幕-m3u8久久国产精品影院-meisa hanai-mimiai最新网址 | 暧暧免费视频,国产成人+亚洲欧洲,国产成人免费视频精品一区二区,久久精品国产亚洲精品2020,久久伊人一区二区三区四区,欧美嫩交 | 2021国产精品视频一区-2021国产精品一区二区在线-2021国产精品自产拍在线-2021国产精品自产拍在线观看-2021国产精品自在拍在线播放-2021国产麻豆剧 | 欧美日韩国产精品-欧美日韩国产剧情-欧美日韩国产伦理-欧美日韩国产欧美-you ji z z日本人在线观看-you jizz jizz japan日本 | 成人免费视频77777,精品国产福利,欧日韩一区二区三区,国产高清视频在线观看,欧美日韩1区,欧美一区二区三区在线观看 | 四色草视频-四散的尘埃在线观看-四库国产精品成人-四虎最新网址入口-国产精品一区二区三区四区五区-国产精品一区二区三区四区 | 国产偷抇久久精品A片蜜臀A-国产偷抇久久精品A片蜜臀AV-国产偷抇久久精品A片图片-国产偷窥熟妇高潮呻吟-国产凸凹视频熟女A片-国产玩弄放荡人妇系列 | 色视频www在线播放国产人成-色射综合-色射网-色射啪-国产91成人-国产91白浆四溢 | 久 在线播放-九月婷婷人人澡人人添人人爽-九月婷婷人人澡人人爽人人爱-九月丁香婷婷亚洲综合色-天天干天天射天天-天天干天天色综合网 | 色视频www在线播放国产人成-色射综合-色射网-色射啪-国产91成人-国产91白浆四溢 | 黑人性xxxⅹxxbbbbb-黑人性xxx-黑人同学征服教师麻麻-黑人双渗透-亚洲精品国产成人中文-亚洲精品国产成人99久久 | 91精品视频播放-91精品视频免费播放-91精品视频免费观看-91精品视频免费在线观看-91精品视频网站-91精品视频一区二区 | 国产首页-国产手机精品自拍视频-国产视频综合-国产视频自拍一区-香蕉网在线播放-香蕉网在线 | 天天干天天操天天碰-天天干天天操天天摸-天天干天天操天天干-天天干天天操天天插-欧美一级久久久久久久久大-欧美一区二区VA毛片视频 | 久久精品免费电影-久久精品免费-久久精品美乳-久久精品美女视频-亚洲最大福利视频-亚洲综合视频一区 | 亚洲欧美在线x视频,国产97碰免费视频,88午夜理论不卡,伦理电影院一个免费看片高清在线欧美激情视频在线观看一区二区三区 | 美女内射毛片在线看-美女内射毛片在线看免费人动物-美女内射视频WWW网站午夜-美女强奷到抽搐在线播放-美女视频黄a视频全免费网站色窝-美女视频黄的全是免费 | 91导航在线-91岛国-91第一页-91短视频在线高清hd-91粉嫩萝控精品福利网站-91粉色视频在线观看 | 奇米影视一区二区三区-奇米影视一区-奇米影视久久-奇米影视777四色米奇影院-国产高清视频免费-国产高清日韩 | 久 在线播放-九月婷婷人人澡人人添人人爽-九月婷婷人人澡人人爽人人爱-九月丁香婷婷亚洲综合色-天天干天天射天天-天天干天天色综合网 | 国产一区二区三区四区五区加勒比-国产一区二区三区四区五区六区-国产一区二区三区四区五在线观看-国产一区二区三区无码A片-国产一区二区三区-国产一区二区三区亚洲欧美 | 亚洲国产欧美精品-亚洲国产欧美国产综合一区-亚洲国产欧美国产第一区-亚洲国产模特在线播放-好吊色青青青国产在线播放-好吊色青青草 | 日本黄页网站-日本黄页网-日本黄页视频-日本黄页免费大片在线观看-国产免费网址-国产免费网站看v片元遮挡 | 成人免费视频77777,精品国产福利,欧日韩一区二区三区,国产高清视频在线观看,欧美日韩1区,欧美一区二区三区在线观看 | 亚洲精品色情影片-亚洲精品沙发午睡系列-亚洲精品深夜AV无码一区二区-亚洲精品天堂在线观看-亚洲精品偷拍AV一区二区-亚洲精品偷拍影视在线观看 | 好男人天堂网,久久精品国产这里是免费,国产精品成人一区二区,男人天堂网2021,男人的天堂在线观看,丁香六月综合激情 | jjzz日本女人-jjzz网站-jjzz亚洲亚洲女人-jjzz在线观看-jlzzjizz-jlzzjlzz亚洲日本 | 亚洲日韩在线观看-亚洲日韩欧美一区二区在线-亚洲日韩aⅴ在线视频-亚洲日本一区二区三区在线不卡-久久黄视频-久久狠色噜噜狠狠狠狠97 | 国产一区二区三区四区五区加勒比-国产一区二区三区四区五区六区-国产一区二区三区四区五在线观看-国产一区二区三区无码A片-国产一区二区三区-国产一区二区三区亚洲欧美 |