日本在线www-日本在线播放一区-日本在线不卡免费视频一区-日本在线不卡视频-成人影院久久久久久影院-成人影院一区二区三区

最新廣告
關注中國自動化產業發展的先行者!
工業智能邊緣計算2025年會
CAIAC 2025
2025工業安全大會
OICT公益講堂
當前位置:首頁 >> 案例 >> 案例首頁

案例頻道

用Spartan-3A DSP器件實現汽車應用中的塊匹配
  • 企業:控制網     領域:工廠信息化     行業:金融/保險    
  • 點擊數:2113     發布時間:2008-08-11 13:09:28
  • 分享到:

  汽車工程師采用多種智能技術幫助人們安全駕駛汽車。汽車系統中的主要技術包括雷達、超聲和攝像/視覺感測。這些技術統稱駕駛員輔助 (DA) 系統,用于在惡劣條件和危險路況下協助安全駕駛。

  第一代攝像 DA 系統目前可見于各種生產用車型。這類系統大多為駕駛員提供車輛周邊環境的視頻圖像。最常見的是泊車/倒車輔助系統,這種系統用后視攝像頭拍攝本車后面的景物,并且在收音機/導航系統的屏幕上或者在儀表板中的小型顯示器上顯示圖像。

  第二代攝像系統正處于開發測試階段,目前使用有限。第二代系統并非僅為駕駛員提供圖像,而是運用圖像處理與解析從視頻流中提取信息,并且對車輛環境進行表征和評估。必要時駕駛員會收到相應警示。

  隨著工程師們獲取車輛環境表征方面的實際經驗,未來的 DA 技術會更復雜,將為消費者提供更強大的實用工具并且增強其它汽車子系統的性能。圖 1 概括了目前和未來的多種 DA 功能。

  

  高級處理要求

  DA 系統的處理要求可能超過目前汽車級串行 DSP 處理器的能力。另外,為了提高消費價值,在一套視覺傳感器上捆綁多種 DA 功能的需求日益高漲。

  例如,前瞻視覺模塊可能需要同時支持車道偏離警示、智能大燈控制和標志識別功能,而所有這些都需要不同的處理算法。因此,對于用 FPGA 通過原始圖像數據處理、配置靈活性和器件可縮放性來提供系統價值,DA 市場提供了實實在在的機會。

  視覺 DA 系統的圖像處理與解析功能可以包括空間/時間濾波、鏡頭失真校正、圖像清晰化、對比度增強、邊沿檢測、圖像匹配、物體識別和物體跟蹤,在某些情況下還包括圖形疊加。尤其值得關注的是一種支持運動估計或立體視差計算的圖像匹配功能。

  為了說明 FPGA 處理的性能價值,我們來考慮這樣一個視覺系統:以 30 Hz 幀速率 (fps) 生成視頻的寬幅 VGA 分辨率成像器件(752 x 480 像素),而且需要估計幀間物體運動(或流動)。有一種算法(也適用于立體視差計算)是將圖像劃分為若干個塊(如大小為 4 x 4 像素),然后判斷第一幀中各圖像塊對第二幀中指定搜索區(如 20 x 20 像素)內某位置的匹配條件。

  一種常用的匹配條件是用算子 SAD(絕對差和)求出第一幀圖像中的4x4塊與第二幀圖像上搜索區內的像素之間的像素灰度最小絕對誤差 (MAE)。

  4 x 4 塊匹配示例需要 250 MMAE/s(每秒百萬次 MAE 計算)以上的性能,因為 (752 像素) x (480 行) x (20 x 20 像素搜索區) x (30 fps)/(4 x 4 像素塊大小) = 270,720,000 MAE/s。MAE 表示 4 x 4 像素塊的最終匹配誤差,而 SAD 是指根據四個獨立元素對進行計算得到的絕對差和。所以,每 MAE 需要四次 SAD 運算。

  處理選項

  由汽車設計工程師決定的處理選項包括超長指令字 (VLIW) DSP-CPU 和 FPGA。FPGA 的處理能力遠遠高于任何現有的 VLIW DSP-CPU。這是由于 FPGA 的架構:大量并行功能單元(包括可編程 MAC)使 FPGA 的性能比任何 DSP 都高出 10-30 倍(具體性能取決于所實現的應用),即使 FPGA 的時鐘頻率比 DSP-CPU 的時鐘頻率低得多。

  VLIW DSP-CPU 處理器中的 SAD 和 MAE 計算

  在一個 32 位架構的單指令多數據 (SIMD) DSP-CPU 中可實現四個 8 位像素視頻數據單元的 SAD 運算,因此,僅在一個周期內即可有效執行相當于11條基本指令的運算,如圖 2 所示。

  

  例如,Nexperia PNX1500 媒體處理器配有 32 位 TriMedia VLIW-CPU,對于具有二周期延遲的 8 位像素,可以在一個時鐘周期內執行兩條四路 SAD 指令。算上超長指令字,就是每時鐘周期最多五條基本RISC/SIMD指令,其中只有兩條可以是SAD指令(在TriMedia數據手冊中稱為“8meii”)。

  所以,對 4 x 4 大小的塊進行 MAE 計算需要五個時鐘周期,如表 1 所示:兩個周期用于兩條四路 SAD 指令的流水線處理(周期 1 用于 sad1/sad2,周期 2 用于 sad3/sad4);三個周期用于部分結果的累加(周期3、4 和 5)。因此,如果只處理一個塊,則一個 300 MHz 的 Nexperia PNX1500 處理器的處理能力最高可達 60 MMAE/s。

  

  如果每次處理一個以上 4 x 4 塊,最高性能可略有提高。例如,可以在七個周期內計算兩個并行4x4塊的 MAE,這時性能可達85.71MMAE/s;而處理三個塊需要九個周期,即性能為100MMAE/s。

  可并行處理的最大塊數分別受限于任意長指令字中允許的 SIMD SAD 運算次數、VLIW-CPU的通用寄存器數和優化編譯器的調度算法。如果繼續增加塊數,整體性能會趨于飽和,因此我們考慮并行處理的 MAE 不超過三個。

  TI 的 TMSD320DM6437 數字媒體處理器每周期有一條由八次基本 RISC 運算組成的長指令,分別通過兩條數據通路,各通路每周期有四個時隙。其 VLIW-CPU 每周期最多可執行兩條 SAD 指令(在 TI DM6437 數據手冊中稱為“subabs4”),各指令有一個周期的延遲。但是,要累加部分結果,就必須使用常數 0x01010101 執行具有三周期延遲的 SIMD MAC 運算(稱為“dotpsu4”)。

  所以,600 MHz 的 TI DM6437 DSP-CPU 可以用七個周期計算一個 MAE(如表 2 所示),因此對于 4 x 4 像素塊的最高性能為 85.71 MMAE/s。如果并行處理兩個塊,就需要九個周期,性能為 133.33 MMAE/s;而三個塊需要11個周期,性能為163.64 MMAE/s,這仍然低于我們的 250 MSAD/s 要求。

  

  VLIW DSP-CPU 性能不足

  至此,我們一直假定每像素 8 位,這很適合 32 位架構的 DSP-CPU 處理器。然而,新型 CMOS 圖像傳感器的分辨率范圍較高,即每像素 12 到 14 位。對于這些數據類型,32 位架構的傳統四路 8 位子字 SIMD 不夠有效,必須換用雙路 16 位半字 SIMD,其中的子字并行度僅為二。因此,由于計算一個 MAE 需要較多時鐘周期,最高性能大幅度下降。

  表 3 所示為在 TI VLIW DSP-CPU 上使用 16 位子字指令計算 SAD 時可能的偽匯編代碼,假定延遲正確且函數發射時隙允許執行這種指令。因此,一個 4 x 4 的塊需要八個周期,而并行處理兩個和三個塊分別需要 10 個和 12 個周期。這時,相應的最高性能分別為 75 MMAE/s、120 MMAE/s 和 150 MMAE/s。這些數字都比使用 8 位子字指令得到的數字小。

  

  Spartan-3A DSP FPGA 的 SAD 和 MAE 性能

  為了填補Spartan-3和Virtex-4 器件之間的處理性能空白,Xilinx 推出的Spartan 3A-DSP 1800A和3400A FPGA采納了 Virtex-4 器件中的 DSP48 Slice 的修改版。另外,3A-DSP 器件包括大量片上存儲器(Block RAM)。這兩方面增強加上針對大量應用制訂的價位使 3A-DSP 器件非常適合汽車視覺 DA 系統。

  圖3所示為Spartan-3A DSP 1800 (XC3SD1800A-4FG676)器件上的四路12 位像素的 SAD 計算方案。此方案是使用 System Generator for DSP 設計流程(Xilinx 提供的 Simulink 工具中的數字和周期都精確的可綜合庫)完成的。所需資源數量是 121 個 Slice(236 個 LUT 和 140 個觸發器)。將此結構復制四次并且加上部分結果,即得到整個 4 x 4 塊的計算方案,該方案需要 508 個 Slice(990 個觸發器和 606 個 LUT),具有一個周期吞吐量(這意味著可從任意時鐘周期開始計算新的 MAE)和七個周期延遲。

  

  如果使用 150 MHz 時鐘頻率(該器件最高時鐘頻率為 250 MHz),只需要兩個并行結構(約占器件面積的 6%)即可達到300 MMAE/s的性能,從而滿足示例應用的250 MMAE/s 性能要求。這樣可以節省大量資源用來實現其它圖像處理功能、數據路由通道、存儲器接口控制器以及一個用于串行處理和外部通信的 32 位 MicroBlaze 嵌入式處理器。

  作為參考,仍然用 150 MHz 頻率,Spartan 3A-DSP 1800A 器件僅使用整個 FPGA 器件的 70%, 即可并行處理多達 23 個塊(70% x 16,640 Slice/508 Slice/塊 = 23 塊)。與此對應的最高性能是 3,529 MMAE/s,這至少要比 600 MHz 的 TI DSP-CPU 的最高性能高 25 倍。

  結論

  以汽車視覺應用為例說明了如何利用中型低成本 Xilinx FPGA的可編程并行處理能力提供超過VLIW DSP-CPU 的處理性能。表 4 列出了分析結果。

  

  值得注意的是對于 12 位像素數據的 4 x 4 塊的 MAE 計算,Spartan-3A DSP 的性能僅以四分之一時鐘速度即可達到 TI TMS320DM6437 的兩倍。另外,FPGA 的資源占用率僅為 6%,因此可以在同一器件上實現其它圖像處理功能(必要時可采納并行處理)。

  另一方面,VLIW DSP-CPU 在 SAD 計算期間被完全占用,消耗串行處理器長指令的可用時隙,因此很少有機會同時執行其它功能。

  我們對于 FPGA 的估算時鐘頻率相當保守(以 150 MHz 對 250 MHz),對于運動估算的搜索區也是如此(搜索區越大,需要計算的 MAE 的數量就越多)。例如,30 x 30 的搜索區需要 609 MMAE/s 的性能(遠遠超過 VLIW DSP-CPU 的能力),然而卻僅占用 1800A 器件上 Slice 的 12%。

  最后需要說明的是,在實現 MAE 時根本未使用 DSP48 MAC 單元:因為據估計,如果用四個 DSP48 單元取代由 100 個 Slice 組成的加法器樹,則一個 12 位輸入數據 MAE 的 4 x 4 塊會占用 400 個 Slice(782 個觸發器和 400 個 LUT)和四個 DSP48。

  因此,Spartan-3A DSP 1800A 器件非常適合需要極高處理性能、靈活性和可縮放性的視覺應用,如未來型汽車駕駛員輔助系統中的視覺應用。

熱點新聞

推薦產品

x
  • 在線反饋
1.我有以下需求:



2.詳細的需求:
姓名:
單位:
電話:
郵件:
主站蜘蛛池模板: 日本久色-日本久久综合视频-日本久久综合-日本久久中文字幕-日本久久一区二区-日本久久网站 | 欧美人成在线视频-欧美人成一本免费观看视频-欧美人xxxxxbbbb-欧美区在线-在线不卡免费视频-在线播放周妍希国产精品 | 欧美人成在线视频-欧美人成一本免费观看视频-欧美人xxxxxbbbb-欧美区在线-在线不卡免费视频-在线播放周妍希国产精品 | 热久久国产-热99这里只有精品-热99这里有精品综合久久-热99在线观看-国产精品99久久久-国产精品99久久99久久久看片 | 亚洲女同在线观看-亚洲女同在线-亚洲女同视频-亚洲女同精品中文字幕-美国激情ap毛片-美国黄色一级毛片 | 九九国产在线视频-九九国产在线观看-九九国产在线-九九国产视频-亚洲夜色夜色综合网站-亚洲羞羞视频 | 老司机午夜精品网站在线观看-老司机午夜精品视频在线观看免费-老司机午夜精品视频观看-老司机午夜精品视频播放-一本色道久久88一综合-一本色道久久88综合日韩精品 | 亚洲尹人-亚洲伊人久久综合影院2021-亚洲伊人久久在-亚洲伊人久久网-免费网站在线观看人数在哪里看的-免费网站在线观看国产v片 | 日韩伦理在线-日韩伦理片-日韩久久网-日韩精选-日韩精品综合-日韩精品资源 | 亚洲日日操,国产乱视频在线观看播放,国产一区二区三区不卡观,日本精品久久久久久久,久久作爱视频,色狠狠婷婷97 | 日韩专区第一页-日韩中文字幕在线亚洲一区-日韩中文字幕在线观看视频-日韩中文字幕在线播放-日韩中文字幕一区二区不卡-日韩中文字幕一区 | 甜性涩爱在线播放-甜性涩爱下载-甜性涩爱全集在线观看-甜性涩爱免费下载-国产成人午夜精品免费视频-国产成人无码一区AV在线观看 极品少妇粉嫩小泬啪啪AV-极品少妇粉嫩小泬啪啪小说-极品少妇高潮啪啪AV无码-极品少妇伦理一区二区-极品少妇小泬50PTHEPON-极品夜夜嗨久久精品17c | 欧美人与性动交a欧美精品-欧美人与物另类-欧美人与牲动交a欧美精品-欧美人与禽片免播放-国产福利在线观看永久免费-国产福利在线播放 | 国产又黄又爽又猛的免费视频播放-国产又黄又爽视频免费观看-国产又黄又湿又刺激不卡网站-国产又黄又a又潮娇喘视频-亚洲国产美女福利直播秀一区二区-亚洲国产乱码在线精品 | 成人综合网久久-成人综合网亚洲伊人-成人综合网站-成人综合网站一区二区三区四区-成人综合网站在线-成人综合网址 | 岛国精品在线观看-岛国精品在线-岛国大片在线免费观看-岛国大片在线观看完整版-日本老师xxxx88免费视频-日本久久综合网 | 午夜久久久久久-午夜久久久-午夜精品在线免费观看-午夜精品影院-国产日韩久久-国产日韩精品一区在线观看播放 | 岛国精品在线观看-岛国精品在线-岛国大片在线免费观看-岛国大片在线观看完整版-日本老师xxxx88免费视频-日本久久综合网 | 国产一区二区高清,久久亚洲私人国产精品va,日韩精品观看,国产高清美女一级毛片久久,国产区亚洲区,日本久久香蕉一本一道 | 五月婷六月婷婷,97九色,成年人国产,精品久久久久久久,久久久久久久国产精品电影,国产在线观看青草视频 | 欧美日韩亚洲无线码在线观看,国产成人亚洲综合91精品555,欧美成人国产,国产成人青青热久免费精品,亚洲欧美日韩色图,国产三级网站在线观看 | 成人综合网久久-成人综合网亚洲伊人-成人综合网站-成人综合网站一区二区三区四区-成人综合网站在线-成人综合网址 | 国产 在线 | 日韩,精品一区二区三区的国产在线观看,亚洲国产精品日韩在线,国产视频在,青青国产成人久久91网站站,国内精品视频免费观看 | 美女三级毛片-美女牲交视频一级毛片无遮挡-美女视频大全视频a免费九-美女视频黄a视频全免费网站色窝-美女视频黄的全是免费-美女视频秀色福利视频 | 国产精选一区二区-国产精选一区-国产精选污视频在线观看-国产精选91热在线观看-特级黄色视频毛片-特级黄色免费片 | 亚洲第一视频网-亚洲第一色在线-亚洲第一色网站-亚洲第一人黄所-亚洲第一区在线观看-亚洲第一区在线 | 午夜黄色福利视频-午夜激情爱爱-午夜激情婷婷-午夜家庭影院-午夜精品A片久久慈禧-午夜精品A片久久软件 | 欧美一区精品,亚洲综合在线视频,国产v欧美v日韩在线观看,国产精品麻豆,亚洲小色网,欧美a在线观看 | 好男人天堂网,久久精品国产这里是免费,国产精品成人一区二区,男人天堂网2021,男人的天堂在线观看,丁香六月综合激情 | 老司机午夜精品网站在线观看-老司机午夜精品视频在线观看免费-老司机午夜精品视频观看-老司机午夜精品视频播放-一本色道久久88一综合-一本色道久久88综合日韩精品 | 视频免费观看网址-视频免费观看视频-视频免费观看入口大全-视频免费1区二区三区-国产成人尤物精品一区-国产成人悠悠影院 | 国产一级一级一级成人毛片-国产一级一级片-国产一级网站-国产一级特黄在线播放-午夜影院一区二区三区-午夜影院小视频 | 亚洲尹人-亚洲伊人久久综合影院2021-亚洲伊人久久在-亚洲伊人久久网-免费网站在线观看人数在哪里看的-免费网站在线观看国产v片 | 久久免费高清视频-久久免费大片-久久免费播放视频-久久免费播放-午夜性色吃奶添下面69影院-午夜性色 | 91看片淫黄大片欧美看国产片-91看片在线观看-91蝌蚪91九色-91蝌蚪国产-91蝌蚪九色-91蝌蚪论坛 | 久久免费高清视频-久久免费大片-久久免费播放视频-久久免费播放-午夜性色吃奶添下面69影院-午夜性色 | 国产福利在线视频尤物tv-国产福利在线看-国产福利在线高清导航大全-国产福利在线-国产福利影视-国产福利一区二区麻豆 | 性情网站-性派对交换俱乐部-性派对xxxhd-性派对videos18狂欢-国产中学生-国产中文字幕在线视频 | 2022精品国产-2022精品福利在线小视频-2022黄网-2022国产男人亚洲欧美天堂-2022国产毛片大全-2022国产精品网站在线播放 | 在线观看 一区-在线观看 亚洲-在线观看 日韩-在线观看 免费高清视频-久久婷婷国产一区二区三区-久久婷婷国产五月综合色啪最新韩国 | 北条麻妃在线观看,国产播放器一区,日本丶国产丶欧美色综合,亚洲一区二区三区高清,九九九国产,亚洲欧美久久精品一区 |