近日,電控學(xué)院惠飛教授團(tuán)隊(duì)與權(quán)思文副教授團(tuán)隊(duì)的兩項(xiàng)創(chuàng)新性研究成果先后被人工智能領(lǐng)域頂級(jí)國(guó)際期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》(TPAMI)接收發(fā)表。
惠飛教授團(tuán)隊(duì)長(zhǎng)期致力于自動(dòng)駕駛環(huán)境感知與邊緣計(jì)算研究。針對(duì)三維目標(biāo)檢測(cè)模型在嵌入式設(shè)備上部署時(shí)面臨的計(jì)算資源受限難題,團(tuán)隊(duì)創(chuàng)新性地提出類(lèi)別知識(shí)驅(qū)動(dòng)的網(wǎng)絡(luò)壓縮框架(CLEAN),實(shí)現(xiàn)了高性能3D目標(biāo)檢測(cè)模型的輕量化與加速,為自動(dòng)駕駛、機(jī)器人導(dǎo)航等實(shí)時(shí)應(yīng)用場(chǎng)景提供了全新解決方案。論文《CLEAN: Category knowledge-driven compression framework for efficient 3D object detection》中,惠飛教授為第一通訊作者,張昊楠老師為第一作者,西安交通大學(xué)人工智能學(xué)院劉龍軍副教授為共同第一作者和共同通訊作者,長(zhǎng)安大學(xué)作為第一署名單位和第一通訊單位。
基于點(diǎn)云的三維目標(biāo)檢測(cè)網(wǎng)絡(luò)在自動(dòng)駕駛感知系統(tǒng)中發(fā)揮著重要的作用,然而大量的參數(shù)和重復(fù)的運(yùn)算卻限制了點(diǎn)云檢測(cè)網(wǎng)絡(luò)在實(shí)際資源受限車(chē)載平臺(tái)上的部署。知識(shí)蒸餾技術(shù)(knowledge distillation)能夠有效地獲取輕量化點(diǎn)云檢測(cè)網(wǎng)絡(luò),但傳統(tǒng)蒸餾方案通常在同構(gòu)網(wǎng)絡(luò)之間傳遞有限的知識(shí),并且它們沒(méi)有充分探索最優(yōu)的網(wǎng)絡(luò)架構(gòu),這限制了學(xué)生網(wǎng)絡(luò)的精度提升。為了解決上述問(wèn)題,如圖1所示,研究團(tuán)隊(duì)提出了一種類(lèi)別知識(shí)驅(qū)動(dòng)的網(wǎng)絡(luò)壓縮框架。首先,該方法提出學(xué)生驅(qū)動(dòng)的預(yù)測(cè)蒸餾策略(student-oriented knowledge distillation, SKD)和兩階段知識(shí)驅(qū)動(dòng)的標(biāo)簽蒸餾策略(two-stage-oriented label assignment distillation, TLAD),它們將兩階段檢測(cè)網(wǎng)絡(luò)的知識(shí)遷移至單階段檢測(cè)網(wǎng)絡(luò)(異構(gòu)蒸餾),從而避免同構(gòu)蒸餾對(duì)網(wǎng)絡(luò)精度提升的限制。另外,為了探索最優(yōu)的輕量化學(xué)生網(wǎng)絡(luò)架構(gòu),該壓縮框架提出關(guān)鍵區(qū)域類(lèi)別知識(shí)驅(qū)動(dòng)的結(jié)構(gòu)化剪枝方案(masked category knowledge-driven structured pruning, MCaPr),其通過(guò)移除架構(gòu)前后,關(guān)鍵區(qū)域?qū)?yīng)類(lèi)別預(yù)測(cè)的變化來(lái)度量對(duì)應(yīng)架構(gòu)的重要性。此外,該壓縮框架建立基于交并比的冗余預(yù)測(cè)消除模塊(modified IoU-aware redundancy elimination, MIRE),以此來(lái)進(jìn)一步移除冗余的假陽(yáng)性預(yù)測(cè),獲取更高的檢測(cè)精度。大量實(shí)驗(yàn)驗(yàn)證了所提出壓縮框架的有效性,如在WOD-mini數(shù)據(jù)集上,該方法在將CenterPoint網(wǎng)絡(luò)參數(shù)量減少5.2倍的情況下,精度(L2 mAPH)反而提升了0.55%。研究成果為點(diǎn)云三維目標(biāo)檢測(cè)網(wǎng)絡(luò)在實(shí)際車(chē)載平臺(tái)上的部署提供了有效的解決方案。

圖1 類(lèi)別知識(shí)驅(qū)動(dòng)的網(wǎng)絡(luò)壓縮框架示意圖
論文信息:H. Zhang, L. Liu, F. Hui, B. Zhang, H. Zhang and Z. Zha. CLEAN: Category Knowledge-driven compression framework for efficient 3D object detection [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 47, no. 10, pp. 8740-8755.
權(quán)思文副教授團(tuán)隊(duì)圍繞計(jì)算機(jī)視覺(jué)中的三維點(diǎn)云配準(zhǔn)難題,提出"Single Voter Spreading"創(chuàng)新機(jī)制,顯著提升了三維對(duì)應(yīng)點(diǎn)分組與配準(zhǔn)的效率和魯棒性。該技術(shù)可廣泛應(yīng)用于增強(qiáng)現(xiàn)實(shí)、文化遺產(chǎn)數(shù)字化保護(hù)、工業(yè)零件檢測(cè)等領(lǐng)域。在論文《Single Voter Spreading for Efficient Correspondence Grouping and 3D Registration》中,權(quán)思文副教授為第一作者,2023級(jí)碩士生曾釗為學(xué)生第一作者。論文第一署名單位為長(zhǎng)安大學(xué),相關(guān)研究由長(zhǎng)安大學(xué)與西北工業(yè)大學(xué)聯(lián)合完成。
針對(duì)點(diǎn)云間初始對(duì)應(yīng)關(guān)系存在大量外點(diǎn)、重疊度有限等顯著干擾,進(jìn)而導(dǎo)致下游三維配準(zhǔn)與識(shí)別任務(wù)面臨嚴(yán)峻挑戰(zhàn)的行業(yè)痛點(diǎn),團(tuán)隊(duì)提出了一種基于單投票者擴(kuò)散(SVOS)的高效三維對(duì)應(yīng)分組與配準(zhǔn)方法,其核心創(chuàng)新在于僅利用低階圖約束構(gòu)建單投票者擴(kuò)散投票機(jī)制,在無(wú)需搜索復(fù)雜約束的前提下,實(shí)現(xiàn)了與復(fù)雜約束相當(dāng)?shù)募s束能力。通過(guò)在3DMatch與3DLoMatch等標(biāo)準(zhǔn)數(shù)據(jù)集上開(kāi)展的大量實(shí)驗(yàn)驗(yàn)證,SVOS方法在配準(zhǔn)精度與效率上均優(yōu)于現(xiàn)有方法,尤其在面對(duì)99.9%的海量外點(diǎn)極端場(chǎng)景時(shí),其配準(zhǔn)精度顯著高于當(dāng)前主流SOTA方法,充分驗(yàn)證了該方法在應(yīng)對(duì)復(fù)雜干擾場(chǎng)景下的顯著優(yōu)勢(shì)與良好魯棒性。

圖2 研究方法流程
論文信息:Quan S, Zeng Z, Zhang X, et al. Single Voter Spreading for Efficient Correspondence Grouping and 3D Registration[J]. IEEE transactions on pattern analysis and machine intelligence, 2026, 48(2): 1081-1097.
TPAMI由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)認(rèn)定為A類(lèi)推薦期刊(2024年影響因子:18.6),與CVPR、ICCV等頂級(jí)會(huì)議并列,是人工智能與模式識(shí)別領(lǐng)域影響因子最高、審稿最嚴(yán)格的學(xué)術(shù)期刊之一,長(zhǎng)期關(guān)注機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)等前沿方向。
(審稿:高婷婷 網(wǎng)絡(luò)編輯:和燕)