端到端、世界模型、車路云……誰將成為2025年“AI+交通”最熱詞？

2024-12-14 08:04| 發(fā)布者: admin| 查看: 108| 評論: 0

摘要: 文 | 極智GeeTech1942年，科幻小說家艾薩克·阿西莫夫（Isaac Asimov）在他的短篇小說《轉(zhuǎn)圈圈》（Runaround）中第一次明確提出了“機器人三定律”，這一定律也被稱為“現(xiàn)代人工智能技術(shù)的基石”。阿西莫夫可能沒有 ...

文 | 極智GeeTech

1942年，科幻小說家艾薩克·阿西莫夫（Isaac Asimov）在他的短篇小說《轉(zhuǎn)圈圈》（Runaround）中第一次明確提出了“機器人三定律”，這一定律也被稱為“現(xiàn)代人工智能技術(shù)的基石”。

阿西莫夫可能沒有完全預見到，八十年后的世界會多么接近他的科幻夢想。

如今，人們生活在一個由人工智能滲透的世界里，這個世界在許多方面已超越阿西莫夫的想象。2024年，我們見證了一系列人工智能技術(shù)的創(chuàng)新與涌現(xiàn)。從AI視頻生成模型Sora到GPT-4o，一系列生成式人工智能新技術(shù)相繼問世、更新迭代，讓人感覺到似乎“未來已來”。

這一年，大模型、端到端、世界模型、車路云等已成為交通智能化領(lǐng)域最具革命性的技術(shù)應(yīng)用，不僅提升了駕駛體驗，還為城市交通的安全性、效率和可持續(xù)性帶來新的可能。

展望2025年，隨著人工智能與交通的進一步深度融合，哪些技術(shù)領(lǐng)域充滿機遇？誰將引領(lǐng)新一年的行業(yè)發(fā)展？

BEV+OCC感知能力困局待解

對照著自動駕駛領(lǐng)域這幾年的行業(yè)熱詞按圖索驥，可以把握自動駕駛算法模型的發(fā)展脈絡(luò)。在特斯拉的帶動下，自2021年至今，自動駕駛行業(yè)這幾年的動態(tài)熱詞依次為：BEV+Transformer、OCC占用網(wǎng)絡(luò)、無圖NOA、端到端。

BEV（鳥瞰圖）網(wǎng)絡(luò)通過矢量化的鳥瞰視角檢測白名單障礙物，OCC通過體素化的占用網(wǎng)絡(luò)預測3D空間的占位情況，實現(xiàn)對通用障礙物的感知，到無圖NOA的階段，自動駕駛算法可以通過車道網(wǎng)絡(luò)實時建圖，構(gòu)建道路拓撲。

再到今年大火的端到端，一方面，由于消除了傳統(tǒng)分模塊方案中各種小模型的冗余，計算資源得以集約化使用，神經(jīng)網(wǎng)絡(luò)的參數(shù)量或規(guī)模得以進一步提升；另一方面，無論是分段式端到端還是一體式端到端，感知到?jīng)Q策之間的傳輸帶寬增加，信息損失減少，進一步增強了系統(tǒng)的感知能力。

對于駕駛而言，感知交通環(huán)境信息越全面、越及時，駕駛的安全性也就相對越高。因此，自動駕駛系統(tǒng)對感知能力的需求是沒有上限的。

BEV網(wǎng)絡(luò)固然可以檢測白名單障礙物，但能檢測到1000多種物體基本上就是目前BEV網(wǎng)絡(luò)的感知上限。OCC占用網(wǎng)絡(luò)可以檢測通用障礙物，但OCC算法的運算量跟隨網(wǎng)格的大小成倍變化，網(wǎng)格大小縮減一倍，OCC算法的運算量將增加8倍，受限于算力和實時性，OCC網(wǎng)格的大小一般只能做到10厘米左右，這就意味著它很難檢測微小物體。在很多情況下，10公分大的物體足以造成交通事故了。