蘋果公司在自動(dòng)駕駛領(lǐng)域取得了一項(xiàng)重大突破,其最新研究將自博弈(Self-play)技術(shù)引入自動(dòng)駕駛系統(tǒng),實(shí)現(xiàn)了前所未有的魯棒性和性能表現(xiàn)。這一成果不僅展示了蘋果在自動(dòng)駕駛技術(shù)上的深厚積累,也為自動(dòng)駕駛領(lǐng)域的發(fā)展提供了新的思路和方向。 據(jù)悉,蘋果的自博弈技術(shù)是通過(guò)讓智能體在與自我的副本或歷史版本進(jìn)行博弈,從而實(shí)現(xiàn)算法的自我進(jìn)化和優(yōu)化。這一技術(shù)此前已在游戲、機(jī)器人和生物工程等領(lǐng)域取得了顯著成效,而蘋果此次將其應(yīng)用于自動(dòng)駕駛,更是取得了令人矚目的成果。 在研究中,蘋果設(shè)計(jì)了極簡(jiǎn)的獎(jiǎng)勵(lì)函數(shù),無(wú)需依賴真實(shí)數(shù)據(jù),而是生成了“前所未有規(guī)模”的模擬數(shù)據(jù)。通過(guò)讓若干智能體在地圖上大亂斗,實(shí)現(xiàn)算法的自我學(xué)習(xí)和進(jìn)化。這種訓(xùn)練方式不僅速度快,成本極低,而且最終實(shí)現(xiàn)了SOTA(State Of The Art,即當(dāng)前最佳)的效果。 據(jù)蘋果透露,其利用公共云上的8張A100 GPU,每小時(shí)可模擬和學(xué)習(xí)44億次狀態(tài)轉(zhuǎn)移,相當(dāng)于720萬(wàn)公里的駕駛經(jīng)驗(yàn)。一輪完整的訓(xùn)練僅需10天,就能學(xué)到16億公里的駕駛里程,這一數(shù)據(jù)相當(dāng)于從太陽(yáng)到土星的距離。而每百萬(wàn)公里的費(fèi)用還不到5美元,折合人民幣僅為1萬(wàn)公里3毛6,這一成本和速度在自動(dòng)駕駛領(lǐng)域堪稱驚人。 為了驗(yàn)證這一成果的有效性和泛化性,蘋果將其在CARLA、nuPlan和Waymo等開(kāi)放數(shù)據(jù)集上進(jìn)行了零樣本獨(dú)立測(cè)試,均獲得了SOTA表現(xiàn)。這些基準(zhǔn)涵蓋不同地圖、駕駛場(chǎng)景、交通密度和評(píng)分標(biāo)準(zhǔn),充分證明了蘋果工作的泛化性和魯棒性。 值得一提的是,蘋果此次取得SOTA成果的背后,是其自主研發(fā)的GIGAFLOW模擬器。GIGAFLOW是一個(gè)批量模擬器,通過(guò)生成海量的GIGAFLOW World,實(shí)現(xiàn)了極簡(jiǎn)版的世界模型。它無(wú)需編寫場(chǎng)景腳本,無(wú)需人類司機(jī)的駕駛數(shù)據(jù),也不用設(shè)計(jì)復(fù)雜的獎(jiǎng)勵(lì)函數(shù),僅通過(guò)簡(jiǎn)單的獎(jiǎng)勵(lì)項(xiàng)和處罰項(xiàng),就能讓智能體在自博弈中學(xué)會(huì)并道、無(wú)保護(hù)左轉(zhuǎn)和繞過(guò)事故現(xiàn)場(chǎng)等復(fù)雜駕駛行為。 盡管蘋果在自動(dòng)駕駛領(lǐng)域取得了這一重大突破,但其造車項(xiàng)目卻曾一度擱淺。不過(guò),從此次發(fā)布的成果來(lái)看,蘋果并未放棄在自動(dòng)駕駛領(lǐng)域的探索和研發(fā)。相反,通過(guò)引入自博弈技術(shù)和自主研發(fā)GIGAFLOW模擬器,蘋果在自動(dòng)駕駛技術(shù)上取得了顯著進(jìn)展,為未來(lái)的造車項(xiàng)目奠定了堅(jiān)實(shí)基礎(chǔ)。 (9511232) |
19款電子扎帶
電路板識(shí)別電子標(biāo)簽