Tradicinės autonominės vairavimo sprendimų priėmimo sistemos dažnai remiasi moduliniu dizainu. Nuo aplinkos suvokimo, sprendimų priėmimo planavimo iki transporto priemonės valdymo, kiekvienas posistemis veikia savarankiškai ir bendradarbiaujant kontroliuoja transporto priemonės veiklą. Sudėtinguose eismo scenarijuose ši hierarchinė architektūra yra linkusi į tokias problemas kaip kaupiamosios klaidos, informacijos praradimas ir nepakankamas realaus laiko našumas. Dideli modeliai palaipsniui keičia šią situaciją pagal savo didžiulius parametrus, įvairių modelių duomenų apdorojimo galimybes ir mokymosi paradigmas nuo galo iki galo. Tai gali ne tik pasiekti efektyvų daugia jutiklių duomenų susiliejimą suvokimo lygmeniu, bet ir suplanuoti pagrįstas transporto priemonių vairavimo strategijas per gilų semantinį supratimą ir loginius samprotavimus sprendimų priėmimo lygiu, taip padidindamas bendrą saugumą ir tvirtumą.
Didelių modelių pranašumai autonominiame vairavime
Pačios autonominės vairavimo technologijos kūrimo procesas išgyveno daugybę etapų, pradedant nuo ankstyvo vairavimo iki laipsniško perėjimo prie visiškai autonominio vairavimo. Ankstyvosios sistemos dažniausiai rėmėsi paprastu objektų aptikimu ir taisyklių valdymu. Tobulinant gilų mokymąsi, priėmus tokius metodus kaip CNN, RNN ir net GAN, nuolat tobulino aplinkos suvokimą ir sprendimų priėmimo galimybes. Be to, technologijos, sujungusios BEV (paukščių akių vaizdą) vaizdavimą ir transformatorių, tam tikru mastu tam, kad būtų sukurta tradicinių metodų trūkumais, modeliuojant erdvės ir laiko modeliavimą. Galima sakyti, kad didelių modelių įvedimas iš esmės keičia bendrą autonominių vairavimo sistemų architektūrą, kurioje ateityje pateikiami tvirtas pagrindas L3, L4 ir net L5 lygių komercializavimui.
Modelio architektūra, paremta transformatoriumi, paprastai priima savarankiškumo mechanizmą, kuris gali užfiksuoti tolimojo nuotolio priklausomybes ir taip žymiai pagerinti informacijos apdorojimo pasaulį ir tikslumą. Taikant išankstinio mokymo metodą, modelis yra iš anksto apmokytas didelio masto nepaženklintais duomenimis, o po to tiksliai sureguliuotas konkrečioms autonominėms vairavimo užduotims. Tai ne tik sumažina priklausomybę nuo didelio etiketės duomenų kiekio, bet ir leidžia modeliui turėti geras įvairių sričių migracijos galimybes. Multimodaliniai dideli modeliai tuo pačiu metu gali apdoroti įvairias duomenų formas, tokias kaip vaizdai, taškų debesys ir radaro duomenys, pasiekdami šuolį iš „matymo“ į „supratimą“ ir suteikiant autonomines vairavimo sistemas, turinčias kognityvines galimybes, panašias į žmonių.
Konkretus didelių modelių pritaikymas autonomiškai vairuojant
Autonominėse vairavimo sistemose didelių modelių taikymas daugiausia atsispindi įvairiais aspektais, tokiais kaip aplinkos suvokimas, sprendimų priėmimas ir planavimas bei transporto priemonių valdymas. Kalbant apie aplinkos suvokimą, tradicinės sistemos daugiausia remiasi vieno jutiklio duomenimis tiksliniam aptikimui ir semantiniam segmentavimui. Tačiau dėl apšvietimo, orų ir pačių jutiklių apribojimų dažnai sunku susidoroti su sudėtingais scenarijais. Naudodamiesi multimodalinių duomenų sintezės technologija, dideli modeliai gali integruoti įvairius duomenis, tokius kaip fotoaparatai, lidarai, milimetrų bangos radarai ir aukšto tikslumo žemėlapiai, kad būtų suformuotas turtingesnis ir tiksliesnis aplinkos vaizdas. Pvz., Vaizdinės kalbos veikimo modelis (VLA) gali tuo pačiu metu išgauti vaizdinę informaciją ir semantinę informaciją paveikslėlyje, ir parodo ypač aukštą tikslumą aptikti kliūtis, numatyti pėsčiųjų elgesį ir vertinti kelio sąlygas. Po kelių jutiklių informacijos labai sulieja didelis modelis, ne tik padidina tikslinio aptikimo patikimumą, bet ir dinaminių scenų numatymą galima pasiekti atliekant laiko eilučių analizę, užtikrinant patikimesnį įvestį priimant transporto priemonės sprendimus.
Sprendimų priėmimo ir planavimo lygmenyje tradicinės autonominės vairavimo sistemos paprastai remiasi iš anksto nustatytomis taisyklėmis arba modeliais pagrįstais planavimo algoritmais, kad suvokimo rezultatai būtų paversti kelio planavimo ir veiksmų sprendimais. Tačiau šis metodas yra linkęs į nesėkmę susidūrus su sudėtingomis eismo sąlygomis, kurios dar niekada nebuvo matomos, o sąsajos dizainas tarp kiekvieno modulio yra gana nelankstus, todėl sunku pasiekti optimizavimą nuo galo iki galo. Naudodamiesi mokymosi sistema nuo galo iki galo, dideli modeliai gali tiesiogiai išgauti pagrindinę informaciją iš neapdorotų jutiklių duomenų ir generuoti transporto priemonės valdymo komandas per būdingus loginius samprotavimus. „DriveGPT -4“ ir „Localagempc“ pademonstravo didelių modelių galimybes naudoti daugialypę užduoties sprendimų priėmimą. Jų modeliai gali ne tik sukurti pagrįstas vairavimo strategijas sudėtingais scenarijais, bet ir pateikti išsamius paaiškinimus, padidindami sistemos aiškumą. Šio nuo galo iki galo priėmimo pranašumas yra mažinant tarpines informacijos perdavimo proceso klaidas ir suteikiant galimybę visai sistemai prisitaikyti prie naujų scenarijų.
Transporto priemonės valdymui, kaip paskutiniam autonominio vairavimo žingsniui, reikia ne tik priėmimo sprendimų priėmimo tikslumo, bet ir užtikrinant sistemos realiojo laiko garantiją. Kadangi dideli modeliai paprastai turi daugybę parametrų ir didžiulės skaičiavimo išlaidos, jų tiesioginis dislokavimas transporto priemonių montuojamose sistemose yra tam tikrų iššūkių. Pramonė išsamiai tyrinėjo modelio suspaudimą ir lengvą. Naudojant modelio distiliavimo technologiją, pagrindinės žinios dideliuose modeliuose yra išgaunamos ir perkeliamos į mažus ir veiksmingus modelius, kad būtų užtikrintas tobulas derinimas su transporto priemonės aparatine įranga (pvz., „NVIDIA Drive AGX“ serija). Ši technologija ne tik išlaiko aukštą didelių modelių našumą, bet ir užtikrina, kad reagavimo laikas atitinka realaus laiko kontrolės reikalavimus, taigi vaidina svarbų vaidmenį L3/L4 autonominio vairavimo komercializacijos procese.
Modeliuojant ir tikrinant autonominį vairavimą, dideli modeliai taip pat parodė reikšmingus pranašumus. Treniruotės su didelio masto duomenimis ir sintetinėmis scenomis gali sukurti realius pasaulio modelius, o uždaro ciklo testavimas gali būti atliekamas virtualioje aplinkoje naudojant „Digital Twin“ technologiją. Šis metodas ne tik žymiai sumažina daugybės bandymų atlikimo realiuose keliuose riziką ir išlaidas, bet ir gali greitai modeliuoti įvairius kraštutinius ir ilgalaikius scenarijus, suteikdamas pakankamai duomenų, kad būtų galima pakartotinai optimizuoti modelį. „Waymo“ „Emma“ modelis, pasinaudodamas modeliavimo platformomis ir didele modelio technologija, pasiekė didelio tikslumo trajektorijos numatymo ir susidūrimo vengimo sprendimų priėmimo priėmimą. Jos našumas žymiai viršija tradicinių hierarchinių sistemų, teikiančių naują požiūrį į uždaro ciklo būsimą visiškai autonominių vairavimo sistemų patikrinimą.
Be to, dideli modeliai taip pat vaidino svarbų vaidmenį gerinant sistemos saugumą ir vartotojo patirtį. Autonominis vairavimas nėra tik techninė problema; Tai taip pat apima žmogaus ir kompiuterio sąveiką ir socialinio pasitikėjimo problemas. Naudodamiesi natūralios kalbos apdorojimo technologijomis, dideli modeliai gali pasiekti realaus laiko pokalbius su vairuotojais, pateikti vairavimo pasiūlymus ir avarinius įspėjimus ir netgi pasiūlyti individualizuotą pagalbą, pagrįstą vairuotojo emocijomis. Toks sąveikos dizainas gali žymiai sustiprinti keleivių pasitikėjimą, todėl autonominė vairavimo sistema tampa ne tik labiau pažengusi į technologiją, bet ir labiau atitikti vartotojų poreikius praktiniuose pritaikymuose.
Kokius iššūkius dideli modeliai kelia autonominiame vairavime?
Nors dideli modeliai parodė didelį potencialą autonominio vairavimo srityje, vis dar yra daug problemų keičiant jas iš laboratorinių pasiekimų prie komercinių programų. Realaus laiko našumo ir skaičiavimo šaltiniai šiuo metu yra viena iš pagrindinių kliūčių. Dideli modeliai paprastai turi didelį parametrų mastą ir didelį skaičiavimo sudėtingumą. Norint priimti sprendimus milisekundės lygyje, kelia ypač didelius reikalavimus, susijusius su transporto priemonių skaičiavimo platformos skaičiavimo galia. Galima naudoti specialius PG lustus, o dideli modeliai gali būti suspausti naudojant tokius metodus kaip distiliavimas modelis ir kiekybiškai, siekiant patenkinti realaus laiko reagavimo reikalavimus, užtikrinant našumą.
Saugumo ir patikimumo problemos taip pat yra pagrindiniai iššūkiai taikant didelius modelius. Kai autonominė transporto priemonė padarys sprendimų priėmimo klaidą, pasekmės gali būti labai rimtos. Todėl prieš pradedant praktiškai panaudoti didelius modelius, reikia atlikti griežtus bandymus ir tikrinimą, kad jie galėtų teisingai reaguoti įvairiais sudėtingais ir kraštutiniais scenarijais. Dėl didelių modelių „juodosios dėžutės“ pobūdžio jų vidinius sprendimų priėmimo procesus dažnai sunku paaiškinti. Kaip pagerinti modelio aiškinamumą užtikrinant, kad aukštas našumas tapo skubia problema, kurią reikia išspręsti reguliavimo institucijoms ir automobilių gamintojams. Tikimasi, kad ateityje, derinant tokius metodus kaip armatūros mokymasis, patobulinimas, pagrįstas žmonių atsiliepimais ir taisyklių apribojimais, tikimasi, kad bus sukurtos veiksmingos ir skaidrios sprendimų priėmimo sistemos.
Duomenų privatumo ir etinių problemų negalima ignoruoti taikant didelius modelius. Autonominės vairavimo sistemos turi surinkti didelį kiekį transporto priemonės, aplinkos ir vartotojo duomenų, o saugus šių duomenų saugojimas ir naudojimas yra tiesiogiai susijęs su vartotojo privatumo apsauga. Kaip visiškai panaudoti „Big Data“ pranašumus, tuo pačiu užtikrinant duomenų perdavimo ir apdorojimo saugumą yra pirmoji problema, kurią reikia spręsti reguliavimo institucijoms. Būtina suformuluoti griežtus duomenų apsaugos standartus ir privatumo apsaugos mechanizmus, kad būtų užtikrintos institucinės garantijos, skirtos saugiai pritaikyti didelius modelius autonominiame vairavime.
Programinės įrangos ir aparatinės įrangos bendradarbiavimas taip pat yra raktas į didelių modelių įgyvendinimą. Sėkmingas didelių modelių pritaikymas priklauso ne tik nuo algoritmo inovacijų, bet ir reikalauja aukštos kokybės aparatūros palaikymo. Šiuo metu pagrindiniai gamintojai iš eilės pradėjo naujos kartos transporto priemonių skaičiavimo platformas, tokias kaip „NVIDIA Drive AgX Pegasus“, „Atlan“ ir kt. Šios platformos teikia aparatinės įrangos garantijas realiojo laiko išvadoms ir didelio masto diegimui dideliems modeliams. Nuolatinis jutiklių technologijos tobulinimas taip pat pateikė gausesnius ir aukštos kokybės duomenų šaltinius, skirtus daugiamodaliniams duomenų suliejimui. Nuolat tobulinant visą autonominio vairavimo ekosistemą, giliai programinės įrangos ir aparatinės įrangos integracija privalo paskatinti visą pramonę į visiškai naują intelektualių kelionių erą.
Didelis didelių modelių poveikis autonominiam vairavimo technologijai atspindi ne tik technines detales, bet ir paskatino paradigmos perėjimą nuo tradicinių modulinių sistemų prie galo iki galo ir nuo suvokimo intelekto prie kognityvinio intelekto. Ateities autonominė vairavimo sistema, vadovaujama didelių modelių, pasieks didesnio tikslumo aplinkos suvokimą, lankstesnį sprendimų priėmimą ir planavimą, taip pat saugesnę ir efektyvesnę transporto priemonių valdymą. Tuo pat metu jis pasieks naują žmogaus ir mašinos sąveikos lygį, suasmenintą pagalbą ir duomenų saugumą.