Az önvezető rendszerek egyetlen kérdés által élnek és halnak meg:Mi történik ezután?
Az érzékelők – kameraképek, lidar pontfelhők, radarvisszaverődések, GPS és IMU mérések – megmondják egy önvezető járműnek, hogy néz ki most a világ. A biztonságos vezetés azonban előrelátás: annak előrejelzése, hogy a gyalogosok hogyan mozoghatnak, hogy egy kerékpáros beleolvad-e az útba, hogyan sodródik egy autó a sávelválasztó vonalba, és mit árulhat el egy lezárt kereszteződés.
Innen ered az ötlet, hogy egyvilágmodelljön be. A világmodell a „világ működésének” egy tanult reprezentációja, amely időben előre görgethető: az aktuális jelenet és egy cselekvés alapján hihető jövőbeli jeleneteket generálhat. A robotikában és az autonómiában az álom egy olyan modell, amely elég jól szimulálja a valóságot ahhoz, hogy a szabályzatokat még azelőtt betaníthassa és validálhassa, mielőtt azok a közutakra kerülnének.
Jelentések szerint a Waymo kihasználja aDzsinn 3–stílusú megközelítés egy vezetési világmodell megteremtéséhez nagy dolog – nem azért, mert varázsütésre megoldja az autonómia problémáját, hanem azért, mert jelzi a változást abban, amit az iparág a szűk keresztmetszetnek tart.
A vezetési autonómia két problémát jelent: az érzékelést és az előrejelzést
Az önvezetéssel kapcsolatos korai beszélgetések az érzékelésre összpontosítottak: „Láthat-e az autó?” Ez magában foglalja a tárgyak észlelését, osztályozását, helyzetük és sebességük becslését, valamint az időbeli nyomon követésüket.
Manapság a határterület egyre inkább az előrejelzésről és a tervezésről szól:
- Jóslatmás szereplők (autók, kerékpárok, gyalogosok) jövőbeli pályáinak előrejelzése.
- Tervezés: a jármű saját pályájának megválasztása biztonságos, szabályos és kényelmes módon.
Az érzékelési hibák továbbra is fontosak, de még a tökéletes érzékelés sem ad bizonyosságot a szándékról. Egy gyalogos a járdaszegélynél kiléphet. Egy autós áthajthat a piroson. Egy kerékpáros imbolyoghat.
Egy világmodell célja, hogy kódolja ezeket a bizonytalanságokat, hogy a tervező érvelhessen velük kapcsolatban.
Mit jelent a „világmodell” gépi tanulás (ML) szempontjából?
A gépi tanulásban a világmodell jellemzően egy generatív modell, amelyet nagy mennyiségű tapasztalaton képeztek ki. Képes:
- A környezet látens állapotát ábrázolja.
- Jósolja meg, hogyan fog fejlődni az állam!
- Generálj megfigyeléseket, amelyek összhangban vannak ezzel az evolúcióval.
Vezetés esetén a megfigyelések multimodálisak: képek, lidar, térképek és szemantikus címkék.
Az alapérték az, hogy miután kiképezték, képes vagy ráminta határidős ügyletekés stresszteszt-döntések. Ahelyett, hogy azt kérdeznéd, hogy „mi az egyetlen előrejelzett útvonal”, azt kérdezed: „melyek a valószínűsíthető útvonalak, és melyek veszélyesek?”
Miért központi szerepet játszik a szimuláció (és miért olyan nehéz)
A Waymo és mások már most is nagymértékben támaszkodnak a szimulációra. A probléma a pontosság.
A hagyományos szimulátorok a következőkből épülnek fel:
- Kézzel írt fizika és járműdinamika.
- Helyszíni eszközök (utak, épületek, közlekedési lámpák).
- Szabályokat követő, előre megírt „színészek”.
Ezek nagyszerűek sok teszthez, de a valóság hosszú farka brutális: furcsa gyalogosviselkedés, szokatlan világítás, építési övezetek, ritka jelzések, helyi vezetési kultúrák, időjárási szélsőségek, érzékelőhibák és a milliónyi finom interakció, amelyek soha nem jelennek meg egy rendezett szabályrendszerben.
Egy tanult világmodell azért vonzó, mert közvetlenül az adatokból képes rögzíteni a zavaros eloszlásokat. Ha elegendő valós vezetési naplóval rendelkezel, betaníthatod a modellt olyan jelenetek generálására, amelyek „úgy érződnek”, mint az út – beleértve a furcsaságokat is.
De az, hogy „valóságosnak érződik”, nem elég a biztonsághoz. A vezetés ellenséges: ha a modelled akár csak néhány ritka, de halálos forgatókönyvet is kihagy, a rendszer akkor is meghibásodhat.
Mit sugall egy dzsinn-stílusú megközelítés?
A Genie-stílusú rendszer (ahogyan arról beszámoltak) egy olyan modellt feltételez, amely képes hihető jövőbeli kereteket generálni a cselekvések és a kontextus függvényében.
Ha a Waymo képes nagy pontosságú „következő képkockákat” generálni komplex városi jelenetekhez, akkor potenciálisan:
- Teremtkontrafaktuálisok„Mi lett volna, ha korábban lassítottunk volna?” „Mi lett volna, ha a bal oldali résben állunk?”
- Növekedésritka eseményekre vonatkozó fedezet: túlmintavételezzük a szokatlan helyzeteket a betanításhoz.
- Javítanizárt hurkú képzés: a szimulált világban kell betanítani egy szabályzatot, nem csak naplózott adatokon.
Ez egy lépéssel túlmutat a „rögzített naplók visszajátszásán”. Olyan, mintha a vezetési videók megtekintéséről egy olyan sandboxra váltanánk, ahol maga a sandbox egy városhoz hasonlóan viselkedik.
A biztonsági csapda: a modellhibák összetettsége
Van ok arra, hogy a biztonsági csapatok óvatosak a tanult szimulátorokkal kapcsolatban: a kis hibák idővel felhalmozódnak.
Ha egy világmodell kicsit téves a következőkben:
- Hogyan gyorsulnak a gyalogosok,
- Hogyan reagálnak az autók a fékezésre,
- Hogyan viselkednek az érzékelők vakító fény alatt?
akkor egy szimulált bevezetés néhány másodperc után eltávolodhat a valóságtól. Ez olyan betanító jeleket hozhat létre, amelyek a szimulátor furcsaságaira optimalizálnak, nem pedig a valós világra – ezt a problémát néha ...-nak is nevezikszimulációs és valós közötti különbség.
A modern módszerek ezt a problémát a következő módszerekkel ellensúlyozzák:
- Rövid távú bevezetések valódi naplókkal kombinálva.
- Tartomány randomizálása (zaj és variáció hozzáadása).
- Valós helyzetekkel szembeni validáció.
- Biztonsági korlátozások, amelyek nem pusztán tanult előrejelzéseken alapulnak.
Egy világmodell hihetetlenül hasznos lehet még akkor is, ha nem a „tökéletes valóság”, feltéve, hogy tudjuk, hol megbízható és hol nem.
Világmodellek és térképek: a képpontok alatti struktúra
Egy önvezető autó nemcsak a képekre reagál. A szerkezetre is támaszkodik:
- HD térképek (sávgeometria, forgalomirányító eszközök).
- Lokalizáció (hol vagyok a térképen?).
- SLAM-szerű komponensek egyes rendszerekben (különösen a leképezett régiókon kívül).
Egy erős világmodellnek integrálnia kell ezt a struktúrát. Különben egy divatos videógenerátorrá válik, ami nem képes fenntartani a konzisztens geometriát.
Ezért keverednek gyakran az autonómia világmodelljei:
- Tanult észlelési jellemzők,
- Explicit geometriai megszorítások,
- Térképpriorok,
- Ágens-alapú reprezentációk (más közlekedők szándékokkal rendelkező entitásokként).
A legjobb rendszerek hibridek: tanulást alkalmaznak ott, ahol gazdag az adat, és szabályokat ott, ahol szigorúak a korlátozások.
Milyen változások történnek a termékfejlesztésben
Egy jó világmodell leggyakorlatiasabb hatása a következő:mérnöki sebesség.
Napjainkban az önvezető autók fejlesztése gyakran a következőket igényli:
- Valós kudarcok (elszakadások, majdnem bekövetkezett balesetek) felkutatása.
- Adatok és címkék hozzáadása.
- Hangolási előrejelzés/tervezés.
- Újraérvényesítés hatalmas forgatókönyv-csomagokon keresztül.
Ha egy világmodell képes a meghibásodás valósághű variációit generálni, a mérnökök gyorsabban tudnak iterálni. Segíthet olyan kérdések megválaszolásában is, mint:
- „Biztonságos ez a viselkedés egy adott disztribúcióban, vagy egyetlen naplófájlban szerencsés volt?”
- „Mennyire érzékeny a rendszer a gyalogosok habozására?”
- „Mi a legrosszabb kimenetel, ha egy másik sofőr agresszíven viselkedik?”
A gyorsabb iteráció nem garantálja a biztonságot – de javíthatja a visszacsatolási hurkot.
A nagy nyitott kérdések
Még ha a világmodell kiváló is, vannak kemény korlátok:
- ElszámoltathatóságEl tudná magyarázni, hogy a rendszer miért jósolta meg egy adott jövőt?
- ÉrvényesítésHogyan minősíthető egy tanult szimulátor reprezentatívnak?
- Szélső esetekHogyan biztosítják, hogy a ritka, de kritikus forgatókönyvek is le legyenek fedve?
- Szabályozási szilárdságA modellben betanított szabályzat biztonságosan viselkedik-e a valóságban?
Itt jönnek képbe a szabályozók és a biztonsági indokok. Az önvezető járműveknek olyan érvekre lesz szükségük, amelyek összekapcsolják a képzési és tesztelési módszereket a valós kockázatokkal.
A lényeg
Egy nagy pontosságú világmodell hatékony eszköz az autonómia fejlesztéséhez, mivel a vezetést a „csak a történtekből tanuljunk” elvből a „megtörténhetettekből tanuljunk” elvvé alakítja. Ha a Waymo egy Genie 3-stílusú rendszert tud használni valósághű jövőbeli közúti jelenetek létrehozására, az felgyorsíthatja a képzést, a forgatókönyv-tesztelést és a biztonsági értékelést – de a nehéz rész továbbra is annak bizonyítása, hogy a szimulált világ elég hű ahhoz, hogy a fejlesztések a valós utcákra is átvihetők legyenek.