Otonom sürüş sistemlerinin başarısı veya başarısızlığı tek bir soruya bağlıdır:Bundan sonra ne olacak?
Sensörler, otonom bir araca dünyanın şu anda nasıl göründüğünü söyler: kamera görüntüleri, lidar nokta bulutları, radar yansımaları, GPS ve IMU ölçümleri. Ancak güvenli sürüş, öngörü gerektirir: yayaların nasıl hareket edebileceğini, bir bisikletlinin şeride girip girmeyeceğini, bir arabanın şerit çizgisini nasıl aşabileceğini ve kapalı bir kavşağın neyi ortaya çıkarabileceğini tahmin etmek.
İşte bu noktada bir fikri ortaya çıktı.dünya modeliİşte burada devreye giriyor. Bir dünya modeli, "dünyanın nasıl işlediğine" dair öğrenilmiş ve zaman içinde ileriye taşınabilen bir temsildir: mevcut durum ve bir eylem verildiğinde, olası gelecekteki sahneleri üretebilir. Robotik ve otonomide, hayal, kamuya açık yollara çıkmadan önce politikaları eğitmek ve doğrulamak için gerçekliği yeterince iyi simüle edebilen bir modele sahip olmaktır.
Waymo'nun bir yöntemi kullandığına dair haberler.Cin 3Sürüş için dünya çapında bir model oluşturmaya yönelik bu tarz yaklaşım büyük önem taşıyor; çünkü bu yaklaşım otonom sürüş sorununu sihirli bir şekilde çözmüyor, aksine sektörün darboğaz olarak gördüğü şeyde bir değişime işaret ediyor.
Otonom sürüş, iki temel sorundan oluşur: algılama ve tahmin.
Otonom sürüşle ilgili ilk tartışmalar algılama üzerine odaklanmıştı: "Araba görebiliyor mu?" Bu, nesneleri tespit etmeyi, sınıflandırmayı, konumlarını ve hızlarını tahmin etmeyi ve zaman içinde izlemeyi içerir.
Günümüzde, öncül alan giderek tahmin ve planlama oluyor:
- Tahmin: Diğer etkenlerin (arabalar, bisikletler, yayalar) gelecekteki hareket yörüngelerini tahmin etmek.
- PlanlamaAracın kendi rotasını güvenli, yasal ve konforlu olacak şekilde seçmesi.
Algı hataları hâlâ önemli, ancak mükemmel algı bile niyet konusunda kesinlik sağlamaz. Kaldırımda duran bir yaya adım atabilir. Bir sürücü kırmızı ışıkta geçebilir. Bir bisikletçi sendeleyebilir.
Bir dünya modeli, planlamacının bu belirsizlikler hakkında akıl yürütmesini sağlayacak şekilde bunları kodlamayı amaçlar.
Makine öğrenimi terminolojisinde "dünya modeli" nedir?
Makine öğreniminde, dünya modeli tipik olarak büyük miktarda deneyim üzerinde eğitilmiş üretken bir modeldir. Şunları yapabilir:
- Ortamın gizli durumunu temsil eder.
- Devletin nasıl gelişeceğini tahmin edin.
- Bu evrimle tutarlı gözlemler üretin.
Sürüş sırasında yapılan gözlemler çok modludur: görüntüler, lidar verileri, haritalar ve anlamsal etiketler.
Temel değer şudur ki, bir kez eğitim aldıktan sonra şunları yapabilirsiniz:örnek vadeli işlemlerve stres testine tabi tutulan kararlar. "Tahmin edilen tek yol nedir?" diye sormak yerine, "Olası yollar nelerdir ve hangileri tehlikelidir?" diye sorarsınız.
Simülasyonun neden bu kadar önemli olduğu (ve neden bu kadar zor olduğu)
Waymo ve diğerleri zaten büyük ölçüde simülasyona güveniyor. Sorun doğruluk oranı.
Geleneksel simülatörler şunlardan oluşur:
- Elle yazılmış fizik ve araç dinamiği.
- Sahne öğeleri (yollar, binalar, trafik ışıkları).
- Kurallara uyan, önceden yazılmış senaryoya göre hareket eden "oyuncular".
Bunlar birçok test için harika, ancak gerçekliğin uzun kuyruğu acımasız: garip yaya davranışları, alışılmadık aydınlatma, inşaat bölgeleri, nadir tabelalar, yerel sürüş kültürleri, hava koşullarındaki uç durumlar, sensör arızaları ve düzenli bir kural kümesinde asla görünmeyen milyonlarca ince etkileşim.
Öğrenilmiş bir dünya modeli, karmaşık dağılımları doğrudan verilerden yakalayabildiği için caziptir. Yeterli sayıda gerçek sürüş kaydınız varsa, modeli yola "benzer" sahneler (tuhaflıkları da dahil olmak üzere) oluşturacak şekilde eğitebilirsiniz.
Ancak "gerçekçi hissettirmesi" güvenlik için yeterli değil. Sürüş, rekabetçi bir süreçtir: Modeliniz nadir ancak ölümcül senaryoların küçük bir bölümünü bile gözden kaçırırsa, sistem yine de başarısız olabilir.
Cin tarzı bir yaklaşımın önerdiği şey
(Bildirildiği üzere) Cin benzeri bir sistem, eylemlere ve bağlama bağlı olarak olası gelecek çerçeveleri üretebilen bir modeli ima eder.
Waymo, karmaşık kentsel sahneler için yüksek çözünürlüklü "sonraki kareler" üretebilirse, potansiyel olarak şunları başarabilir:
- Yaratmakkarşıolgusal durumlar“Ya daha önce yavaşlasaydık?” “Ya soldaki boşluğu kullansaydık?”
- Arttırmaknadir olayların haberleştirilmesiEğitim amaçlı olarak nadir görülen durumları aşırı örnekleme yöntemiyle değerlendirin.
- Geliştirmekkapalı döngü eğitimiPolitikayı yalnızca kaydedilen verilere dayanarak değil, simüle edilmiş dünya içinde de eğitin.
Bu, "kaydedilmiş kayıtları tekrar oynatmanın" çok ötesinde bir adım. Sürüş videoları izlemekten, kendi başına bir şehir gibi davranan bir kum havuzuna geçmeye benziyor.
Güvenlik önlemi: Model hataları birikerek büyür.
Güvenlik ekiplerinin öğrenilmiş simülatörler konusunda temkinli olmasının bir nedeni var: küçük hatalar zamanla birikerek büyüyor.
Eğer bir dünya modeli şu konularda biraz hatalıysa:
- Yayaların nasıl hızlandığı,
- Otomobillerin frenlemeye nasıl tepki verdiği,
- Sensörlerin parlak ışık altında nasıl davrandığı,
Ardından simüle edilmiş bir uygulama birkaç saniye sonra gerçeklikten uzaklaşabilir. Bu durum, gerçek dünyadan ziyade simülatörün özelliklerine göre optimize edilmiş eğitim sinyalleri üretebilir; bu soruna bazen "uyumsuzluk problemi" denir.simülasyon ile gerçek dünya arasındaki fark.
Modern yaklaşımlar bunu şu şekilde hafifletir:
- Kısa vadeli planlamalar gerçek günlük kayıtlarıyla birleştirildi.
- Alan rastgeleleştirme (gürültü ve varyasyon ekleme).
- Gerçek hayattaki senaryolara karşı doğrulama.
- Tamamen öğrenilmiş tahminlere dayanmayan güvenlik kısıtlamaları.
Bir dünya modeli, "kusursuz gerçeklik" olmasa bile, güvenilir olduğu yerleri ve güvenilir olmadığı yerleri bildiğiniz sürece inanılmaz derecede faydalı olabilir.
Dünya modelleri ve haritaları: piksellerin altındaki yapı
Otonom bir araç sadece görüntülere tepki vermez. Aynı zamanda yapıya da dayanır:
- HD haritalar (şerit geometrisi, trafik kontrol cihazları).
- Konum belirleme (haritada nerede bulunuyorum?).
- Bazı sistemlerde (özellikle haritalanmış bölgelerin dışında) SLAM benzeri bileşenler bulunur.
Güçlü bir dünya modeli bu yapıyı entegre etmelidir. Aksi takdirde, tutarlı geometriyi koruyamayan süslü bir video üreteciye dönüşür.
Bu nedenle özerklik dünyası modelleri genellikle iç içe geçmiş durumdadır:
- Öğrenilmiş algılama özellikleri,
- Açık geometri kısıtlamaları,
- Harita öncelikleri,
- Ajan tabanlı temsiller (diğer yol kullanıcılarını niyetleri olan varlıklar olarak ele alma).
En iyi sistemler hibrit sistemlerdir: verilerin bol olduğu yerlerde öğrenmeyi, kısıtlamaların katı olduğu yerlerde ise kuralları kullanırlar.
Ürün geliştirme açısından ne gibi değişiklikler oluyor?
İyi bir dünya modelinin en pratik etkisi şudur:mühendislik hızı.
Günümüzde otonom sürüş teknolojisini geliştirmek genellikle şunları gerektirir:
- Gerçek dünyadaki başarısızlıkları (ilişki kopmaları, kıl payı atlatılan olaylar) bulmak.
- Veri ve etiket ekleme.
- Tahmin/planlamanın ayarlanması.
- Çok sayıda senaryo paketinde yeniden doğrulama yapılıyor.
Bir dünya modeli, arızanın gerçekçi varyasyonlarını üretebiliyorsa, mühendisler daha hızlı yineleme yapabilirler. Ayrıca şu gibi soruların yanıtlanmasına da yardımcı olabilir:
- “Bu davranış genel olarak dağıtım ağında güvenli mi, yoksa tek bir kayıtta şans eseri mi gerçekleşti?”
- “Sistem, yayaların tereddütlerine ne kadar duyarlı?”
- “Başka bir sürücünün agresif davranması durumunda en kötü sonuç ne olur?”
Daha hızlı yineleme, güvenliğin garantisi değildir; ancak geri bildirim döngüsünü iyileştirebilir.
Büyük açık sorular
Dünya modeli mükemmel olsa bile, katı sınırları vardır:
- Hesap verebilirlikSistemin belirli bir geleceği neden tahmin ettiğini açıklayabilir misiniz?
- DoğrulamaEğitimli bir simülatörün temsili nitelikte olduğunu nasıl onaylıyorsunuz?
- Uç durumlarNadir görülen ancak kritik senaryoların kapsandığından nasıl emin oluyorsunuz?
- Politika sağlamlığıModelde eğitilen bir politika gerçek hayatta güvenli bir şekilde davranır mı?
İşte bu noktada düzenleyici kurumlar ve güvenlik değerlendirmeleri devreye giriyor. Otonom araçlar, eğitim ve test yöntemlerini gerçek dünya riskleriyle ilişkilendiren argümanlara ihtiyaç duyacak.
Özetle
Yüksek doğrulukta bir dünya modeli, otonom sürüş için güçlü bir araçtır çünkü sürüşü "sadece olanlardan öğrenmekten" "olabileceklerden öğrenmeye" dönüştürür. Waymo, gerçekçi gelecekteki yol sahneleri oluşturmak için Genie 3 tarzı bir sistem kullanabilirse, eğitim, senaryo testi ve güvenlik değerlendirmesini hızlandırabilir; ancak zor kısım, simüle edilen dünyanın iyileştirmelerin gerçek sokaklara da yansıyacak kadar gerçeğe uygun olduğunu kanıtlamaktır.