자율주행 시스템의 성패는 단 하나의 질문에 달려 있습니다.그 다음엔 무슨 일이 일어날까요?
센서는 자율주행 차량에 카메라 프레임, 라이다 포인트 클라우드, 레이더 반사, GPS 및 IMU 측정값 등 현재 주변 환경의 모습을 알려줍니다. 하지만 안전 운전은 예측에 달려 있습니다. 보행자의 움직임을 예측하고, 자전거 운전자가 차선 변경을 할지, 차량이 차선을 이탈할지, 가려진 교차로에서 무엇이 드러날지 예측하는 것입니다.
바로 거기서 아이디어가 나왔습니다.세계 모델세계 모델은 "세상이 어떻게 작동하는지"에 대한 학습된 표현으로, 시간의 흐름에 따라 발전해 나갈 수 있습니다. 즉, 현재 상황과 특정 행동이 주어지면 그럴듯한 미래 상황을 생성할 수 있습니다. 로봇공학과 자율 주행 분야에서 궁극적인 목표는 실제 현실을 충분히 잘 시뮬레이션하여 차량이 실제 도로에 투입되기 전에 정책을 학습하고 검증할 수 있는 모델을 구축하는 것입니다.
Waymo가 활용하고 있다는 보도가 나왔습니다.지니 3자율주행을 위한 세계적인 모델을 만들기 위한 이러한 접근 방식은 매우 중요합니다. 왜냐하면 이것이 자율주행 문제를 마법처럼 해결해 주기 때문이 아니라, 업계가 병목 현상으로 여기는 부분에 대한 인식 변화를 보여주기 때문입니다.
자율 주행은 인지와 예측이라는 두 가지 문제와 관련이 있습니다.
자율주행에 대한 초기 논의는 주로 인지 능력에 초점을 맞췄습니다. "자동차가 볼 수 있을까?" 여기에는 물체 감지, 분류, 위치 및 속도 추정, 그리고 시간 경과에 따른 추적 등이 포함됩니다.
오늘날, 핵심적인 분야는 점점 예측과 계획으로 확대되고 있습니다.
- 예측다른 에이전트(자동차, 자전거, 보행자)의 미래 궤적을 예측합니다.
- 계획차량의 주행 궤적을 안전하고 합법적이며 편안하게 선택하는 것.
인지 오류는 여전히 중요하지만, 완벽한 인지조차도 의도에 대한 확신을 주지는 못합니다. 보도에 서 있던 보행자가 갑자기 뛰어들 수도 있고, 운전자가 신호등을 무시하고 지나갈 수도 있으며, 자전거를 탄 사람이 비틀거릴 수도 있습니다.
세계 모델은 그러한 불확실성을 인코딩하여 계획자가 이를 바탕으로 추론할 수 있도록 하는 것을 목표로 합니다.
머신러닝 용어로 "월드 모델"이란 무엇인가요?
머신러닝에서 월드 모델은 일반적으로 방대한 양의 경험을 바탕으로 학습된 생성형 모델입니다. 월드 모델은 다음과 같은 기능을 수행할 수 있습니다.
- 환경의 잠재적 상태를 나타냅니다.
- 국가가 어떻게 발전할지 예측해 보세요.
- 그러한 진화와 일관된 관찰 결과를 생성합니다.
운전의 경우, 관찰 데이터는 이미지, 라이다, 지도 및 의미론적 레이블을 포함하는 다중 모달 방식으로 수집됩니다.
핵심 가치는 일단 훈련을 받으면 다음과 같은 일을 할 수 있다는 것입니다.샘플 선물그리고 의사결정을 스트레스 테스트합니다. "예측되는 유일한 경로는 무엇인가?"라고 묻는 대신, "가능성이 있는 경로는 무엇이며, 그중 위험한 경로는 무엇인가?"라고 묻습니다.
시뮬레이션이 왜 중요한가 (그리고 왜 그렇게 어려운가)
웨이모를 비롯한 여러 기업들은 이미 시뮬레이션에 크게 의존하고 있습니다. 문제는 시뮬레이션의 정확도입니다.
기존 시뮬레이터는 다음과 같은 요소로 구성됩니다.
- 물리 엔진 및 차량 동역학 모델을 수작업으로 제작했습니다.
- 장면 구성 요소(도로, 건물, 신호등).
- 대본에 따라 규칙을 따르는 "배우"들.
이러한 규칙들은 많은 테스트에 유용하지만, 현실의 다양한 변수들은 가혹합니다. 보행자의 특이한 행동, 특이한 조명, 공사 구역, 드문 표지판, 지역별 운전 문화, 기상 이변, 센서 오류, 그리고 깔끔한 규칙 집합으로는 절대 드러나지 않는 수많은 미묘한 상호작용들이 존재합니다.
학습된 세계 모델은 데이터에서 직접 불규칙한 분포를 포착할 수 있다는 점에서 매력적입니다. 충분한 실제 주행 기록이 있다면, 도로의 느낌, 즉 특이한 점까지 포함하여 실제 도로와 유사한 장면을 생성하는 모델을 훈련시킬 수 있습니다.
하지만 "실감난다"는 것만으로는 안전을 보장하기에 충분하지 않습니다. 운전은 적대적인 행위입니다. 모델이 드물지만 치명적인 시나리오 중 일부라도 놓치면 시스템은 여전히 오작동할 수 있습니다.
지니식 접근 방식이 시사하는 바는 무엇일까요?
(보도된 바와 같이) 지니 스타일 시스템은 행동과 맥락에 따라 그럴듯한 미래 시나리오를 생성할 수 있는 모델을 의미합니다.
Waymo가 복잡한 도시 장면에서 고화질의 "다음 프레임"을 생성할 수 있다면 다음과 같은 가능성을 열어둘 수 있습니다.
- 만들다반사실적 상황"우리가 좀 더 일찍 속도를 줄였더라면 어땠을까?" "왼쪽 틈으로 들어갔더라면 어땠을까?"
- 증가하다희귀 사건 보도: 흔하지 않은 상황을 과도하게 샘플링하여 학습합니다.
- 개선하다폐쇄 루프 훈련시뮬레이션 환경 내에서 정책을 학습시키고, 단순히 기록된 데이터만을 사용하지 않도록 합니다.
이는 단순히 "기록된 로그를 재생하는 것"을 넘어선 단계입니다. 마치 운전 영상을 시청하는 것에서 나아가, 그 샌드박스 자체가 도시처럼 작동하는 환경을 갖게 된 것과 같습니다.
안전장치: 모델 오류가 누적됩니다
안전팀이 학습된 시뮬레이터에 대해 신중한 태도를 보이는 데에는 이유가 있습니다. 작은 오류가 시간이 지남에 따라 누적되기 때문입니다.
세계 모델이 다음과 같은 점에서 약간 잘못된 경우:
- 보행자가 가속하는 방식,
- 자동차가 제동에 반응하는 방식
- 센서가 강한 햇빛 아래에서 어떻게 작동하는가?
그러면 시뮬레이션된 롤아웃은 몇 초 만에 현실과 동떨어질 수 있습니다. 이로 인해 실제 환경보다는 시뮬레이터의 특성에 최적화된 훈련 신호가 생성될 수 있는데, 이러한 문제를 때때로 '실패'라고 부릅니다.시뮬레이션과 실제 간의 차이.
현대적인 접근 방식은 다음과 같은 방법으로 이러한 문제를 완화합니다.
- 단기적인 계획 수립과 실제 로그 분석을 결합했습니다.
- 도메인 무작위화(노이즈 및 변동 추가).
- 실제 시나리오를 기반으로 한 검증.
- 학습된 예측에만 의존하지 않는 안전 제약 조건.
세계 모델은 '완벽한 현실'이 아니더라도, 어디가 믿을 만하고 어디가 믿을 수 없는지 알고 있다면 매우 유용할 수 있습니다.
세계 모델 및 지도: 픽셀 아래에 숨겨진 구조
자율주행차는 이미지에만 반응하는 것이 아닙니다. 구조에도 의존합니다.
- HD 지도(차선 기하학, 교통 제어 장치).
- 위치 파악(지도상에서 내 위치는 어디인가?).
- 일부 시스템(특히 매핑된 영역 외부)에는 SLAM과 유사한 구성 요소가 있습니다.
탄탄한 세계 모델은 그러한 구조를 통합해야 합니다. 그렇지 않으면 일관된 기하학적 구조를 유지할 수 없는, 그저 화려한 비디오 생성기에 불과하게 됩니다.
이것이 바로 자율성 세계 모델들이 종종 혼합되는 이유입니다:
- 학습된 지각 특징,
- 명시적 기하학적 제약 조건,
- 지도 사전 정보,
- 에이전트 기반 표현(다른 도로 이용자를 의도를 가진 개체로 간주).
최고의 시스템은 하이브리드 방식입니다. 데이터가 풍부한 곳에서는 학습을 활용하고, 제약 조건이 엄격한 곳에서는 규칙을 사용합니다.
제품 개발에 어떤 변화가 있을까요?
좋은 세상 모델이 가져올 가장 실질적인 영향은 다음과 같습니다.공학 속도.
오늘날 자율 주행 스택을 개선하려면 다음과 같은 사항이 필요한 경우가 많습니다.
- 실제 실패 사례(참여도 저해, 아찔한 순간)를 찾아냅니다.
- 데이터와 레이블을 추가합니다.
- 예측/계획 조정.
- 대규모 시나리오 모음을 통해 재검증합니다.
세계 모델이 현실적인 고장 변형을 생성할 수 있다면 엔지니어는 더 빠르게 반복 작업을 수행할 수 있습니다. 또한 다음과 같은 질문에 대한 답을 찾는 데에도 도움이 될 수 있습니다.
- "이러한 동작은 전체 배포 환경에서 안전한 것인가요, 아니면 특정 로그에서만 우연히 발생한 것인가요?"
- “시스템은 보행자의 망설임에 얼마나 민감하게 반응합니까?”
- 다른 운전자가 공격적인 행동을 할 경우 최악의 결과는 무엇일까요?
빠른 반복이 안전을 보장하는 것은 아니지만, 피드백 루프를 개선할 수 있습니다.
중요한 미해결 질문들
세계 모델이 아무리 훌륭하더라도, 분명한 한계는 존재합니다.
- 책임시스템이 특정 미래를 예측한 이유를 설명해 주시겠습니까?
- 확인학습된 시뮬레이터를 대표 모델로 인증하려면 어떻게 해야 합니까?
- 예외적인 경우드물지만 중요한 상황에 대한 대비책은 어떻게 마련하시나요?
- 정책의 견고성모델로 학습된 정책이 실제 상황에서 안전하게 작동하는가?
바로 이 지점에서 규제 기관과 안전성 검토가 중요해집니다. 자율주행 차량은 훈련 및 시험 방법과 실제 위험 사이의 연관성을 입증하는 근거를 제시해야 할 것입니다.
결론적으로
고정밀 시뮬레이션 모델은 자율주행에 있어 강력한 도구입니다. "실제로 일어난 일만 학습하는 것"에서 "예상되는 일을 학습하는 것"으로 주행 방식을 전환시켜주기 때문입니다. 웨이모가 지니 3(Genie 3)와 같은 시스템을 활용하여 현실적인 미래 도로 장면을 생성할 수 있다면, 훈련, 시나리오 테스트, 안전성 평가를 가속화할 수 있을 것입니다. 하지만 가장 어려운 과제는 시뮬레이션된 세계가 실제 도로에서도 개선된 결과를 가져올 만큼 충분히 현실적이라는 것을 입증하는 것입니다.