반전된 AI로 더욱 인간적인 시뮬레이션 만들기
"모델과 데이터 버전이 너무 많아 수동으로 모두 추적할 수 없는 지경에 이르렀습니다. 일단 Artifacts를 활용하기 시작했는데 정말 도움이 되었습니다."

Adam Ścibior
CTO and Co-founder
캐나다 기술 인재
팬데믹은 여러 면에서 현대 생활을 재편했습니다. 일의 미래를 포함해서요. 원격 및 하이브리드 작업이 계속되면서 기술 산업에서 번창하는 커리어는 더 이상 샌프란시스코, 뉴욕 또는 시애틀과 같은 전통적인 인재 허브에서 사는 것에 의존하지 않습니다. 캐나다가 세계적 수준의 대학과 연구 프로그램 덕분에 기술 거물이 되기 위해 꾸준히 부상하고 있는 국경 북쪽을 살펴볼 때입니다.
브리티시 컬럼비아 대학의 지원을 받는 분사 기업인 Inverted AI는 첨단 시뮬레이션 기술로 자율주행차(AV) 산업에서 파장을 일으키고 있습니다. 불완전한 AV의 본질적인 위험 때문에 이 분야의 많은 훈련은 실제 세계에서 수행할 수 없으며 대신 시뮬레이션 환경을 활용하여 달성합니다. 이러한 환경의 많은 문제점은 너무 무균적이라는 것입니다. 그 안의 자동차와 보행자는 모든 특성과 뉘앙스가 있는 혼란스러운 도시 환경에 대한 자율 주행차를 준비시키지 못하는 비자연스러운 방식으로 행동합니다. 그리고 비자연스러운 시뮬레이션에서 훈련하면 모델이 실제 자연 세계를 처리할 수 있도록 준비되지 않습니다.
Inverted AI는 바로 이 문제를 해결하고자 합니다. 그들의 사명은 AI 에이전트, 특히 NPC(Non-Playable Characters)를 반응적이고 현실적이며 행동적으로 다양하게 만드는 것입니다. 간단히 말해서, 그들은 인간처럼 행동하는 에이전트를 만들고 있습니다.
Inverted AI의 CEO인 프랭크 우드는 “완전 자율 주행차를 구현하려면 인간과 유사한 NPC가 필수적이지만 지금 당장은 시장에서 그런 모습을 볼 수 없습니다.”라고 말했습니다.
TRA
반응성, 사실성, 행동의 다양성 측면에서 인간과 매우 유사한 NPC를 구축하기 위해 Inverted AI는 전 세계를 비행하는 드론 조종사로부터 얻은 방대한 양의 비디오 데이터에서 학습한 예측적 인간 행동 모델을 사용합니다. 이 실제 데이터는 현실적인 NPC를 훈련하는 데 이상적입니다. 결국, 그들은 실제 운전자로부터 운전 행동을 배우고 있기 때문입니다.

Inverted AI의 비법은 무엇일까요? ITRA 라는 예측 모델입니다 . Imagining the Road Ahead의 줄임말입니다. Wood가 설명했듯이, Inverted AI는 ITRA를 행동의 GPT로 생각합니다.

위의 이미지에서 ITRA는 모든 에이전트의 미래를 공동으로 예측하기 위해 지도와 에이전트의 과거 위치 데이터를 조건으로 합니다. 녹색 선은 다양한 에이전트가 취할 수 있는 다양하고 실용적인 경로를 나타냅니다. 자세히 살펴보면 원형 교차로에 머무르는 두 대의 파란색 차는 미묘하지만 현실적인 반응성을 강조합니다. 즉, 더 빠른 차량이 느린 차량을 추월하는 것입니다.
Inverted AI의 비밀 소스의 마지막 부분은 이러한 모델을 시뮬레이션 환경으로 전송하는 독점 기술이 시뮬레이터와 무관하다는 것입니다. 두 가지 API 엔드포인트( INITIALIZE 및 DRIVE) 를 활용하여 모든 회사는 간단히 지도와 에이전트 수를 제공할 수 있으며 INITIALIZE와 DRIVE는 시뮬레이션 스택에 원활하게 통합됩니다.
오늘날, Inverted AI는 학생 연구원과 정규직 직원으로 구성된 15명의 소규모 팀입니다. 제한된 리소스로 이러한 세계적 수준의 예측 모델을 개발하는 것은 쉬운 일이 아닙니다. 바로 여기서 Weights & Biases가 등장합니다.
가중치와 편향을 통한 회사 확장
성장하는 팀으로서, Inverted AI는 회사로서 성공적으로 확장할 수 있는 도구가 필요합니다. 그들은 일상 업무를 돕고 품질을 희생하지 않고도 빠르게 움직일 수 있는 무언가가 필요했습니다. 확장을 위해 구축된 W&B는 팀에 노력을 증폭하고 결과를 제공할 수 있는 능력을 제공했습니다.
처음에는 W&B의 자동화된 실험 추적 기능이 팀의 주요 용도였습니다. 환경을 생성하거나 테스트할 때 Inverted AI는 모델이 현실적이고 반응적이며 다양한 행동을 시뮬레이션하도록 하기 위해 특정 핵심 성과 지표(KPI)를 인식해야 합니다. W&B를 통해 팀은 모든 실험을 메트릭과 로그로 추적하여 모델을 라이브로 비교하고 성과를 평가할 수 있었습니다. Inverted AI 모델은 성과가 개선되는 즉시 프로덕션에 배포되므로 모델을 빠르고 정확하게 평가할 수 있는 능력이 팀에 매우 중요합니다.
회사의 직원 수가 늘어나면서 Inverted AI는 팀의 효율성과 생산성을 높이기 위해 점점 더 많은 W&B 기능을 사용하기 시작했습니다.
예를 들어 하이퍼파라미터 선택을 살펴보겠습니다. 가장 최적의 하이퍼파라미터 값을 찾는 것은 모든 ML 모델에서 좋은 성능을 달성하는 데 매우 중요하며, ITRA에는 조정할 수 있는 하이퍼파라미터 값이 많이 있습니다. 게다가 행동 예측의 상호 작용적 특성은 에피소드 길이나 종료 조건과 같은 훈련 환경에 대한 추가 구성 옵션을 도입합니다. 모든 하이퍼파라미터의 다른 값을 시도하는 것은 특히 종종 이기종 클러스터의 패치워크에서 실험을 실행하는 학생 연구자에게 오케스트레이션 관점에서만 해도 어렵습니다. W&B Sweeps를 사용하여 팀은 수천 개의 다른 구성을 최신 상태로 유지하면서 작업을 쉽게 구성하고 오케스트레이션할 수 있었고, W&B Reports를 통해 회사 내에서 결과를 빠르고 편리하게 배포하여 회사 내 정보 흐름을 가속화할 수 있었습니다.
그 외에도 W&B Artifacts를 활용하여 ML 파이프라인 전반에서 데이터 세트, 모델 및 평가 결과를 저장하고 추적했습니다. Inverted AI의 CTO인 Adam Ścibior는 “우리는 너무 많은 모델과 데이터 버전이 있어서 모든 모델을 수동으로 추적할 수 없는 지경에 이르렀습니다. Artifacts를 활용하기 시작한 후로 매우 도움이 되었습니다.”라고 말했습니다.
팀이 ITRA의 개선된 변형을 계속 구축함에 따라 속도, 정확성, 효율성은 모두 그 임무를 달성하는 데 필수적인 요소입니다. W&B와 같은 도구를 사용하면 정확히 그런 것을 얻을 수 있습니다.
주목할 만한 스타트업
Waymo와 NVIDIA와 같은 경쟁사와 경쟁하고자 하는 소규모 조직으로서, Inverted AI는 팀이 빠르고 자신 있게 반복할 수 있는 솔루션이 필요했습니다. 팀이 W&B 사용을 늘리면서, 그들은 연구를 가속화하고 더 짧은 시간 안에, 그리고 가장 중요하게도 대규모로 가치 있는 모델을 구축할 수 있었습니다.
AV 산업은 현재 미국 기업으로 가득 차 있지만, Inverted AI는 캐나다가 경시할 수 없는 세력임을 보여줍니다. 인간과 같은 NPC를 구동하는 데 사용할 수 있는 세계적 수준의 예측 모델을 구축하는 것은 야심 찬 사명입니다. Weights & Biases로 머신 러닝 워크플로를 간소화한다는 것은 더 많은 모델을 더 빠르게 훈련하고 빠르고 자신 있게 배포한다는 것을 의미합니다. 팀이 하는 일은 더 나은 운전, 더 적은 사고, 그리고 가장 중요한 것은 모든 사람을 위한 더 안전한 도로를 보장합니다.