Mit umgekehrter KI Simulationen menschlicher gestalten

„Wir sind an einem Punkt angelangt, an dem wir so viele Modelle und Datenversionen hatten, dass wir sie einfach nicht alle manuell im Auge behalten konnten. Als wir begannen, die Vorteile von Artifacts zu nutzen, war das sehr hilfreich.“

Adam Ścibior
CTO und Mitgründer

Kanadisches Tech-Talent

Die Pandemie hat das moderne Leben in vielerlei Hinsicht verändert – auch die Zukunft der Arbeit. Da Fernarbeit und Hybridarbeit nicht mehr wegzudenken sind, hängen erfolgreiche Karrieren in der Technologiebranche nicht mehr davon ab, in traditionellen Talentzentren wie San Francisco, New York oder Seattle zu leben. Es ist an der Zeit, den Blick über die Grenze nach Norden zu richten, wo Kanada dank erstklassiger Universitäten und Forschungsprogramme stetig zu einem Technologie-Titan aufsteigt.

Inverted AI , ein von der University of British Columbia gefördertes Spin-off-Unternehmen, sorgt mit seiner fortschrittlichen Simulationstechnologie in der Branche der autonomen Fahrzeuge (AV) für Aufsehen. Aufgrund der inhärenten Risiken nicht perfekter AVs kann ein Großteil des Trainings in diesem Bereich nicht in der realen Welt durchgeführt werden, sondern wird stattdessen durch die Nutzung simulierter Umgebungen erreicht. Das Problem bei vielen dieser Umgebungen ist, dass sie zu steril sind. Autos und Fußgänger in ihnen verhalten sich unnatürlich, was selbstfahrende Autos nicht auf chaotische städtische Umgebungen mit all ihren Besonderheiten und Nuancen vorbereitet. Und das Training in einer unnatürlichen Simulation bereitet die Modelle nicht darauf vor, mit der tatsächlichen, natürlichen Welt umzugehen.

Inverted AI hat sich zum Ziel gesetzt, genau dieses Problem zu lösen. Ihr Ziel ist es, KI-Agenten – insbesondere nicht spielbare Charaktere (Non-Playable Characters, NPCs) – zu entwickeln, die reaktiv, realistisch und verhaltensmäßig vielfältig sind. Einfach ausgedrückt: Sie entwickeln Agenten, die sich genau wie Menschen verhalten.
„Menschenähnliche NPCs sind für die Entwicklung vollständig autonomer Fahrzeuge von entscheidender Bedeutung, und so etwas gibt es derzeit auf dem Markt einfach nicht“, sagt Frank Wood, CEO von Inverted AI.

TRA

Um NPCs zu erstellen, die in Bezug auf Reaktionsfähigkeit, Realismus und Verhaltensvielfalt den Menschen sehr ähnlich sind, verwendet Inverted AI prädiktive Modelle menschlichen Verhaltens, die aus riesigen Mengen von Videodaten von Drohnenpiloten auf der ganzen Welt erlernt wurden. Diese realen Daten sind ideal für das Training realistischer NPCs: Schließlich lernen sie das Fahrverhalten von echten Fahrern.
Was ist die Geheimzutat von Inverted AI? Ein Vorhersagemodell namens ITRA , kurz für Imagining the Road Ahead. Wie Wood erklärt, betrachtet Inverted AI ITRA als die GPT des Verhaltens.
Im Bild oben verwendet ITRA eine Karte und eine gewisse Menge historischer Positionsdaten der Agenten, um gemeinsam die Zukunft aller Agenten vorherzusagen. Die grünen Linien zeigen die unterschiedlichen und pragmatischen Routen an, die die verschiedenen Agenten nehmen könnten. Bei näherem Hinsehen verdeutlichen die beiden blauen Autos, die im Kreisverkehr bleiben, eine subtile, aber realistische Reaktion – wenn ein schnelleres Fahrzeug ein langsames überholt.
Das letzte Geheimnis von Inverted AI besteht darin, dass ihre proprietären Techniken zum Übertragen dieser Modelle in simulierte Umgebungen simulatorunabhängig sind. Mithilfe von zwei API-Endpunkten – INITIALIZE und DRIVE – kann jedes Unternehmen einfach eine Karte und die Anzahl der Agenten bereitstellen, und INITIALIZE und DRIVE werden nahtlos in ihren Simulationsstapel integriert.
Heute ist Inverted AI ein kleines Team von fünfzehn Personen, bestehend aus studentischen Forschern und Vollzeitmitarbeitern. Die Entwicklung solcher Weltklasse-Vorhersagemodelle mit begrenzten Ressourcen ist keine leichte Aufgabe. Hier kommen Weights & Biases ins Spiel.

Skalierung eines Unternehmens mit Gewichtungen und Verzerrungen

Als wachsendes Team benötigt Inverted AI Tools, die es ihnen ermöglichen, als Unternehmen erfolgreich zu wachsen. Sie brauchten etwas, das sie bei ihrer täglichen Arbeit unterstützt und es ihnen ermöglicht, schnell voranzukommen, ohne dabei Abstriche bei der Qualität zu machen. W&B ist auf Skalierbarkeit ausgelegt und ermöglicht es dem Team, seine Anstrengungen zu verstärken und Ergebnisse zu liefern.
Zu Beginn waren die automatisierten Experimentverfolgungsfunktionen von W&B die Hauptanwendung des Teams. Beim Generieren oder Testen ihrer Umgebungen muss Inverted AI bestimmte Key Performance Indicators (KPIs) kennen, um sicherzustellen, dass ihre Modelle realistische, reaktive und vielfältige Verhaltensweisen simulieren. Mit W&B konnte das Team alle seine Experimente mit Metriken und Protokollen verfolgen, um Modelle live zu vergleichen und die Leistung zu bewerten. Da Inverted AI-Modelle in die Produktion überführt werden, sobald sie eine verbesserte Leistung zeigen, ist die Fähigkeit, ihre Modelle schnell und genau zu bewerten, für das Team von entscheidender Bedeutung.
Als die Mitarbeiterzahl des Unternehmens wuchs, begann Inverted AI auch, immer mehr W&B-Funktionen zu nutzen, um die Effizienz und Produktivität des Teams zu steigern.
Nehmen wir zum Beispiel die Auswahl der Hyperparameter. Das Finden der optimalen Hyperparameterwerte ist entscheidend, um mit jedem ML-Modell eine gute Leistung zu erzielen, und ITRA hat viele davon, die optimiert werden müssen. Darüber hinaus führt die interaktive Natur der Verhaltensvorhersage zusätzliche Konfigurationsoptionen für die Trainingsumgebung ein, wie etwa die Episodenlänge oder die Beendigungsbedingungen. Das Ausprobieren verschiedener Werte all dieser Hyperparameter ist eine Herausforderung – schon aus der Orchestrierungsperspektive allein, insbesondere für studentische Forscher, die ihre Experimente oft an einem Flickenteppich heterogener Cluster durchführen. Mit W&B Sweeps konnte das Team die Jobs problemlos organisieren und orchestrieren und den Überblick über Tausende verschiedener Konfigurationen behalten, und W&B Reports ermöglichte eine schnelle und bequeme interne Verbreitung der Ergebnisse, was den Informationsfluss innerhalb des Unternehmens beschleunigte.
Darüber hinaus nutzten sie W&B Artifacts, um Datensätze, Modelle und Auswertungsergebnisse in ihren ML-Pipelines zu speichern und zu verfolgen. „Wir kamen an den Punkt, an dem wir so viele Modelle und Datenversionen hatten, dass wir sie einfach nicht alle manuell verfolgen konnten. Als wir anfingen, Artifacts zu nutzen, war es sehr hilfreich“, sagte Adam Ścibior, CTO bei Inverted AI.
Während das Team weiterhin verbesserte Varianten von ITRA entwickelt, sind Geschwindigkeit, Genauigkeit und Effizienz allesamt wesentliche Faktoren, um dieses Ziel zu erreichen. Ein Tool wie W&B hat ihnen genau das ermöglicht.

Ein Startup, das man im Auge behalten sollte

Als kleines Unternehmen, das mit Konkurrenten wie Waymo und NVIDIA konkurrieren möchte, benötigte Inverted AI eine Lösung, die es seinem Team ermöglicht, schnell und zuverlässig zu iterieren. Als das Team die Nutzung von W&B steigerte, konnte es die Forschung beschleunigen und wertvolle Modelle in kürzerer Zeit und – was am wichtigsten ist – in großem Maßstab erstellen.
Auch wenn die AV-Branche derzeit von Unternehmen aus den USA geprägt ist, zeigt Inverted AI, dass Kanada eine ernstzunehmende Macht ist. Die Entwicklung erstklassiger Vorhersagemodelle, mit denen menschenähnliche NPCs gesteuert werden können, ist eine ehrgeizige Mission. Durch die Optimierung des maschinellen Lern-Workflows mit Weights & Biases konnten mehr und bessere Modelle schneller trainiert und schnell und zuverlässig eingesetzt werden. Die Arbeit des Teams sorgt für besseres Fahren, weniger Unfälle und vor allem sicherere Straßen für alle.