VisualCortex bringt Videoanalyse mit Weights & Biases in Unternehmen

„Wir können ein so kleines Team haben, weil W&B uns bei der Koordination hilft. Die Plattform nimmt uns einen Großteil der manuellen Arbeit ab und hilft uns bei der Automatisierung von Prozessen, sodass sich jedes Mitglied auf seine Kernaufgabe konzentrieren kann und sich nicht um die Abläufe und die Verwaltung kümmern muss.“

Mike Seddon
Leiter Maschinelles Lernen und Künstliche Intelligenz

Video ist die neue Datengrenze

Unter den Technologien, die heute Innovationen vorantreiben, ist die KI-gestützte Videoanalyse auf dem Vormarsch. Dieser florierende Markt soll bis 2032 voraussichtlich 100,42 Milliarden USD erreichen – und es gibt keine Anzeichen für eine Verlangsamung.
Videoanalyse dient nicht mehr nur der Sicherheit. Sie ist für fast alle Branchen wertvoll und kann eine Vielzahl von Anwendungsfällen abdecken, von der Verbesserung des Einkaufserlebnisses im Einzelhandel bis zur Optimierung des Verkehrsflusses für Stadtplaner. Videodaten jedoch wirklich nutzbar zu machen, ist eine Aufgabe, die oft denjenigen vorbehalten ist, die sich mit maschinellem Lernen und Computer Vision-Initiativen auskennen. Nun, das gehört der Vergangenheit an, denn VisualCortex , eine cloudbasierte Video-Intelligence-Plattform, hat es sich zur Aufgabe gemacht, Videoanalyse für alle videointensiven Branchen und Geschäftsfunktionen zugänglich und nützlich zu machen.

Von der Fahrzeugzentrierung zur Menschenzentrierung

Obwohl es viele verschiedene Anwendungen für Videoanalysen gibt, konzentriert sich VisualCortex derzeit auf die Bereitstellung von Fahrzeug- und Personenmodellen mit einem sehr hohen Maß an Genauigkeit. Und wo gibt es eine Situation, in der Fußgängerverkehr analysiert und Parkflächen überwacht werden müssen? Genau: in Einkaufszentren.
Diese einst beliebten Treffpunkte stehen unter großem Druck,  ein attraktives Erlebnis zu bieten, das die vielen demografischen Segmente der Bevölkerung anspricht. VisualCortex hilft modernen Einkaufszentrumsbetreibern, die Daten zu nutzen, die ihnen durch vorhandene Sicherheits- und Überwachungssysteme bereits zur Verfügung stehen. Dadurch werden wertvolle Einblicke in das Kundenverhalten gewonnen und Möglichkeiten zur Optimierung der Betriebsabläufe geschaffen.

Einzelhandel der Zukunft

Parkplatzprobleme sind einer der Hauptgründe, warum Menschen stationäre Geschäfte meiden. Traditionell verlassen sich Einkaufszentren auf eine große und teure Anzahl von Geräten – mit sehr engen Spezifikationen – um Parkplätze zu verwalten.
VisualCortex bietet eine Möglichkeit, die Platzierung dieser Geräte viel flexibler zu gestalten. Dazu müssen wir uns auf die Verallgemeinerung ihrer Modelle konzentrieren. „Unsere Lösung zur automatischen Nummernschilderkennung (ANPR) basiert auf einer starken Erweiterung von Nummernschildbildern – beispielsweise durch Bildverzerrung oder einfache Farbänderungen“, sagte Mike Seddon, Leiter für maschinelles Lernen und künstliche Intelligenz bei VisualCortex. „All diese Arbeit ist darauf ausgerichtet, ein viel allgemeineres Modell zu trainieren, als man es auf herkömmliche Weise erhalten würde.“ Durch das Trainieren von Modellen auf diese Weise kann die ANPR-Lösung von VisualCortex schnell in einer Vielzahl von Umgebungen eingesetzt werden und von Anfang an hochpräzise Ergebnisse liefern.
 
Die von Mike erwähnte ANPR-Lösung verfügt über einen hierarchischen Satz von Modellen, der aus drei Phasen besteht: Fahrzeugerkennung (VD), Kennzeichenerkennung (LPD) und Kennzeichenerkennung (LPR).
 
Zunächst erkennt VD, wie der Name schon sagt, ob ein Fahrzeug vorhanden ist. Dies hilft dabei, mehrere nützliche Dinge gleichzeitig zu verfolgen – wie Stoßzeiten und Verkehrsmuster auf dem Parkplatz. Dann zielt LPD darauf ab, ein Nummernschild zu identifizieren und zu lokalisieren, indem ein Begrenzungsrahmen um das Nummernschild herum generiert wird. Schließlich findet bei LPR eine Zeichensegmentierung und Zeichenerkennung statt, um die spezifischen Buchstaben und Zahlen auf dem Nummernschild zu lesen. Jeder dieser Verarbeitungsschritte spielt eine wichtige Rolle, um eine hohe Genauigkeit in Echtzeit zu erreichen. Und VisualCortex hat hier eindeutig einen Volltreffer gelandet.
 
„Bei einem unserer Kunden verzeichnen wir eine 10-prozentige Steigerung der Genauigkeit ohne jegliche Ausfallzeiten“, sagte Patrick Elliott, Mitbegründer und CEO von VisualCortex.
 
Im Herzen von Einkaufszentren helfen die von VisualCortex eingesetzten Modelle auch dabei, eine Reihe von Praktiken für den Einzelhandel im Laden zu verbessern. Die Optimierung des Layouts ist eine dieser Möglichkeiten zur Umsatzsteigerung. Mithilfe eines ähnlichen Objekterkennungsmodells, das für die Parkraumbewirtschaftung verwendet wird, kann VisualCortex Einzelhändlern Analysen bereitstellen, die die Kundenbewegungen im Laden verfolgen. Fragen wie „Wie lange steht jemand vor einem Display?“ oder „In welchem ​​Teil des Ladens fehlt Personal?“ lassen sich leicht beantworten.
 
Und das Beste daran? Auf diese Videoanalysen kann über eine webbasierte Schnittstelle zugegriffen werden. So können sowohl technische Benutzer wie Softwareentwickler und Datenwissenschaftler als auch Geschäftsbenutzer – von Marketingmanagern bis hin zu Geschäftsanalytikern – schnell und einfach umsetzbare Datenströme zu jedem Aspekt ihrer Betriebsabläufe erstellen.
 
„Wir versuchen wirklich, die Wissenschaft und die Angst aus der Computer-Vision-Technologie zu nehmen und uns auf die Endbenutzer der Geschäftswelt zu konzentrieren“, sagte Patrick.
 

Steigerung von Effizienz und Produktivität

Obwohl VisualCortex das End-to-End-Training von der Datenerfassung und -kennzeichnung bis hin zum Training und der Bereitstellung selbst übernimmt, wird der Großteil ihrer ML-Arbeit von einem kleinen Team aus drei Entwicklern durchgeführt. Um sicherzustellen, dass sie über die nötigen Tools verfügen, um schnell zu arbeiten und die Produktivität hoch zu halten, stützen sie sich auf Weights & Biases, um ihren ML-Workflow zu optimieren.
 
„Wir können ein so kleines Team haben, weil W&B uns bei der Koordination hilft“, erklärt Patrick. „Die Plattform nimmt uns einen Großteil der manuellen Arbeit ab und hilft uns bei der Automatisierung von Prozessen, sodass sich jedes Mitglied auf seine Kernaufgabe konzentrieren kann und sich nicht um die Abläufe und die Verwaltung kümmern muss.“
 
Insbesondere beschleunigte W&B Sweeps die Suche nach den optimalsten Datenerweiterungen. Durch die programmgesteuerte Integration der Erweiterung in Sweeps kann VisualCortex den Raum der Erweiterungskombinationen effizient abtasten, um das beste Modell zu entwickeln. Ein zusätzlicher Bonus für das Team war die Anzeige dieser Attribute im Hyperparameter-Wichtigkeitsfenster „Weights & Biases“, das ihnen dabei half, wertvolle Muster und Beziehungen aufzudecken.
 
Während VisualCortex sich darauf vorbereitet, eine neue Runde des Modelltrainings zu starten, besteht ein größerer Bedarf, einen unterschiedlichen Satz von Rechenknoten effektiv zu orchestrieren. Um dieses Problem zu lösen, plant das Team, W&B Launch zu nutzen, um einen einfachen Zugriff auf Rechenressourcen zu ermöglichen und seine Trainingsarbeitslasten drastisch zu skalieren.
 
„Bei uns läuft Kubernetes und die Möglichkeit, für jeden Cluster Warteschlangen zu erstellen und diese zu aktivieren, ist genau das, was wir wollen“, sagte Mike.
 

Der Aufstieg von Videos im Unternehmen

Das Potenzial der Videoanalyse wächst und erweist sich als unbestreitbar vielfältig. Dennoch ist es eine Herausforderung, Videodaten nutzbar zu machen, insbesondere auf Unternehmensebene. Als Plattform, die diese beispiellosen Möglichkeiten des Data Minings nutzen soll, ermöglicht VisualCortex die effiziente Generierung zuverlässiger Erkenntnisse und löst so reale kommerzielle Herausforderungen im großen Maßstab.
 
Um die Vision der Skalierung und Produktion von Computer-Vision-Technologie weiterzuführen, ist eine End-to-End-MLOps-Plattform von entscheidender Bedeutung. Mit Weights & Biases kann VisualCortex die Verwaltung und Ausführung von ML-Workflows vereinfachen, die Suche nach optimalen Erweiterungen automatisieren, interaktive Visualisierungen des Modellverhaltens erkunden und vor allem ihre Produktivität auf die nächste Stufe katapultieren.