VisualCortex が W&B でビデオ分析をエンタープライズに導入

「私たちがこのような小さなチームを持つことができる理由は、W&B がすべてを調整するのに役立つからです。このプラットフォームは私たちの手作業の多くを取り除き、プロセスを自動化するのに役立ちます。そのため、各メンバーは仕組みや仕組みについて心配することなく、自分の中核的な役割に集中できます。」ガバナンス。」
マイク・セドン
機械学習および人工知能の責任者

ビデオは新たなデータフロンティア

今日のイノベーションを推進するテクノロジーの中でも、AI を活用したビデオ分析は急速に普及しています。この活気ある市場は、 2032 年までに1,004.2 億米ドルに達すると予測されており、減速の兆候はありません。

ビデオ分析は、もはやセキュリティのためだけのものではありません。ほぼすべての業界にとって価値があり、小売店での買い物客の体験を充実させることから、都市計画者のための交通の流れの最適化まで、さまざまなユースケースに対応できます。しかし、ビデオデータを真に実用的なものにすることは、多くの場合、機械学習やコンピュータービジョンの取り組みに精通した人向けのタスクです。しかし、それは過去の話です。クラウドベースのビデオインテリジェンスプラットフォームであるVisualCortexは、ビデオ分析を、ビデオを多用するすべての業界とビジネス機能にとってアクセスしやすく価値のあるものにすることを使命としています。

車両中心から人中心へ

ビデオ分析にはさまざまな用途がありますが、VisualCortex は現在、非常に高い精度の車両および人中心のモデルの提供に重点を置いています。歩行者の往来を分析し、駐車場を監視する必要がある状況はどこにあるでしょうか。そう、ショッピング センターです。

かつては人気があったこれらのミーティング ハブは、人口のさまざまな人口層のニーズに応える魅力的な体験を提供するという大きなプレッシャーに直面しています 。VisualCortex は、現代のショッピング モール運営者が既存のセキュリティおよび監視システムを通じてすでに利用可能なデータを活用することを支援します。これにより、貴重な顧客行動の洞察と、業務を合理化する機会が明らかになります。

未来の小売業

駐車場の問題は、人々が実店舗を避ける主な理由の 1 つです。従来、ショッピング センターは駐車場を管理するために、非常に厳しい仕様を持つ、多数の高価なデバイスに依存しています。

VisualCortex が提供するのは、これらのデバイスの配置をより柔軟にする方法であり、そのためにはモデルの一般化に重点を置く必要があります。VisualCortex の機械学習および人工知能部門の責任者である Mike Seddon 氏は、「当社の自動ナンバー プレート認識 (ANPR) ソリューションは、ナンバー プレートの画像を大幅に拡張することに依存しています。画像の歪みや色の変更などです」と述べています。「こうした作業はすべて、従来の方法よりもはるかに一般化されたモデルのトレーニングに向けられています。」このようにモデルをトレーニングすることで、VisualCortex の ANPR ソリューションをさまざまな環境にすばやく展開し、最初から非常に正確な結果を生成できるようになります。
 
Mike が言及した ANPR ソリューションには、車両検出 (VD)、ナンバープレート検出 (LPD)、ナンバープレート認識 (LPR) の 3 つのフェーズで構成された階層的なモデル セットがあります。
 
まず、名前が示すように、VD は車両が存在するかどうかを検出します。これにより、駐車場のピーク時間や流れのパターンなど、いくつかの有用なものを同時に追跡できます。次に、LPD は、プレートの周囲に境界ボックスを生成することで、ナンバー プレートを識別して位置を特定します。最後に、LPR では、文字のセグメンテーションと文字認識が行われ、プレート上の特定の文字と数字が読み取られます。これらの処理手順はそれぞれ、リアルタイムで高い精度を実現するために重要な役割を果たします。そして、VisualCortex は明らかにそれを実現しました。
 
「当社のクライアントの 1 社では、ダウンタイムなしで精度が 10% 向上しています」と VisualCortex の共同創設者兼 CEO である Patrick Elliott 氏は述べています。
 
ショッピング センターの中心部に移ると、VisualCortex によって展開されたモデルは、店舗内小売業のさまざまな業務の改善にも役立ちます。レイアウトの最適化は、収益を増大させる機会の 1 つです。駐車場管理に使用される同様のオブジェクト検出モデルを使用して、VisualCortex は、店舗内の顧客の動きを追跡する分析情報を小売業者に提供できます。ディスプレイの前に立っている時間や、店舗のどの部分にスタッフが不足しているかなどの質問に簡単に答えることができます。
 
最も優れている点は、これらのビデオ分析に Web ベースのインターフェースからアクセスできることです。これにより、ソフトウェア開発者やデータ サイエンティストなどの技術ユーザーだけでなく、マーケティング担当役員からビジネス分析担当者までのビジネス ユーザーも、業務のあらゆる側面に関する実用的なデータ ストリームを迅速かつ簡単に生成できるようになります。
 
「私たちは、コンピュータービジョン技術から科学と恐怖を取り除き、ビジネス界のエンドユーザーに焦点を合わせようと真剣に取り組んでいます」とパトリック氏は語った。
 

効率性と生産性の向上

VisualCortex は、データの収集とラベル付けからトレーニングと展開まで、エンドツーエンドのトレーニングを担当していますが、同社の ML 作業の大部分は、3 人の開発者からなる小規模なチームによって実現されています。迅速に作業を進め、生産性を高く維持するためのツールを確保するために、同社は W&B を利用して ML ワークフローを合理化しています。
 
「私たちがこれほど小規模なチームでいられるのは、W&B があらゆる調整を支援してくれるからです」とパトリック氏は説明します。「このプラットフォームによって手作業が大幅に削減され、プロセスの自動化も可能になったため、各メンバーは自分のコアな役割に集中でき、仕組みやガバナンスについて心配する必要がなくなりました。」
 
特に、W&B スイープは、最適なデータ拡張を見つける速度を加速しました。Sweeps に拡張をプログラムで組み込むことで、VisualCortex は拡張の組み合わせの空間を効率的にサンプリングし、最適なモデルを推進できます。チームにとってのさらなるメリットは、これらの属性が W&B ハイパーパラメータ重要度パネルに表示されることで、貴重なパターンや関係を発見するのに役立ちました。
 
VisualCortex が新しいモデル トレーニング ラウンドを開始する準備を進めるにつれ、さまざまなコンピューティング ノードのセットを効果的にオーケストレーションする必要性が高まっています。これに対処するため、チームは W&B Launch を活用してコンピューティング リソースに簡単にアクセスできるようにし、トレーニング ワークロードを大幅に拡張する予定です。
 
「当社では Kubernetes を実行しており、各クラスターへのキューを作成してアクティブ化する機能を持つことが、まさに私たちが望んでいることです」と Mike 氏は語ります。
 

企業におけるビデオの台頭

ビデオ分析の可能性は拡大しており、その多様性は紛れもなく証明されています。しかし、ビデオ データを実用的なものにすることは、特にエンタープライズ レベルでは困難です。この前例のないデータ マイニングの機会を活用するように設計されたプラットフォームとして、VisualCortex は、信頼性の高い洞察を効率的に生成し、現実世界の商業上の課題を大規模に解決することを可能にします。
 
コンピューター ビジョン テクノロジーの拡張と実用化というビジョンを継続するには、エンドツーエンドの MLOps プラットフォームが重要です。W&B を使用すると、VisualCortex は ML ワークフローの管理と実行を簡素化し、最適な拡張の検索を自動化し、モデルの動作のインタラクティブな視覚化を探索し、何よりも生産性を次のレベルに引き上げることができます。