燃料はデータ、エンジンはAI：自動運転競争の新ルール

本稿は、KPMGコンサルティングの「Automotive Intelligence」チームによるリレー連載です。

自動運転AIにとってデータは燃料です。映像・LiDAR・HDマップなど膨大な情報を高速処理し、モデル性能を高める「データフライホイール」が競争力の鍵となります。生成AIやデータ共有の活用が後発企業の生存戦略となる構造を解説します。

1．燃料はデータ

自動運転技術を支えるAIにとってデータは文字通り「燃料」といった存在です。車載カメラが毎秒30fpsで撮影する8台のカメラの映像データ、マルチビーム方式のLiDARの点群データ、HDマップ更新用の位置情報。これらが自動車1台につき1日数TB、自動車100台で年200PB超に跳ね上がります。データを取り込む速度と品質が自動運転のモデル性能と開発サイクルに影響を与え、さらには自動運転を競争力とする企業の技術力を図る指標になりつつあるということです。

ところがこの「燃料」を満タンにしただけでは走ることはできません。映像データや点群データのノイズを除去し、データ同士の時間同期を実施し、AIが学習可能な形式に前処理することが必要です。このために膨大なGPUによる処理時間が消費されます。ある研究試算では、前処理後に百TB残ったデータを一種類のニューラルネットで学習する場合、単一GPUでは数年を要し、開発サイクルを1週間以内に縮めるには数百台規模のディープラーニングサーバーを並列処理しなければなりません^※1。データ量が増えれば、計算量は跳ね上がる「壁」は、財務体力だけでなくインフラ設計力そのものを試すことになります。

さらにセンサーの多重化がこの「壁」をさらに高くする可能性があります。カメラは視認性に優れる一方で豪雨や夜霧といった激しい天候の変化に弱く、LiDARは三次元で周囲形状を正確に描くことが可能ですが、その装置コストが高い状況です^※2。HDマップは自己位置推定と先読み制御をサポートすることが強みですが、道路工事等の環境の変化の度に更新が必要です。結果として自動運転を成立させるためには、複数のセンサーの長所を融合して、それぞれの短所を補うことで初めて安全水準を満たすことができます。そのしわ寄せはデータ量に依存することになり、形式の異なるデータをリアルタイムで時間同期させることになりますので、計算と通信の両面でシステム全体を重くする原因となります。

2．エンジンはAI

先行する企業は「データフライホイール」の回転を加速させています。ここで「データフライホイール」とは、収集したデータを活用してAIモデルやサービスを継続的に改善し、その活動自体によってさらに良質なデータを生み出し、さらなる改善につなげていく好循環の仕組みを指します。最初に回転させることに力を要する「はずみ車」ですが、一度回転させ、さらにその回転に力を与えていけば勢いよく回り続けることに例えられています。

【データフライホイール】

Japanese alt text: 燃料はデータ、エンジンはAI：自動運転競争の新ルール_図表1

出所：KPMG作成

大量の車両群から継続的に走行データログを吸い上げ、数日単位でモデルを再学習し、性能が上がったソフトウェアを即座に全車へ配信します。この循環サイクルが速くなるほど事故の希少パターン、いわゆるロングテール事例も網羅的に学習することが可能となり、結果としてさらに安全な走行が可能となります。そして稼働する車両台数が増加することにより、燃料であるデータが自動的に増加・補給されることになります。スケールがスケールを呼ぶ自己強化型の構造が完成することになります。

こうなると後発企業は、この「データフライホイール」の回転速度に単独で追い付くことが難しくなることは自明です。さらに大量の車両群といった実験車の規模を一から積み上げるには投資とともに時間が必要となります。いわゆる先行者利得がより大きくなっていると言えます。

そこで注目されるのが、複数企業および業界横断での共同データプールです。通信規格や地図のフォーマットを標準化し、匿名化・暗号化を前提に走行データログを共有化することができれば、希少シナリオの発生確率を後発企業においても高めることができ、アノテーションコストを案分できるでしょう。もっとも、競争領域と協調領域の線引き、知財やプライバシーの扱い、サイバーセキュリティ体制など、提携企業とのすり合わせや合意形成が重要なことは言うまでもありません。

実際の環境データだけでなく、生成AIで合成したシミュレーションシナリオを使って学習する動きも加速しています。仮想都市で無限に事故寸前のケースを再現し、モデルを鍛え上げることで、大量の車両群からの実験実施をある程度補完できる可能性があります。ただし合成データの質と現実適合性を検証できるスキルをもった人材と仕組みを企業内にもっていなければ、せっかく取得したデータはサイロ化してしまい、活かされないデータとなることにも注意が必要です。

結論としては、自動運転の技術開発競争は「どれだけ多く、どれだけ早く、どれだけ賢く燃料であるデータを燃やせるか」に帰着します。後発企業が競争に生き残る道は、データ共有の枠組みを主導し、生成AIによるシミュレーションで不足分を補い、組織内に機械学習のスキルとAI人材を根付かせて学習サイクルを短縮することができるのかに尽きます。

誰と組み、どの燃料を、いかなる炉で燃やすのか。その選択と決心こそが、次世代自動運転競争の覇権を決めるのではないでしょうか。

※1　「自動運転車向け AI のトレーニング: 規模の課題」（NVIDIA）
※2　「Exploring the Unseen: A Survey of Multi-Sensor Fusion and the Role of Explainable AI (XAI) in Autonomous Vehicles 」（MDPI）