アルゴリズム競争力を身に纏う企業の台頭 第4回-世界の動きからみるデータ分析に関わる技術の進化と深化-
最終回となる本稿では、アルゴリズム(処理)の中核を担うデータ分析がどのような進化・深化を遂げているのか。また、社会課題・企業課題を数学的手法で解決する時代におけるデータ分析の進化と深化について、実務経験の観点から解説します。
最終回となる本稿では、アルゴリズム(処理)の中核を担うデータ分析がどのような進化・深化を遂げているのか実務経験の観点から解説します。
従来は「測れないものは改善できない」と言われてきましたが、現在では「多くの事象は計測でき、改善・改革できる」ようになりました。これはつまり、社会課題・企業課題を定量として認識し、数学的手法を用いて解決できる時代が到来したということです。ここに至るまでには、データの取得・加工、計算処理集積回路、アルゴリズムなど、データ分析に関するさまざまな技術の進化・深化がありました。本連載では、 4回にわたって日本企業が意識的に身に纏うべき新たな競争力について解説してきました。最終回となる本稿では、アルゴリズム (処理)の中核を担う”データ分析”がどのような進化・深化を遂げているのか。
また、社会課題・企業課題を数学的手法で解決する時代におけるデータ分析の進化と深化について、実務経験の観点から解説します。本連載を通じ、「アルゴリズム競争力を身につけるためには目先のビジネス課題の解決のみならず、将来や関連業界の動きなどを広く捉える必要性がある」ことを感じていただけたならば幸いです。なお、本文中の意見に関する部分については、筆者の私見であることをあらかじめお断りいたします。
POINT 1
データ分析に関する技術の進化・深化によって加速するビジネス改革
データ取得技術、データ加工技術、データ分析技術、計算処理集積回路、アルゴリズムと、近年、データ分析に関する技術の進化・深化は目覚ましいものがある。その結果、多くの事業が精緻に計測できるようになり、改善・改革が加速されている。これは、社会課題・企業課題を定量として認識し、数学的手法を用いて解決できる時代の到来を示すものである。
POINT 2
データ分析技術の進化・深化がもたらすデータの多様性
データ分析技術の進化・深化は、分析の対象を広げることにもつながっている。最初は数字だけだったデータ分析の対象は、今では数字と文字が双璧をなし、今後は画像と映像もその役割を担うことになると思われる。データの多様性は、モノづくりや医療分野、エンターテインメント分野への応用が期待されているにとどまらず、メタバースや感覚のインターネットにも広がろうとしている。
POINT 3
アルゴリズムの進化がデータ分析の民主化を推し進める
精緻なデータ分析を行うには数学的バックグランドが必要とされていたが、それがデータ分析の民主化を阻む障壁となっていた。今、アルゴリズムは絶えまない進化を遂げ、各種ツールによって高度な専門知識がなくてもアウトカムを得ることができるようになった。つまり、アルゴリズムの進化がデータ分析における数学的バックグランドの必要性を低減させ、データ分析の民主化を強力に推し進めているのである。
目次
Ⅰ.社会課題・企業課題を数学的手法で解決する時代の到来
企業経営やオペレーション改善・改革にデータやデータ分析を活用する重要性が認識されて数十年。今、人工知能(以下、「AI」という)を用いて意思決定の機械化・自動化に挑戦する企業は明らかに増えています。また、データサイエンスという分野の仕事が確立し、多くの企業がデータサイエンティストを採用、大規模な組織を構築するケースも出てきました。
量子コンピューターや高速 5Gネットワークの登場、エッジコンピューティングやセンサー技術・可視化技術の成熟が後押しとなり、統計学や数学・確率論をビジネスに用いた手法やそれらを実装したツールの開発は加速度的に進化しています。並行して、多様なデータ分析を行うプログラミング用ライブラリが世界中で無償利用可能になるなど、データを取得・蓄積・分析するインフラの整備も進んでいます。これらは、データ分析が民主化する準備が技術的にも整ってきたことを示しています。
データ分析の注目度の高まりは、世界中の多くの大学でデータサイエンス、ビジネスアナリティクスという名称のコースが開設されていることからもわかります。米国では、学部生全員に必修としている大学、オンライン教育や社会人受けの講座を提供している大学もあります。日本でも、データサイエンスを学ぶことができる学部・学科の設置大学は 20を超えました。 AI・データ分析に関する学会やカンファレンスの活動も米国を中心に活発で、非常に多くの有識者が最新の情報に耳を傾けています 1。
また、従業員が匿名で企業をレビューする米国の職業ランキングでは、 IT/DX以外のさまざまな職業を抑え、データサイエンティストが第3位に入っています。
Ⅱ.データ取得技術の進化
データは、ありとあらゆる場所から取得できるようになりました。よく知られているウェブ上から特定の情報を収集するスクレイピングのほか、近年では物理センサー技術のめざましい発展により、温度や光、空気の動きなど、さまざまな状態のデータを取得することができます。
1.大学で開発が進む新たなウェアラブルセンサー
ウェアラブルセンサーは柔軟で伸縮性があり、肌にも直接つけられることから、装着者の体温や血圧、心拍数などのバイタルサインを容易に測定できます。また近年では、汗や唾液、尿などの生体流体も測定可能となりました。
米国の大学では、シルク製のマイクロニードルで食品の腐敗や汚染を検知するスマート食品センサー2、布地にセンサーを組込むことで常にバイタルサインを測定できる衣類 3、顔の小さな動きを測定できるALS(筋萎縮性側索硬化症)患者用薄型ウェアラブルセンサー 4、バッテリーや Bluetoothチップなしでワイヤレス通信できる薄型ウェアラブルセンサー5、握るだけで物体の形や重量を予測するセンサーを搭載した手袋「 Scalable Tactile Glove(STAG)6」など、さまざまなシーンでの活用が期待される新しいセンシングメカニズムの開発が行われています。
また、東京大学大学院では、ハサミで簡単に切れる、複数の化学物質を測定可能な高感度・多目的ウェアラブル化学センサー7を開発しています。
2 Massachusetts Institute of Technology Velcro-like food sensor detects spoilage and contamination
3 Massachusetts Institute of Technology Sensors woven into a shirt can monitor vital signs
4 Massachusetts Institute of Technology A wearable sensor to help ALS patients communicate
5 Massachusetts Institute of Technology Engineers fabricate a chip-free, wireless electronic .skin.
6 Massachusetts Institute of Technology Sensor-packed glove learns signatures of the human grasp
7 量子生命 Flagshipプロジェクト多目的ウェアラブル分析化学を実現~健康管理、環境安全、食品管理、犯罪捜査などに有用~
2. 映像センサーの進化
数あるセンサーのなかでも映像センサーの進化には目を見張るものがあります。映像センサーには CCDやCMOSという半導体が使用されており、その技術の進歩により、少ない光量でも高精細な映像を取得できるようになりました。たとえば、 90年代後半のデジタルカメラの画素数はおよそ 30万台でしたが、今では 6,000万画素を超える一眼レフも販売されているなど、映像センサーの品質は非常に高くなっています。
3. スタジアムをスマート化するセンシング・テクノロジー
センシング・テクノロジーは、スポーツ分野でも注目を集めています。オランダのJohan Cruijff Arenaスタジアム8は、データを活用することでスタジアム内外にイノベーションを起こしました。スマートフォンからスタジアムのシステムに接続すると、自宅から座席までの道順をリアルタイムに案内してくれるほか、駐車場の空き状況や公共交通機関を利用する場合の乗換案内といった情報なども提供してくれます。また、最先端のセンサーが、芝生の健康状態から顧客の動きまでスタジアムのあらゆるシーンを監視し、最高の体験を演出します。これらのセンサーによって適時適切な場所にセキュリティを配置することが可能となり、課題を回避するのにも役立ちます。
さらに、停電時にはスタジアムや周辺企業に電力を供給できるよう、リサイクルした電気自動車のバッテリーを活用した非常用電源システムを備えています。これにより、現地やお茶の間のファンが、試合中の重要な瞬間を見逃すことを防ぐのです。
これらの事例が示すように、取得したデータを即時に処理・分析することで「計測し、その場で改善を行う」ことは従来よりもはるかに容易となりました。これは、データ取得技術の進化によって、企業における意思決定のスピードが変化し得ることを示しています。企業はこのことに注視すべきだと考えます。
Ⅲ.データ加工技術の進化
ここまで、センサーによるデータの即時取得、処理・分析によって実現された事例を見てきました。ここからは、意思決定にデータを利活用するための「加工」について説明します。
1.データ加工用ツールの進化
データを効果的に活用するためには、前処理やブレンディング、分析などの処理が必要になります。従来はそうした処理を一つひとつ人の手で行っていましたが、今ではその多くを自動化できるようになりました。データの加工から出力までの一連の作業をワンストップで実行できるツールもあります。
データ加工技術の進化は、データ分析にとどまりません。今では、機械学習のモデル作成でも自動化が進んでいます。従来、データサイエンティストなどが手作業で行っていた特徴量の前処理やモデル選定といった高度な作業が自動化できるということは、 AIの専門知識がなくても、機械学習のモデル構築が可能になるということです。
ただし、データを効率的に処理できたとしても、品質が伴わなければ意味がありません。データの品質を高くするには、偽装欠損値問題(欠損値に望ましくない値が入っている状態)やゼロ問題(ゼロが同じ列に繰り返し出てくる状態)など、データの品質を下げてしまうような問題に対処しなければなりませんが、これらデータの品質に関わる問題に対処するツールもあります。
2. ITツール導入のポイント
データ抽出を自動化などで簡略化することは俊敏性の観点から重要ですが、データ加工はデータを見ずに事務的に行えるものではありません。それは、データ加工という下処理が、分析という料理の味を変えてしまうことがあるからです。分析の前にデータの特性を把握することが重要なのです。
しかしながら、機械学習のモデル開発におけるデータ加工を人の手で行うには大きな労力を要します。したがって、適切なツールを客観的に評価することはアルゴリズム競争力を身につけ、最終的に MLOps(マシンラーニングオペレーティングシステム)を実装する企業に向かううえでとても重要と言えるでしょう。
Ⅳ.計算処理集積回路の進化
社会的ニーズとして、膨大な情報を処理する必要が顕在化し、従来の集積回路(ASIC)/CPUから新しいプロセッサーユニットの必要性が認識されはじめました。そうして開発されたプロセッサーの 1つが、 3Dグラフィックスなどの画像処理に特化したGPU(Graphics Processing Unit)です。カナダ・トロント大学の研究チームが開発したAlexNetはこの GPUを実装しており、同アーキテクチャが 2012年に画像認識コンテストで勝利したことで、ディープラーニングは爆発的なブームとなりました。 GPUは並列的な演算処理が得意だったので、ディープラーニングと相性がよかったのです。
膨大な資本を武器に、自社独自のプロセッサーを開発する企業も出てきました。米大手 IT企業は機械学習ワークロードを高速化するために、ディープラーニング用の集積回路( ASIC)である「 TPU」を開発しています。 TPUは、世界トップクラスのプロ棋士に勝ったことで一躍有名になった囲碁プログラム「 AlphaGo」にも使われています。
一方、クラウド大手企業は独自設計した第2世代機械学習チップを搭載したインスタンスを開発しました。すべての機械学習ワークロードに対してベストとなるインスタンスの選択肢は存在しないことを前提に、多様な集積回路を組み合わせて容易に演算できる機構です。同社はこれを、すでに市場に提供しています。
これらの動きに沿うのは、必ずしも IT関連企業だけではありません。米大手自動車会社は、自動運転の学習用に独自のプロセッサー「 D1」を開発しました。同社で
は、D1を開発中の自動運転機能のディープニューラルネットワークのトレーニング用スーパーコンピューターに組み込み、自動運転技術の開発を加速させようとしていると言われています。
高度なデータ分析を取り巻く集積回路レベルでの基盤技術は、今や飛ぶ鳥を落とす勢いで進化しています。自社製品にプロセッサーを積んでいる企業の多くはこれらの進化に関して十分な注意を払っていると思われますが、それ以外の企業であっても、プロセッサー技術の進化に関して最低限の理解は必要です。前段でも述べたとおり、企業の意思決定スピードは情報の処理スピードにも左右され得るからです。少なくとも、自社で標準としているクラウドサービスの提供ベンダーの海外カンファレンスなどで、 IaaSレベルの技術進化を常にキャッチアップするようにしておくべきです。
Ⅴ.データの多様性と分析技術の進化
長らくデータ分析における主な分析対象は「数字」でした。数字を使うことで過去の分析・将来の予測が行われてきたからです。その後、「文字」に関する分析手法の研究が進み、数字と文字は双璧をなす存在となりました。数字と文字だけでなく、情報伝達手段としては今後、「画像」と「映像」も重要な役割を担うことになるとされています。
1.モノづくりや医療分野で期待される画像分析
デンマークのコペンハーゲン大学の研究者らで構成される国際チームは、詳細な衛星画像とディープラーニングを組み合わせることで、西アフリカのサヘル地域に樹木と低木を発見、 18億本超の存在を確認しました9。個々の樹木を識別し、数えることができるようになったのです。通常の衛星画像ではこれまで個々の樹木まで識別することができず、サヘル地域には樹木がほとんどないと思われていました。
日本の大手 IT企業と米国の工科大学の The Center for Brains, Minds and Machines(CBMM)は、学習時と異なる未知のデータ(out-of-distribution:OOD)を高精度に認識できる AI技術を共同開発しました。これは、見え方が変わっても物を認識できる、多くのなかから対象物を認識できるという人の認知特性から着想を得たもので、 OODデータに対して認識精度が大きく低下するという従来の機械学習の課題を解決する技術です。常に観測条件が変化する交通監視 AIや多種多様な病変がある医療の画像診断 AIなど、モノづくりや医療分野への応用が期待されています。
また、医療機器メーカーでは、 AI咽頭撮影用カメラを開発し、診療所などで患者様協力のもとに、咽喉画像や診療情報に基づいて病気の所見を検出する AIモデルを確立しています。
9 UNIVERSITY OF COPENHAGEN Artificial intelligence reveals hundreds of millions of trees in the Sahara
2. エンターテインメント分野に応用可能な映像分析
米スタンフォード大学ブラウンメディアイノベーション研究所の研究チームは、数字以外の情報を活用する仕組みとして、AIでニュース番組を分析する「スタンフォード・ケーブルテレビ・ニュースアナライザー」を立ち上げました 10。米国では、主要な情報源であるケーブルテレビのニュース番組の多くが定期的に監査されています。ニュースで話題になったことが世論や文化を形成するからです。そうした監査は従来は人の手で行われていましたが、スタンフォード・ケーブルテレビ・ニュースアナライザーでは AIを活用します。 CNNや MSNBCなどで 2010年1月から放送された 27万時間以上のニュース映像から、出演者や出演者が話した内容、出演時間などを定量的に測定・分析して、報道のパターンを調べるというわけです。本プラットフォームの目的は、ニュース報道の偏りや偏向を特定し、透明性を高めることにあります。
同大学の別の研究チームでは、実在するプロテニスプレーヤーの動きを AIで再現する「 Vid2Player」を開発しています 11。試合映像からプレーヤーの動きをモデル化し、テニスプレーヤーを自由に動かしたり、実際には対戦したことがないプレーヤーの試合を合成することができます。プレーヤーの練習やコーチング、試合戦略立案への貢献が期待できます。
従来のシミュレーションは、デジタルツインのように主に製造業などで使われていましたが、行動データと予測モデルを活用することで、人の動きもシミュレーションできるようになります。この技術は、ゲーム開発などエンターテインメント分野にも応用できそうです。
10 Stanford Stanford launches AI-powered TV news analyzer
11 https://cs-stanford-edu.translate.goog/~haotianz/research/vid2player/?_x_tr_sl=en&_x_tr_tl=ja&_x_tr_hl=ja&_x_tr_pto=sc
3. 今後の展望
今後は、メタバースにおける分析も増加していくと思われます。経済産業省が発表した「令和 2年度コンテンツ海外展開促進事業(仮想空間の今後の可能性と諸課題に関する調査分析事業)」12では、仮想空間を「多人数が参加可能で、参加者がアバターを操作して自由に行動でき、他の参加者と交流できるインターネット上に構築される仮想の三次元空間」と定義しています。この仮想の 3次元空間に対し、 2022年6月、米大手ソフトウェア企業はメタバースに対応したアクセス解析ツール「 Adobe Analytics」13を発表しました。
また、建設業界では、最適なフォーマットで3Dデータをダウンロードできるサービス提供を行ったり、医療系を主とした IT企業では、人体の 3次元情報を VR空間で利用できるソフトウェアを開発したりしています。
数字、文字、画像、映像、仮想空間といったデジタルと相性のよいもの、データ化しやすいものだけではありません。人間の五感に関する調査研究も進んでいます。スウェーデンの大手通信機器メーカーが 2019年12月に発表した調査レポート「 10 Hot Consumer Trends 2 0 3 0」14によると、 2025年までに感覚のインターネットが可能となり、 2030年までにデジタルで考えていることを伝達できるようになると予想されています。世界中の人々が、従来のように視覚と聴覚だけでなく、味覚や嗅覚、触覚などあらゆる感覚でインターネットとつながる「 Internet of Sense」の世界です。
技術的には「データにならないものはない」という未来は、もうすぐそこに来ています。この未来を迎えるにあたり、検討しなければならないことがあります。それは倫理や道徳、法律など利用時における制限・制約についてです。新しい技術には膨大な機会と、表裏をなす脅威が常に存在します。企業の CDO/CIO/CTOを支えるリーダー人材は、これらの動向を把握することが大変重要だと考えます。
12経済産業省「仮想空間の今後の可能性と諸課題に関する調査分析事業」の報告書を取りまとめました
13アドビ、メタバースとストリーミングメディアに対応した次世代の分析ソリューションを発表
14 Ericsson 10 Hot Consumer Trends 2030
Ⅵ.絶え間ないアルゴリズムの進化
さいごに、「時系列分析」について解説します。デジタル大辞泉によると、時系列分析とは「ある対象に関する数量の継続的な時間変動を分析し、将来の予測に役立てる手法」のことです。ビジネスでは、販売数推移や売上高推移などの予測を行うときによく利用されます。
時系列分析で将来を予測するには、多くの場合、季節調整といった細かな調整が必要です。しかし、米大手 IT企業が開発した時系列分析アルゴリズム「 Prophet」は、20行程度のコーディングで、細かく調整しなくても高精度な分析ができます。そうした使いやすさから、 2017年にオープンソースソフトウェアとして公開されて以降、急速に普及しました。
しかしながら、最新のアルゴリズムが常に最高のアウトカムを約束しているわけではありません。アルゴリズムが利用できる条件や利用上の制約を理解することは、今後ますます重要となってくるでしょう。
これまで、数学的バックグランドの必要性が、データ分析の民主化において大きな障壁になっていました。ここで紹介した最新ツールによって、そうした障壁が取り除かれることは望ましいといえます。しかし、アルゴリズムが健全に発展していくには、やはり数学的に正しく理解され、そのうえで活用されていかなければなりません。このことはデータ分析のエキスパート、データサイエンティストとして常に念頭に置くべきと考えます。
Ⅶ.さいごに
効果的なビジネスアナリティクスを行うには、課題を分析シナリオと紐付けることが重要です。しかしながら、膨大なビジネステーマのなかから効果的なデータ分析の適用が見込めるエリアを特定することは容易ではありません。また、同時多発的にさまざまな進化・深化がみられる領域でもあることから、新しい方法と従来からの方法、その両面から課題に向き合う必要もあります。
そのためには、さまざまな業界・業種における多様な問題に触れ、解決への努力を続ける必要があります。ただし、これは技術的発展のみではカバーできるものではありません。常に成長するには、各業界・業種で働くデータ分析のエキスパートの方々とのネットワーキングがポイントになります。
かつて、経営資源といえば、ヒト、モノ、カネでした。それがタレント、データ、テクノロジーに置き換わり、現在ではデータとテクノロジーの掛け算である.アルゴリズム競争力を身に纏う企業が台頭してきました。このことからも、データやアルゴリズムを活用して事業を再定義するときには、自社の競争価値を改めて見直し、それらが経営オペレーティングシステムのなかのキーコンポーネントを構成するようにと意識することが重要となります。
デジタルはすでに社会と企業に浸透しています。その恩恵を享受し、「新しい勝ち方」を発見するには、常に物事をデジタルで捉える思考のスイッチをオンにしておく必要があるでしょう。