DX( デジタルトランスフォーメーション、以下「DX」という)が当たり前となり、テクノロジーが日進月歩で進化するなか、さまざまな企業がDXによるイノベーションや大きなコスト削減を達成しようと日々チャレンジしています。近年は「データドリブン経営」という言葉もよく見聞きするようになり、「DX=データ利活用」という潮流がより一層強くなっています。
一方で、日本企業の実態を見ると、多くの企業で全社的なデータの利活用が進んでいるとは決して言えない状況です。とりわけデータ利活用の中心となる「AI(人工知能)」や「データ解析」については、専門知識を持つ人材の不足や育成難が顕在化しており、データの活用加速の大きなボトルネックとなっています。
このボトルネックの解消の1つとして、専門知識がなくてもAIモデルを作成できる「AutoML(Automated Machine Learning:自動機械学習)」があります。本稿では、日本企業におけるデータ利活用における課題の実態に触れながら、解決策としてのAutoMLの具体的な活用方法、失敗しないためのポイントについて解説します。
なお、本文中の意見に関する部分については、筆者の私見であることをあらかじめお断りいたします。

POINT 1:デジタル人材不足・育成課題の短期的施策としてAutoMLを活用する

データの利活用を加速するうえで、デジタル化を推進する人材の不足や育成という課題がある。デジタル人材の育成は中長期的に取り組むべき課題であり、短期的にはAutoMLという打ち手を活用することで、企業の成長・変革を推進していくことが可能である。

POINT 2:AutoMLが得意なことを理解する

多くのAutoMLは予測と分類に対応しているが、さまざまな変数を複雑に組み合わせた高度な分析には対応していない。AutoMLが得意なことを理解し、適切なテーマを設定し活用することがポイントとなる。

POINT 3:AutoMLの活用場所は現場

ノンコーディングの特性が活かされる最大のシーンは、現場での活用にある。AutoMLを活用することで、長年の経験や勘で実施してきた業務の形式知化や、今までできていなかった網羅的な検証や分析が実現可能となる。

I 日本企業におけるデータ利活用の課題

DXの推進によって企業は、日々の活動で取得・蓄積しているデータをビジネスに役立てようとする動きが加速しています。ビジネスで成果を生むためのデータ利活用への関心が高まるなか、デジタル化を推進する人材の不足が大きな課題となっています。
総務省が行った調査※1では、日本企業の67.6%で「人材不足」が課題と回答しており、米国(26.9%)やドイツ(50.8%)、中国(56.1%)の3ヵ国に比べて非常に多い傾向であることが指摘されています(図表1参照)。特にAI・データ解析の専門家は、65.8%の日本企業で「大いに不足している」または「多少不足している」(なお、20.2%の企業は「わからない」)と回答しており、米国(37. 9%)やドイツ(41.4%)に比べ、その状況は深刻であると報告されています。さらに、デジタル技術の知識・リテラシー不足も課題や障壁と言われており、データ利活用の現場への浸透が進まない一因と考えられます。
同調査では、デジタル人材(AI・データ解析の専門家)の不足理由について、「育成する体制が整っていない」「採用する体制が整っていない」「育成する方法がわからない」と回答する企業が多い状況となっています(図表2参照)。このことから、社内の既存人材の配置転換や育成の方針をとるものの、その対応に苦慮している日本企業が多いことが見てとれます。

【図表1:デジタル化を進める上での課題や障壁(国別)】

「AutoML」がAIモデルの自社開発を可能に_図表1

出所:総務省(2022)「国内外における最新の情報通信技術の研究開発及びデジタル活用の動向に関する調査研究」を基にKPMG作成

【図表2:日本企業におけるデジタル人材の不足理由(AI・データ解析の専門家)】

「AutoML」がAIモデルの自社開発を可能に_図表2

出所:総務省(2022)「国内外における最新の情報通信技術の研究開発及びデジタル活用の動向に関する調査研究」を基にKPMG作成

II 課題の解決策

採用や育成によるデジタル人材の確保が困難な状況であることから、不足するケイパビリティを外部の専門家に依頼することも考えられますが、それは対処療法に留まります。何よりも社内にスキルが定着せず、根本的な問題解決につながらない、といった課題があります。
これらの解決策の1つとして、AutoMLの活用が考えられます。外部の専門家(データサインティスト)の支援を受けながら、社内の既存人材が自走するために必要となるケイパビリティ(AI・データ解析のスキル)をAutoMLによって補い、リテラシーの向上を図るとともに、社内にスキルを定着化させるというわけです。AutoMLの活用のみでは、データサイエンティストの業務全般を代替することはできませんが、分析課題や推定する対象が明確である場合において、AIモデルの構築と評価部分を中心にツールで対応することができ、一定の効果が期待できます。

III AutoMLとは

AutoML は、Automated Machine Learning(=自動機械学習)の略語であり、ノンコーディングでAIモデルを開発する手法およびツールのことを指します。このAutoMLを活用することで、ソースコードなどのプログラム言語といった高度な専門知識やスキルがなくても、低コストかつ短期間で、高精度なAIの開発が可能となります。主に、予測や分類業務の自動化を目的として活用されることが多いAutoMLによって、これまでは担当者の経験や勘に頼っていた属人的な業務を排除し、暗黙知を形式知化するなど、業務の標準化も実現することができます。
多くのAutoMLは、SaaS(Software as a Service)型クラウドサービスとして提供されています。ヒトの手で精緻化(データクレンジング)されたExcelなどの学習データをアップロードし、ツール上で予測や分類したい項目を設定するだけで、自動で学習が開始されます。図表3に示すとおり、AutoMLではアップロードされた学習データを基に、ツール内で総当たり的にアルゴリズムを選定し、それぞれにAIモデルの構築とパラメータチューニングを実施したうえで、類推精度の高いモデルを自動で一覧化します。ユーザーは、適切な評価指標を選択したうえで、それぞれのAIモデルの精度や類推に係る速度、精度に強い影響を与えているデータ(特徴量)などを比較し、最適なAIモデルを選定していきます。

【図表3:汎用的なAIモデル構築のプロセスとAutoMLの自動化範囲】

「AutoML」がAIモデルの自社開発を可能に_図表3

出所:KPMG作成

IV 具体的なユースケース

ここからは金融・保険業界における審査・与信業務などについて、AutoMLを活用した具体的なユースケースを見ていきます。
図表4に示すとおり、AutoMLの一般的な3つの導入プロセスである「アイディエーション」「構築」「業務への適用・モニタリング」というステップごとに解説します。

【図表4:AutoML導入支援の展開フェーズ ~KPMG想定の最短アプローチ~】

「AutoML」がAIモデルの自社開発を可能に_図表4

出所:KPMG作成

Step1:アイディエーション
はじめに、適切な業務課題を特定し、その課題に対して何を達成すると解決できるのか、求めるべき解と現実的なゴールを 「アイディエーション」のステップで明確化します。具体的には、「既存の審査業務に係る工数をxx%削減する」「貸倒れリスクをxx%低減する」という目的を明確にし、そのために「与信判断の類推精度をxx%以上とする」などのようにゴールを明確化します。実は、この目的とゴールの明確化が、AutoML導入の成功と失敗の分水嶺となります。
また、AutoMLには基本的に、「回帰(数値・時系列)」と「分類(二値・多値)予測機能」が搭載されており、一般的には前者より後者のほうが精度が高くなります。これは、AutoMLの効果を最大限享受するためには、分析の目的に応じて従前の類推対象や業務プロセスなどを見直す(例:数値予測から二値予測)ことも必要になるということです。たとえば、業務プロセスにおいて顧客情報を基に与信の点数をつけているならば、AutoMLの回帰予測を用いて、従来とおりに点数付けをすることも可能ですが、「貸倒れリスク有/無」という二値の分類予測に変更することで、より高い精度の与信情報を得ることができるようになります。
さらに、AutoMLによって「貸倒れリスク有」に振り分けられた顧客のみを担当者が精査する、という新たなプロセスを策定すれば、前述の目的やゴールを達成することもできます。
仮に、このアイディエーションのステップを経ないまま、すぐさまAIモデル構築を開始した場合、既存の業務範囲や固定観念のなかでの精度向上の施策にばかり目が向いてしまうことになるでしょう。それでは、AutoMLを苦労して導入しても、数%程度の精度改善しか見込めず、結果としてAutoMLの継続的な利用を断念してしまうことになりかねません。

Step2:構築
次に、蓄積されたデータを収集し、データクレンジングを行ったうえで、それらのデータを学習データとしてAutoMLに投入し、AIモデルを構築していきます。
「構築」のステップは、「(1)学習データの準備」「(2)データクレンジング」「(3)AIモデル構築と評価」「(4)評価判断とデータの見直し」に分けられます。このうち(3)については前述のとおり、AutoMLツールによって自動でAIモデル構築や類推精度の算出が行われます。一方、(1)(2)(4)については、一部のツールを除いてAutoMLの標準機能として備わっていません。そのため、ヒトの手でExcelやAccessなどのデータベース管理ソフトウェアを使ってデータを確認・見直す必要があります。
AutoML自体は誰でも簡単に扱えるツールですが、「Garbage In, Garbage Out(ゴミを入れたら、ゴミが出てくる)」というコンピュータの世界ではよく知られる言葉があるように、投入する学習データの良し悪しが類推精度に大きく影響します。そこで、本項では「データ」という切り口に沿って、データ見直しのTipsを次に詳述します。

【AutoMLの類推精度が著しく低い際のデータ見直しのTips】
基本となりますが、まずはデータの「量」と「質」を改善することが肝要です(図表5参照)。データの量と言えば、レコード数を増やすことに主眼が置かれがちですが、解を導出するための要因、つまり相関関係のありそうな列項目を増やすことも重要です。先の金融・保険業界における審査・与信業務の例であれば、収入や勤続年数、健康状態などの基礎情報だけでなく、住所などの地理的情報、過去の支出額や設問への回答時間など自社が保有・獲得することができる顧客情報を増やすことが改善策として挙げられます。また、住所なども文字列の羅列として学習させるのではなく、都道府県を切り出して47のカテゴリ-として、AutoMLが解析処理しやすい型に変換して扱うことで、さらに精度が向上する場合もあります。
次にデータの質として、「偏りのないデータの分布となっているか」を確認します。たとえば、「貸倒れリスク無」のデータが全体の9割以上を占め、「貸倒れリスク有」のデータが残り1割である場合、後者の学習量は少なくなります。このような場合は、結果として精度の低下に繋がるため、分布の改善が必要となります。その他にも、欠損値や外れ値、オペレーションミスで発生してしまった重複値なども、AutoMLへのデータ投入前に精査することが肝要です。

続いて、データの量と質が十分であっても類推精度が低い場合、データを分割してからAIモデル構築することで、類推精度向上に寄与する可能性があります。たとえば、顧客情報を基に100個の保険サービスのなかから最適な商品を提案するAIモデルを構築する場合ならば、性別や年齢によって加入できるサービスが限定される場合を想定します。たとえば、「男性40歳以上」「男性40歳未満」「女性40歳以上」「女性40歳未満」という4つのデータセットを作成し、4つのAIモデルを構築することで、各モデルで類推対象となる保険サービスが、100個から30個にまで狭まるなど、類推精度を飛躍的に向上させることが可能となります。
一方で、4つのAIモデルの構築に加え管理も必要となるので、それらに係る工数と精度とのトレードオフの検討が必要になることにも注意が必要です。

【図表5:AutoMLの類推精度が著しく低い際のデータ参照例】

「AutoML」がAIモデルの自社開発を可能に_図表5

出所:KPMG作成

Step3:業務への適用・モニタリング
最後に、構築したAIモデルを基に業務が滞りなく遂行されるのか、また、どのようにAIモデルを管理していくかを検討します。モニタリングの主な観点は、当初定めたゴールの達成度合いや類推精度、学習データの蓄積量などが挙げられます。
多くの企業では、AutoMLで構築したAIモデルを本格運用する前に、数週間ほどの並行運用期間を設定します。従来ヒトが実施していた業務プロセスと、AutoMLを用いた新たな業務プロセスの両方のプロセスを遂行したうえで、本格運用に耐え得るプロセスや結果となっているかを確認するというわけです。並行運用では、当初決めた目的やゴールが果たせているかについても、検証することが肝要となります。また、AutoMLにより構築したAIモデルをどのくらいの周期で、どのようにモニタリングするのか閾値を設け、「精度がxx%を下回った際に再学習させる」などといった方針や、それらの手順をドキュメント化します。それによって、担当者が変わっても、標準化された業務プロセスにおいて高品質を保ったアウトプットが期待できます。

V さいごに

今回紹介した「AutoML」は、現場レベルでの活用に適していると言えます。人材不足・育成の課題は中長期的に真摯に取り組む必要がありますが、AutoMLはその一助として十二分に応えてくれるソリューションであると考えます。
AutoML活用の留意点として、データサイエンスの本質的理解に基づく判断については、ヒトの関与が必須となることが挙げられます。解決すべき課題は何かを明確にしたうえで、どのようなデータがビジネスの成長や改善に役立つのかを検討し設定する必要があります。これは、すでに保有するデータだけで課題を解決できるとは限らないということです。目的に応じて、新たなデータの取得や外部データの活用、データの傾向やドメイン特性から特徴量となるデータを作り出すなど、適切なデータの選定や目利きが重要となります。

KPMGコンサルティングでは、企業の業務改革の実現に向け、このAutoMLの活用範囲の検討から選定、導入支援、導入後の評価まで総合的に支援しています。
本稿で解説した「アイディエーション」「構築」「業務への適用・モニタリング」という3つのステップを通じて、各部門における実務担当者のAutoMLの基礎的な理解、および業務変革の基盤となる課題解決手法の習得に向けたワークショップの開催など、実務担当者の自走化を目指します。

※1 総務省情報流通行政局2022(令和4)年3月「国内外における最新の情報通信技術の研究開発及びデジタル活用の動向に関する調査研究」

執筆者

KPMGコンサルティング
シニアマネジャー 森本 丈也
マネジャー 中山 政行
マネジャー 荻原 健斗

本レポートの全文は以下からダウンロードできます。

お問合せ