AIによる不正会計検知・予測の可能性 - 会計監査の未来を探る

AI・機械学習を用いて企業の会計不正のリスクをスコアリングするモデルの研究・開発に取り組んでいます。

AI・機械学習を用いて企業の会計不正のリスクをスコアリングするモデルの研究・開発に取り組んでいます。

本稿は、『企業会計』2019年11月号に掲載したものです。発行所である中央経済社の許可を得て、あずさ監査法人がウェブサイトに掲載しているものですので、他への転載・転用はご遠慮ください。

はじめに

後を絶たない不適切会計事案を背景に、会計不正を見逃さないことが監査の重要なテーマとなっている。こうした問題意識を踏まえて、有限責任あずさ監査法人(以下「あずさ監査法人」という。)は、国立大学法人一橋大学(以下「一橋大学」という。)と共同で、AI・機械学習を用いて企業の会計不正のリスクをスコアリングするモデルを研究・開発している(この研究結果は、独立行政法人経済産業研究所(RIETI)のディスカッション・ペーパー「機械学習手法を用いた不正会計の検知と予測」として2019年7月23日付で公表済み)。また、あずさ監査法人内の独自の取組みとしても、不正検知を目的としたAIの開発を進め、2019年8月より同法人内で利用を開始している。筆者らは、このような取組みを広く公開し監査業界における知識の共有を進めることで、監査品質の向上を通じた社会貢献を目指している。

I.不正会計とデータ分析

不適切会計は、株式市場、債権市場、銀行取引などの金融取引における意思決定や価格形成を歪め、個人、企業レベルにとどまらず、社会全体に大きな損失、不効率をもたらす。
また、不正会計により企業の開示情報の信頼性が損なわれてしまうと、投資家、金融機関等の潜在的なステークホルダーによる投融資や企業間の取引を萎縮させ、経済の健全な発展を阻害することとなる。
そこで、不正会計を防止・発見するために、企業の内部統制や会計監査、監督官庁によるモニタリングといった対応がなされているが、ここに経験や勘、従来のサンプルチェックだけに頼らない「データ分析」を取り入れることによって、より客観的かつ深度のある判断が可能となると考えられる。
データ分析の手法には様々なものがあるが、近年では、現時点において不正会計を行っている可能性が相対的に高い企業の判別(各期の財務諸表に関する不正会計の「検知」)を目的とする実証的取組みが進められている。
こうした方向における代表的な先行研究としては、Dechow et al.(2011)や Song et al.(2016)が挙げられる。これらの実証研究では、不正の発生メカニズムに関する理論的な議論を踏まえて、検知にあたって参照する説明変数の選択を手作業で行ったのち、パラメトリックなモデルを用いて、現時点における不正会計の発生がそれらの変数とどのように関係しているかを推定したうえで、不正会計の検知を試みている。これらの既存研究では、理論的な検討により不正会計の発生と関連が強いと考えられる変数が、実際に検知に際して理論と整合するような影響を与えていることを示しており、主としてパラメータ推定に用いたデータに対してモデルの当てはまりが良好であったことを報告している。

II.機械学習を活用した取組み

1.先行研究における利用変数と検知性能

前述の先行研究では、不正会計の発生に関する理論的検討と整合的な実証結果が報告されており、仮説検証型の実証研究としての意義は大きい。
一方で、現時点における不正会計の検知を目的とした実務的な取組みの観点からは、活用されていない膨大な変数が存在するという点に注目する必要がある。たとえば、Song et al.(2016)では、理論的な想定に基づいて合計6種類の変数をモデルに投入しているが、このほかにも分析対象企業を取り巻く様々なデータが存在している。それらのなかには、限定的な変数では捉えることのできない有用な情報が含まれている可能性がある。限られた数の変数を用いてモデルを構築することは、理論的想定を仮説検証する目的には適っているものの、実務において不正検知を行うという観点からは改善の余地を残しているといえる。この点に関して、既存研究が用いてきたパラメトリックモデルには参照可能な変数の数におのずから限界が存在するため、限定的な種類の変数のみを用いたモデル構築となっていることは致し方ない面もある。そこで、手法を工夫することで参照可能な変数の数の限界を克服し、より高い検知性能を実現することが期待できる。

2.AI・機械学習の活用と課題

不正会計の発生に関する何らかのシグナルを含む膨大な数の変数を利用し、より高い検知性能を実現するため、近年多くの分野で利用されているAI・機械学習の手法を活用することが有望である。この際、AI・機械学習を活用するには次のような課題を乗り越える必要がある。

(1)不正会計の件数
不正会計の件数が少ないことが、過去のデータを利用した教師ありの機械学習手法を用いる際に問題となる。財務諸表の公開件数は年間数千件あるのに対して、不正会計の存在が公表されている財務諸表は年間数件から数十件しか存在しない。このような状況のなかで、単純に財務諸表に不正会計が含まれているか否かについての正解率を向上させようとした場合、すべての財務諸表に不正はないと推測することで、高い正解率を達成することができる。例えるなら、砂漠で天気予報をする場合、すべて「晴れ」と予報することで、99%的中させることは可能かもしれない。しかし、不正会計検知の目的からすると、そのようなモデルは有用なモデルとはいえない。
こうした例示に代表される課題は、Imbal-ance Problemと呼ばれ、不正会計以外の分野でも生じうるものである。そのため、この課題に対応する機械学習の手法が複数開発されている。これらの手法にはそれぞれ特徴があり、複数手法のなかから目的に適した手法を用いることが重要である。
筆者らが取り組んでいる会計不正リスクのスコアリングにおいては、金融庁による有価証券報告書等の虚偽記載に対する課徴金納付命令、または証券取引等監視委員会が行った虚偽有価証券報告書提出事件としての検察庁への告発があったものを不正会計として学習させている。ここで利用している過去10年超の有価証券報告書提出企業に関するデータにおける不正発生件数を会社別、財務諸表別に示すと図表1のようになる。

図表1 利用データにおける不正発生件数

  会社数 財務諸表数
不正発生 81 173
不正発生以外 4,013 34,750
合計 4,094 34,923


※有価証券報告書提出企業(金融業を除く)で会計基準に日本基準を適用している2006年1月期から2016年3月期までの財務諸表を用いる。

(2)解釈可能性
多数の変数を利用できる機械学習の手法にも様々なものがあるが、性能を高めやすい手法には、モデルの複雑性が高く、その結果を解釈することが困難なものが多い。このような解釈可能性が低いモデルを用いた場合、なぜかよく当たるが、何をもってリスクが高いと評価されているかがわからず、次のアクションにつながらないという状況が起こりうる。
会計監査においては、リスクが高いと判定された場合、実際に不正会計が起きているかを詳細に検討するといった次のアクションが必要になる。そのため、モデルがどのような状況を反映して不正が起きているリスクが高いとみなしているかを解釈できなければ実務での活用が難しい。
この解釈可能性を議論するにあたり以下の2つの観点が考えられる。

  1. モデル全体の傾向解釈:モデルが入力に対してどのような結果を出す傾向にあるか解釈ができるかという観点
  2. 個別結果の解釈:特定の出力結果、特に不正のリスクが高いと評価された財務諸表がなぜそのように判断されたかに関する解釈できるかという観点

たとえば、不正リスクスコアを算出する式が、

不正リスクスコア算出式

といった簡潔な式で表すことができれば、α1がプラスの場合、在庫回転期間が長くなれば不正リスクスコアが高くなる、α1がマイナスの場合、在庫回転期間が長くなれば不正リスクスコアが低くなるといったモデル全体の傾向を把握することができる(モデル全体の傾向解釈)。
さらに、ある財務諸表の不正スコアが高い場合、α1×在庫回転期間、α2×債権回転期間といった各項の値を見ることで、なぜこの財務諸表の不正スコアが高くなったかを解釈することもできる(個別の結果解釈)。
しかし、Random ForestやDeep Learningのような複雑なモデルの場合、それらを表現する式は複雑なものとなり、複雑な問題に対応できる一方で、モデル全体の傾向、個別の結果のどちらの観点からの解釈可能性も低くなってしまう。

III.課題への対応

本稿で説明するモデルでは、前述のような課題に対して、以下のような対応を行っている。

1.利用変数と検知性能

前述のように、高次元の企業情報を変数として参照することでより高い検知性能を実現できると考えられる。特に、専門家に蓄積されたドメイン知識、実務を通じた経験の蓄積から不正が行われた場合に影響を受ける可能性の高い勘定科目や指標を数多く構築し、変数として取り組むことで、検知性能の向上を図った。共同研究およびあずさ監査法人内で利用しているモデルには、投入変数数の制約を克服し、検知性能を高めるためRandom Forestと呼ばれる機械学習手法をベースとした手法を用いている。
具体例としては、Random Forestを使ったスコアリングでは、教師データのなかからランダムに選択したサンプルとランダムに選択した説明変数に基づいて分岐ルール(Decision Tree)を作る作業を多数行う。その後、スコアを付ける際には、スコアリング対象のデータに基づいて、それぞれのDecision Treeの判定結果を算出し、最後に多数のDecision Treeによる評価結果を平均することで、対象のスコアを算出する。この手法を基礎とすることで多数の説明変数を利用することができ、検知の性能を高めることが可能となった。

2.不正会計の件数

不正会計の件数が、極端に少ないという課題に対応するため、Chen et al.(2004)によって提案されたRandom Forestの拡張版であるWeighted Random Forest(WRF)やBalanced Random Forest(BRF)を用いている。WRFでは、レアなイベントを間違って判定することに対して相対的に大きなペナルティを科す。一方、BRFでは、Random Forestのなかで、サンプルをランダムに抽出する際に、不正会計のようなレアイベントからは多数回抽出(over-sampling)し、レアでないイベントからのサンプルの数を減らす(down-sampling)ことで、レアイベントとそうでないイベントの数をバランスさせてRandom Forestを生成する。

3.解釈可能性

(1)モデル全体の傾向解釈
Decision Treeをベースとした手法では説明変数の重要度(Variable Importance)を算出することができ、この値を参照することで、生成したモデルが、どのような説明変数を重要視しているかを理解することができる。

(2)個別結果の解釈
所与の学習済みのモデルに対して、財務指標等の説明変数を人為的に変化させ、その時にスコアがどのように変化するかを観察することで、どの説明変数がスコアの高さの原因となっているかを間接的に確かめることができる。加えて、あずさ監査法人が独自に開発したモデルでは売上過大、費用過少、資産過大といった、不正のタイプ別にサブモデルを作成することで、不正のリスクが高いということだけではなく、どのような不正のリスクが高いかを見ることができるようにしている。さらに、サブモデルの切り口(例:不正実施者、不正手口等)を増やすことで、より詳細にどのようなリスクが高いのかを解釈できるようにし、その後の対応に結び付けることが可能となる。

IV.結果

図表2のとおり、共同研究モデル・あずさモデルそれぞれにおいて、実務的観点から十分な水準の性能を実現できている。

図表2 実際に不正が行われた財務諸表のうち、不正リスク上位X%に含まれている割合

  共同研究モデル あずさ独自モデル
不正検知 不正予測 売上過大検知 費用過少検知 資産過大検知
上位5% 48% 43% 52% 26% 40%
上位10% 70% 60% 60% 49% 63%

実際、これらのモデルにより、最近発覚したいくつかの不正会計を、その発覚前に補足することができた。
あずさ監査法人で実用化している不正検知モデルにおいては、BRFを用いて不正のタイプ別のサブモデルを作成している。このモデルでは、主に財務指標を説明変数として用い不正タイプ別のサブモデルを構築した。図表3はサブモデルごとの変数重要度を示している。

図表3 モデルごとの変数重要度の順位

  共同研究モデル あずさ独自モデル
不正検知 不正予測 売上過大検知 費用過少検知 資産過大検知
1
営業外損益率 営業外損益率 売上債権増減率 有形固定資産残高 売上高営業外損益率
2
営業外損益 有形固定資産残高 売上高成長率 棚卸資産純資産比率 営業利益
3
売上高 有形固定資産比率 売上債権回転期間増減率 有形固定資産比率 のれん純資産割合
4
非金融法人による持ち株比率 株式および債券の発行ダミー変数 売上債権回転期間 営業利益 有形固定資産残高
5
有形固定資産残高 従業員平均勤続年数 棚卸資産純資産比率 売上高営業利益率 売上高営業利益率
6
従業員平均勤続年数 売上高 有形固定資産残高 総資産 有形固定資産比率
7
棚卸資産純資産比率 営業外損益 売上高営業外損益率 売上高営業外損益率 売上債権増減率
8
有形固定資産比率 非金融法人による持ち株比率 棚卸資産回転期間 売上高 営業外損益
9
ソフト資産比率 ソフト資産比率 営業外損益 棚卸資産回転期間 棚卸資産回転期間
10 営業キャッシュ・フロー 棚卸資産純資産比率 棚卸資産総資産比率 棚卸資産総資産比率 棚卸資産純資産比率

一橋大学との共同研究のなかでは、WRFを用いており、説明変数に株主、役員、従業員情報を中心として構築したガバナンス関連変数、取引銀行情報を用いて構築した銀行取引変数を含め性能の変化を検証している。また、様々な変数がスコアに与える影響を検討したところ、たとえば、従業員の平均勤続年数が短い会社ほど高いリスクとなるといったような、経験豊富な専門家の認識、理解と整合するものが多くみられた(図表4)。

図表4 人為的に変数を変動させた場合のスコア変動

図表4 人為的に変数を変動させた場合のスコア変動
  • 平均勤続年数:平均と比較して短いほどリスクが高いと判定されている。
  • 在庫純資産比率、ソフト資産比率(「現預金および有形固定資産」以外の資産が総資産に占める割合):平均と比較して高いほどリスクが高いと判定されている。
  • 売上高:平均と比較して大幅に小さい場合および大幅に大きい場合にリスクが高いと判定されている。

さらに、現時点までのデータに基づいて、現時点の財務諸表における不正のリスクを「検知」することに加えて、将来における不正会計発生の「予測」においても十分な水準の性能を実現できている(図表2図表5)。

図表5 会計不正に関する「検知」と「予測」

図表5 会計不正に関する「検知」と「予測」

V.今後の展望

会計監査においてAIを活用することにより、これまでは熟練の専門家でなければ気づかなかったような不正の兆候を容易に検知することが可能となり、さらには実際に不正が起きる前に、そのリスクが高い領域を予測し、不正の発生を未然に防ぐことができるようになる可能性がある。
ただし、現時点では、高い確率で不正会計が発生している、もしくは発生する可能性があるとされた企業が存在するとしても、実際にどのような点において不正会計の蓋然性が高く、どのような対応を現時点で必要とするかを検討するためには、専門家による高度な判断が必要であり、専門家とAIの協力が不可欠となる。
この協力関係を成功させるためには、AIが得意な領域と苦手な領域を見極めることと、AIの判断をより一層、解釈可能なものにすることが重要となる。
AIモデルが得意とするのは、多数の変数を活用して一定の品質の判断をすることであり、一般的にデータの量が増えるに従って、その性能を向上させていくことができる。
一方で、今回用いている教師あり機械学習モデルには、その手法から来る不得意な領域・限界がある。この点についてより正確に理解するためには、教師ありの機械学習モデルが、あくまで、過去に不正が発覚した財務諸表等に不正が発覚していない財務諸表等と比してどのような特徴があるかを高次元で学習しているものにすぎない点を再度認識する必要がある。そのため、過去に発覚したことのない新たな不正が、財務諸表等にこれまでにはない“歪み”を与える場合には対応することができない。また、社会・経済環境や会計基準等の変化が生じた場合、前提となる財務諸表等が変化し、検知・予測の性能が大きく低下することもありうる。これらの問題に対しては、教師なしの異常検知技術を合わせて適用することや、モデルの有効性を定期的にモニタリングする仕組みを構築し、継続的なモニタリングなどを通じてモデルの構造変化を意識した取組みを進めることである程度対応することができる。
次に、AIの判断をより解釈可能なものとし活用していくため、より詳細なレベルでの検知・予測を可能にすることが考えられる。たとえば、勘定科目レベルでの不正の検知・予測が可能となれば、勘定科目の動きから、どこで不正の可能性が高いとみなされたかを解釈し、アクションにつなげることが可能となる。
さらに、この解釈可能性という方向性に関しては、因果推論の方向で議論を深めることも有益である。特定の監査上の取組みやガバナンス上の工夫が不正の発生に対して、どのような因果関係を持っているか究明することができれば、不正発生に対する有効な防止策は何か、どのような防止策を組み合わせることが有用かといったことを示すことが可能となるであろう。
最後に、AI・機械学習を用いた会計不正に対する取組みについては、スコアリング結果を実務に実装するための追加的な議論と検討が今後ますます重要となる。既述のとおり、監査実務においてAI・機械学習ベースのスコアによって監査人の判断が完全に上書きされるという状況は当面生じないと思われるが、監査人の判断に際してスコアが提供された場合に、その追加的な情報がどのような形で人による検知や予測に取り込まれていくのか、またこうした環境下で、会計士の働き方や業務に対しての向き合い方はどのように変化するのか、といった問題はすでに金融業界における与信業務などで検討が始まっている。高精度の検知・予測を実現し、スコアリング結果の解釈について必要な範囲で因果推論を含めた議論を行うとともに、スコアが監査業務に投入された場合の反応までを見越したフォーワードルッキングな議論が極めて重要と考えられる。

まとめ

本稿では、あずさ監査法人と一橋大学との共同研究成果およびあずさ監査法人におけるAI・機械学習を用いた不正検知モデルについて説明し、今後の展望を概観した。加えて、監査の品質向上のため専門家がAI・機械学習を活用して高度な判断を行うことが重要であることを示した。会計監査の領域においても、このような技術を積極的に活用するとともに、その成果を共有することで、さらなる監査品質の向上に貢献できるものと考える。


参考文献

宇宿哲平、近藤聡、白木研吾、菅美希、宮川大介(2019)「機械学習手法を用いた不正会計の検知と予測」RIETI ディスカッション・ペーパー。
Breiman, L.(2001)Random Forests. Machine Learning 45 (1):pp. 5-32.
Chen, C., A. Liaw, and L. Breiman(2004)Using Random Forest to Learn Imbalanced Data. Technical Report 666 Statistics Department of Univeristy of California at Berkley.Dechow, P. M., W. Ge, C. R. Larson, and R. G. Sloan(2011)Predicting Material AccountingMisstatements. Contemporary Accounting Research 28 (1):pp. 17-82.
Dechow, P. M., R. G. Sloan, and A. P. Sweeney(1996)Causes and Consequences of EarningsManipulation: An Analysis of Firms Subject to Enforcement Actions by the SEC. Contemporary Accounting Research 13 (1) : pp. 1-36.Song, M., N. Oshiro, and A. Shuto(2016)Predicting Accounting Fraud: Evidence from Japan. The Japanese Accounting Review 6 :pp. 17-63.Kleinberg, J., H. Lakkaraju, J. Leskovec, J. Ludwig,and S. Mullainathan(2018)Human Decisions and Machine Predictions. Quarterly Journal of Economics 133 (1):pp. 237-293.

執筆者

一橋大学大学院准教授
宮川 大介

有限責任 あずさ監査法人
公認会計士 公認不正検査士 宇宿 哲平

お問合せ