生成AIはその登場から急速に知名度を上げ、生産性の向上にも寄与するとの期待から企業の実務への導入も急がれている。他方、ただちに利用可能な標準モデルでは企業内のデータ・ノウハウや専門性の高い領域の知識が不足しており、業務利用可能な水準に至っておらず、概念実証止まりとなることも少なくない。実用化に向けては、生成AIの知識の拡張が1つの有効な手段と考えられる。
本連載では、KPMGでの自社検証を通じて見えた「業務における生成AIの実用化に向けた論点」について、ユースケース・実用可能性を交えながら議論する。
なお、本文中の意見に関する部分については、筆者の私見であることを、あらかじめお断りする。
1.知識の拡張の必要性
ChatGPT※をはじめとする生成AI・大規模言語モデル(LLM)は、公開されて以降急速に認知が広まり、業務への活用を宣言する企業も増加している。生成AIはその先進性によるインパクトのみでなく、ビジネスの領域でも着実に成果を出し始めており、労働生産性の向上にも大きく寄与することが期待されている。
※ChatGPTはOpenAI社の商標です。
企業における生成AIの活用
AI活用の現場に目を向けると、企業が自社の生産性の向上を図る上で、生成AIを活用できる業務範囲の広さは重要な論点の1つとなっている。
ウェブブラウザから手軽に利用できるChatGPTなど、利用開始時点での生成AIはウェブサイトのデータのような「誰でもアクセス可能な一般的な」オープンデータのみを学習をしている。そのため下記のような軽微な業務は任せることができる。
- メール返信のドラフト
- 標準的な会議資料の構成のアドバイス
- 外国語の翻訳、文章の要約 など
ただし、より状況に即した回答を得るには、会議の目的などの追加情報もAIに入力(Few-Shot学習など)する必要があり、入力する手間を考慮すると得られる業務効果は小さいと言える。
本来企業が期待する、より生産性の向上に寄与する下記のような業務は、太字の知識を拡張することが必要となる。
- 自社の規程、マニュアル、過去の事例を参照した上での社内問合せ対応
- 医療、法律、技術文書などに関する専門性の高いアドバイス
- 最新のニュース・トレンドを考慮した情報提供
など
知識の拡張有無による生成AIの回答の差異は、図表1を参照いただきたい。同じLLMを用いていても、知識を拡張することで求めていた回答を得ることが可能になる例だ。知識の拡張はAIの回答の幅を広げ、ユースケースの拡大・業務水準への適応に寄与する重要な取組みなのである。
図表1:知識の拡張有無によるLLM回答の差異
2.代表的な手法の比較
知識の拡張の手法はそれぞれ特性が異なる。以下に代表的な手法を示す。
RAG
RAG(検索機能を拡張した生成:Retrieval-Augmented Generation)は「モデル自体には手を付けずに、外部データを検索可能とすることで知識を拡張する手法」である。人間に例えると「勉強はしていないが、教科書を持ち歩いているため、その場で教科書を読んだ上で回答ができる状態」と表現でき、勉強に時間をかけずに知識を拡張できることから、手軽に試すことのできる手段として注目されている。
Fine-Tuning
「学習済の既存AIモデルに新しいデータを学習させ、知識の拡張・調整をする手法」をFine-Tuningと呼ぶ。こちらは「新しい科目の勉強はしたものの、教科書は持ち歩いてはいないため、記憶をたどって回答する状態」となる。(1)出典が明確に提示できないほか、(2)元の知識と追加した知識の間に情報の齟齬が生じ、ハルシネーションなどの誤った回答・曖昧な回答をする場合もある。
自社独自モデル開発
前述の手法をとらず、自社でモデルを開発することも検討可能である。すべてを一から調整可能であり、最も理想のモデルに仕上げやすいアプローチである一方、作業負荷・システムリソース負荷とも高くなり、現時点で選択可能な企業は多くないと思われる。
図表2ではGPTをはじめとする言語生成モデルの代表的な知識の拡張手法を比較した。求められる専門性・対応負荷・ユーザーへの影響を俯瞰しているため、参照いただきたい。
図表2:知識の拡張手法の比較
知識の拡張手法は個々の特性が異なるため、自社の要件・要求水準・リソースに照らして最適な判断を行う必要があるが、特にRAGは、その導入の手軽さから多くの企業で現実的な知識の拡張手段として検討されている。
次回は、RAGの処理プロセスを概観し、業務における生成AIの実用化が実現できる仕組みを示す。
監修
KPMGアドバイザリーライトハウス 中山 政行
あずさ監査法人 宇宿 哲平、近藤 聡
執筆
KPMGアドバイザリーライトハウス 清水 啓太
あずさ監査法人 井山 大輔、日野原 嵩士、中津留 和哉