ChatGPTの非機能的な制約
2022年11月にChatGPTがリリースされ社会に大きな衝撃を与えてから、早くも1年以上が経ちました。さまざまな企業がChatGPTやAzure OpenAI Serviceを社内に導入し、大規模言語モデルが業務で利用されるようになってきています。
一方で、ChatGPTの自社利用を検討するにあたって、クラウド上にデータがアップロードされることに関する自社の情報セキュリティ上の制約やトークン数に応じて発生する課金に対する予算取りなど、非機能観点での懸念点を起因とする、利活用面での課題も見られます。
そうした課題を踏まえ、本稿では「オープンソースの大規模言語モデル」を利用する事例を紹介します。オープンソースのモデルを利用する効果を十分に理解することで、非機能的な制限がある場合にも、大規模言語モデルを活用する方法を見出すことができます(図表1参照)。
【図表1:ChatGPTとオープンソースの大規模言語モデルの比較(非機能観点)】
オープンソースの大規模言語モデルの精度
オープンソースの大規模言語モデルの精度はどの程度なのでしょうか。本稿では題材として、自動車購入客のアンケートから「購入客がどこを気に入ったのか(機能・デザイン)」を集計する業務を設定し、オープンソースの大規模言語モデルで自動化してみます。
なお、アンケートは題材のためにKPMG側で用意した架空の回答であり、実際のアンケートからの引用ではないことをお断りします。
【図表2:自動車購入客アンケートの集計業務】
まずは試しに、ChatGPTにタスクを依頼してみましょう(図表3参照)。
不必要な解説の文言の生成や、アンケートに記載のない“可能性”について言及している箇所はありますが、自然な返答が得られています。プロンプトの改善や簡易チューニングにより、思いどおりの集計に近付けることはできそうです。
【図表3:ChatGPTの出力】
それでは次に、オープンソースの大規模言語モデルにタスクを依頼してみましょう。図表4は、ELYZA社の大規模言語モデル※3をKPMGが独自にチューニングし、同様のアンケート集計業務を指示した結果です。
【図表4:オープンソースの大規模言語モデルの実力】
ファインチューニングの効果込みではありますが、正しく機能・デザインへの言及を集計するのみならず、後続の分析を見据えた構造的な出力ができています。集計の抜け漏れも少なく、ChatGPTの出力(図表3)と比較しても、遜色ない精度であると言えます。
今後の展望
前述の結果から、ChatGPT同様に、オープンソースの大規模言語モデルも業務利用に十分な精度があることがわかりました。
ChatGPTの衝撃の裏に隠れていますが、オープンソースの大規模言語モデルも精度の向上を続けており、さまざまなベンチマークスコアでGPT-3.5に匹敵する精度を持つモデル※4が出現してきています。また、オープンソースコミュニティではチューニング済みモデルや新たな利活用フレームワークが次々と生まれており、可能性の幅が大きく広がっています。場合によっては、ChatGPTではなくオープンソースの言語モデルを使う方が、精度上より良い結果を得ることができる可能性も十分にあると考えられています。
このようなオープンソースのモデルの発展とともに、今後のAI開発は大きく2つの方向性で加速していくと予想されます。
(1)AIが持つ情報の質・種類が拡張される
- ドメイン知識の獲得・エキスパートシステムの誕生
医療・法律・化学など、深い専門知識が求められる分野で、ドメイン特化の学習をしたAIが登場していくことが考えられます。人間と同様に、AIもそれぞれの専門性をもった個別モデルが、与えられた職務に応じた働きをするようになる可能性があります。
- マルチモーダル化・ロボティクスとの融合
音声・画像・映像情報や、ひいては触覚・聴覚・味覚などの主観的な情報も含めた複数のモーダルのデータを統合的に処理できるように進化すると考えられます。複合的な判断が可能になり、自律的なロボットが産業の生産性を向上させていくかもしれません。
(2)AIが利用される時空間が拡張される
- 分散型AIの台頭
日進月歩でIoT機器の性能がAIによって底上げされていくでしょう。また、ハードウェアの改良により、ネットワークへの常時接続ができない環境においてもエッジデバイス上でAIが稼働し、リアルタイムな分析および意思決定が可能となるかもしれません。
- パーソナライズ化・エージェント※5化
「意図が伝わらない」「思ったように動かない」といった現在の対話型チャットボットの大きな課題が解決されていくと考えられます。この方向の進化では、文脈を推測する力や知識・前提を長期的に保持する力をAIが身に着けていき、ユーザーにとっての“自分だけのAI”が生まれていくことが想像されます。
ここまで、架空のアンケートを基にした、ChatGPT、オープンソースの大規模言語モデルの事例を紹介しましたが、KPMGでは実際の業務にこれらの先進テクノロジーを活用した業務高度化の実績を多数有しています。お気軽にお問い合わせください。
※3:ELYZA, Inc.「Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました」
※4:Weights & Biases「Nejumi LLMリーダーボード」
※5:AIエージェントとは、自律的にタスクを実行するAIのことで、具体的なタスクの指示を与えずとも、与えられた状況と目標から目標達成のためのタスクを実行することができます。
※本文中に記載されている会社名・製品名は各社の登録商標または商標です。
執筆者
KPMGコンサルティング
シニアコンサルタント 上林 勇太