カナダのある金融機関は、セキュリティと業務効率のジレンマに直面していた。機密データ管理のために高度なセキュリティ環境を構築していたが、そのシステムは、アクセス権のある社内ユーザーにとっても使い勝手が悪く、またそのデータはPII(個人情報管理)規定に基づき、手作業で分類処理しているものであった。そのプロセスには膨大な時間がかかっていただけでなく、エラーも発生しやすかった。そこでセキュアな環境下で、生成AIを活用し、50種類のPIIを自動検出するアルゴリズムを開発した。97%の分類精度で、処理時間は10~15分から5~10秒に短縮、約100倍の高速化を実現した。これにより、関連工数を高付加価値業務に再配置。セキュリティと業務効率の課題を同時に解決することができた。
概要 Overview
課題(Before)
- 手動による機密データ分類の非効率性
機密データへのアクセスには管理者承認が必要で、ファイルはPII(個人識別情報)に基づき5つのカテゴリに手動で分類していた。1文書あたり10~15分と処理に時間がかかり、エラーも発生しやすく、バックログや見落としのリスクが増大 - 既存AIツールの限界と分類精度への懸念
既存のAIツールでは、名前や住所などの非構造化データ検出が不十分で、情報分類の精度に懸念。金融アドバイザー、マーケティング、人事など承認された従業員への安全なアクセス提供が困難だった - セキュリティ体制強化の必要性
レビューによりデータ漏えいリスクを最小化するセキュリティフレームワークの強化の必要性が判明した
解決策(During)
- 制御環境内で動作する生成AIツールを開発
承認された担当者のみが機密顧客情報にアクセスできる制御環境を構築。生成AIツールを活用して非構造化データの分析・分類も自動化 - 50種類のPII検出アルゴリズムを構築
大規模言語モデル(LLM)を活用し、クレジットカード、氏名、銀行口座、株式保有、パスワードなど50種類のPIIを検出するアルゴリズムを開発。誤分類フィールドや隠し列など、文書内の異常を特定する機能を実装 - サンプリング手法によるコスト効率化
文書の各セクションからPIIを抽出するサンプリングプロセスを実装し、文書全体をAIモデルに送信することなく正確な分類を実現。1ページあたりの分析コストを5セントに削減 - 最適なLLMの選定と継続的改善
複数のLLMを評価し、精度とコストの観点から最適なモデルを推奨。個人情報データ利用の仕組み開発と運用手順の並走支援を実施
成果(After)
- 分類精度97%を達成、従来の手動プロセスを大幅に上回る性能を実現
非構造化データを含む文書(対象ファイルの約95%)を効率的かつ正確に処理し、情報分類の信頼性を向上。従来の手動分類と比較して97%の分類精度を達成。 - 処理速度100倍向上、10~15分を5~10秒に
手動レビューでは1文書あたり10~15分かかっていたが、わずか5~10秒に短縮。約100倍の処理速度向上を実現し、機密情報のリアルタイム処理が可能に - 5人分の工数を高付加価値業務に再配置
文書レビューの自動化により、5人分のフルタイム工数(FTE)を高付加価値業務へシフト。労働生産性を向上し、より戦略的な業務に人材を配置 - データガバナンスとセキュリティ体制を抜本的に改善
データ漏えいに関連するリスクを低減し、全体的なデータガバナンスフレームワークを改善。即座の業務課題に対処しつつ、拡張可能なソリューションの基盤を構築