Concepts
PII マスキングロードマップ
PII マスキングロードマップ
定義
個人情報 (氏名・住所・電話番号・金額等) の取扱を、MVP では身内クライアント前提で割り切りつつ、v1.1 以降で段階的に自動マスキング・redaction を実装していくロードマップ。差し替え可能な疎結合インターフェースを MVP 時点で確保することで、後付け拡張を容易にする設計方針。
現在の理解
現状 (MVP、§10.1)
- 最低限のセキュリティ (TLS / Secret Manager / VPC / RLS / API Key 認証) は実装済み
- PII は transcript / 構造化 JSON にそのまま含まれる
- 初期顧客は身内クライアントで、PII 取り扱いを了解済みの前提
v1.1 拡張ポイント (§10.2)
後から差し替え可能な疎結合インターフェースとして実装:
| 拡張ポイント | 実装方針 |
|---|---|
| transcript 書き込み時フィルタ | transcript_processor interface。保存前に経由させる。MVP は no-op、将来 PII 検出 + マスキング実装に差し替え |
| 構造化 JSON サニタイズ | structured_output_processor interface。PII フィールドの自動検出・redaction |
| Scribe keyterm prompting | Scribe v2 の keyterm 指定機能 (batch のみ現状、realtime 展開待ち)。顧客固有用語の精度向上と redaction hint に使用 |
| 監査ログ PII | audit_logs にも同様のフィルタを適用 |
| 暗号化粒度 | Cloud SQL は column level encryption へ移行 (CMEK + pgcrypto) |
v2 以降 (§10.3, §12.6)
- 顧客単位の keyterm / masking 設定 UI
- PII 検出モデル (自社 or Azure PII Detection 等) の統合
- 音声レベルでの redaction (Sensitive beep 差し込み)
- データ居住地オプション (リージョン固定)
コンプライアンス周辺 (§4.5)
- インバウンド AI 応対冒頭で「通話内容は記録・分析される」旨を自動告知 (NFR-CM-1)
- アウトバウンド AI 発信では「自動音声での発信であること」を開口一番に告げる (NFR-CM-2)
- データ保存期間は tenant 設定で指定可能 (デフォルト 90 日、最大 1 年、NFR-CM-3)
- データ削除 API を提供 (GDPR / 個人情報保護法対応、NFR-CM-4)
論点
- 身内クライアント前提の期限: 外部顧客拡大前に v1.1 が間に合う必要がある。Phase E (Dispatcher 強化) と PII マスキング実装の優先順位
- 法律事務所・ISMS 認証取得企業との整合: クライアント側のコンプライアンス要求が MVP 割り切りを許すかは顧客ごとの個別確認が必要
- Scribe keyterm の realtime 展開時期: ElevenLabs 側の対応待ちに依存
- 音声レベル redaction の技術成熟度: Sensitive beep 差し込みはリアルタイム性とのトレードオフ
根拠となる資料
関連する entity
- 該当なし (現時点)
未解決の問い
- v1.1 実装の正確なタイミング (Phase E と並行か直後か)
- PII 検出モデルの選定基準 (精度 vs コスト vs データ居住地)
- 既存 transcript の遡及 redaction 要件の有無
- 監査ログでの「マスキング済」と「未マスキング」データの識別方法
更新メモ
- 2026-04-19: v3.0 要件定義書から初版作成