カケトク wiki
Concepts

PII マスキングロードマップ

PII マスキングロードマップ

定義

個人情報 (氏名・住所・電話番号・金額等) の取扱を、MVP では身内クライアント前提で割り切りつつ、v1.1 以降で段階的に自動マスキング・redaction を実装していくロードマップ。差し替え可能な疎結合インターフェースを MVP 時点で確保することで、後付け拡張を容易にする設計方針。

現在の理解

現状 (MVP、§10.1)

  • 最低限のセキュリティ (TLS / Secret Manager / VPC / RLS / API Key 認証) は実装済み
  • PII は transcript / 構造化 JSON にそのまま含まれる
  • 初期顧客は身内クライアントで、PII 取り扱いを了解済みの前提

v1.1 拡張ポイント (§10.2)

後から差し替え可能な疎結合インターフェースとして実装:

拡張ポイント実装方針
transcript 書き込み時フィルタtranscript_processor interface。保存前に経由させる。MVP は no-op、将来 PII 検出 + マスキング実装に差し替え
構造化 JSON サニタイズstructured_output_processor interface。PII フィールドの自動検出・redaction
Scribe keyterm promptingScribe v2 の keyterm 指定機能 (batch のみ現状、realtime 展開待ち)。顧客固有用語の精度向上と redaction hint に使用
監査ログ PIIaudit_logs にも同様のフィルタを適用
暗号化粒度Cloud SQL は column level encryption へ移行 (CMEK + pgcrypto)

v2 以降 (§10.3, §12.6)

  • 顧客単位の keyterm / masking 設定 UI
  • PII 検出モデル (自社 or Azure PII Detection 等) の統合
  • 音声レベルでの redaction (Sensitive beep 差し込み)
  • データ居住地オプション (リージョン固定)

コンプライアンス周辺 (§4.5)

  • インバウンド AI 応対冒頭で「通話内容は記録・分析される」旨を自動告知 (NFR-CM-1)
  • アウトバウンド AI 発信では「自動音声での発信であること」を開口一番に告げる (NFR-CM-2)
  • データ保存期間は tenant 設定で指定可能 (デフォルト 90 日、最大 1 年、NFR-CM-3)
  • データ削除 API を提供 (GDPR / 個人情報保護法対応、NFR-CM-4)

論点

  • 身内クライアント前提の期限: 外部顧客拡大前に v1.1 が間に合う必要がある。Phase E (Dispatcher 強化) と PII マスキング実装の優先順位
  • 法律事務所・ISMS 認証取得企業との整合: クライアント側のコンプライアンス要求が MVP 割り切りを許すかは顧客ごとの個別確認が必要
  • Scribe keyterm の realtime 展開時期: ElevenLabs 側の対応待ちに依存
  • 音声レベル redaction の技術成熟度: Sensitive beep 差し込みはリアルタイム性とのトレードオフ

根拠となる資料

関連する entity

  • 該当なし (現時点)

未解決の問い

  • v1.1 実装の正確なタイミング (Phase E と並行か直後か)
  • PII 検出モデルの選定基準 (精度 vs コスト vs データ居住地)
  • 既存 transcript の遡及 redaction 要件の有無
  • 監査ログでの「マスキング済」と「未マスキング」データの識別方法

更新メモ

  • 2026-04-19: v3.0 要件定義書から初版作成

On this page