自然言語処理応用

Azure AI Languageのテキスト分析でPII(個人情報)検出機能を使用して企業データベースの顧客メールを自動処理している場合、検出されないPII情報が存在する可能性を低減するために最も重要な施策はどれか?

A.PII検出機能は言語別に精度が異なるため、複数言語が混在する場合は言語ごとに分割して処理する
✗ 言語による検出精度の差は存在しますが、言語分割処理が主な解決手段ではありません。重要なのは検出対象PII種別の設定です。
B.検出対象のPII種別(クレジットカード番号、電話番号、メールアドレス等)を明示的に指定し、組織で想定されるPII種別を網羅的に設定する← 正解
✓ 正解です。PII検出機能では検出対象のカテゴリ(電話番号、住所、銀行口座等)を指定できます。組織で扱う全てのPII種別を網羅的に設定することが最も重要です。
C.PII検出の精度はAzureデータセンターの地理的位置によって異なるため、日本国内のサーバーを選択することで精度向上が可能である
✗ PII検出の精度はデータセンターの地理的位置に依存しません。言語処理の精度はモデル自体の性能に依存し、物理的サーバー位置は影響しません。
D.テキスト分析の信頼度スコアが0.5以下の検出結果は自動的に削除されるため、スコア設定で0.9以上に調整すると検出精度が向上する
✗ 信頼度スコアの閾値調整は誤検出削減に役立ちますが、検出漏れ削減には役立ちません。スコア上げすぎるとむしろ検出漏れが増加します。

この問題のポイント

PII検出機能では検出対象のカテゴリ(電話番号、住所、銀行口座等)を指定できます。組織で扱う全てのPII種別を網羅的に設定することが最も重要です。

AI-900:Microsoft Azure AI Fundamentals の問題一覧