Azure AI Languageのテキスト分析でPII（個人情報）検出機能を使用して企業… | AI-900：Microsoft Azure AI Fundamentals

自然言語処理応用

Azure AI Languageのテキスト分析でPII（個人情報）検出機能を使用して企業データベースの顧客メールを自動処理している場合、検出されないPII情報が存在する可能性を低減するために最も重要な施策はどれか？

A.PII検出機能は言語別に精度が異なるため、複数言語が混在する場合は言語ごとに分割して処理する

✗ 言語による検出精度の差は存在しますが、言語分割処理が主な解決手段ではありません。重要なのは検出対象PII種別の設定です。

B.検出対象のPII種別（クレジットカード番号、電話番号、メールアドレス等）を明示的に指定し、組織で想定されるPII種別を網羅的に設定する← 正解

✓ 正解です。PII検出機能では検出対象のカテゴリ（電話番号、住所、銀行口座等）を指定できます。組織で扱う全てのPII種別を網羅的に設定することが最も重要です。

C.PII検出の精度はAzureデータセンターの地理的位置によって異なるため、日本国内のサーバーを選択することで精度向上が可能である

✗ PII検出の精度はデータセンターの地理的位置に依存しません。言語処理の精度はモデル自体の性能に依存し、物理的サーバー位置は影響しません。

D.テキスト分析の信頼度スコアが0.5以下の検出結果は自動的に削除されるため、スコア設定で0.9以上に調整すると検出精度が向上する

✗ 信頼度スコアの閾値調整は誤検出削減に役立ちますが、検出漏れ削減には役立ちません。スコア上げすぎるとむしろ検出漏れが増加します。

この問題のポイント

PII検出機能では検出対象のカテゴリ（電話番号、住所、銀行口座等）を指定できます。組織で扱う全てのPII種別を網羅的に設定することが最も重要です。

「自然言語処理」の他の問題

AWS Certified Cloud Practitioner（CLF-C02）

AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。

AWS Certified Solutions Architect - Associate（SAA-C03）

AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。

DP-900：Microsoft Azure Data Fundamentals

Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。