Azureの音声テキスト変換（Speech-to-Text）機能を用いて医療現場での医師の… | AI-900：Microsoft Azure AI Fundamentals

自然言語処理応用

Azureの音声テキスト変換（Speech-to-Text）機能を用いて医療現場での医師の診断を音声で記録し、自動的に診療記録テキストに変換するシステムを構築する場合、最も対応すべき課題はどれか？

A.医療専門用語（疾病名、薬剤名など）の認識精度が汎用モデルでは低い可能性があり、医療分野向けの学習が必要である← 正解

✓ 正解です。医療分野では専門用語が頻出するため、汎用モデルでは誤認識率が高くなります。カスタム音声モデルで医療用語を学習させることで精度向上が可能です。

B.リアルタイム音声認識には最低10Mbps以上のネットワーク帯域幅が必須要件である

✗ Speech-to-Textの実行に10Mbps以上の帯域幅は不要です。数Mbps程度の接続環境でも利用可能であり、必須要件として10Mbpsは過度に高い。

C.複数の医師の発話を同時に記録する場合、Speech-to-Textは単一話者のみ対応のため利用不可である

✗ Azure Speech-to-Textは複数話者の識別と記録に対応しています。話者分離機能により複数医師の発話を区別して記録することが可能です。

D.医療記録の言語は日本語に限定されるため、Azure Speech-to-Textは対応言語の制限から利用できない

✗ Azure Speech-to-Textは日本語を含む多数の言語に対応しており、言語対応は問題ではありません。日本語の医療音声記録の処理は十分実現可能です。

この問題のポイント

医療分野では専門用語が頻出するため、汎用モデルでは誤認識率が高くなります。カスタム音声モデルで医療用語を学習させることで精度向上が可能です。

「自然言語処理」の他の問題

AWS Certified Cloud Practitioner（CLF-C02）

AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。

AWS Certified Solutions Architect - Associate（SAA-C03）

AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。

DP-900：Microsoft Azure Data Fundamentals

Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。