自然言語処理応用

Azureの音声テキスト変換(Speech-to-Text)機能を用いて医療現場での医師の診断を音声で記録し、自動的に診療記録テキストに変換するシステムを構築する場合、最も対応すべき課題はどれか?

A.医療専門用語(疾病名、薬剤名など)の認識精度が汎用モデルでは低い可能性があり、医療分野向けの学習が必要である← 正解
✓ 正解です。医療分野では専門用語が頻出するため、汎用モデルでは誤認識率が高くなります。カスタム音声モデルで医療用語を学習させることで精度向上が可能です。
B.リアルタイム音声認識には最低10Mbps以上のネットワーク帯域幅が必須要件である
✗ Speech-to-Textの実行に10Mbps以上の帯域幅は不要です。数Mbps程度の接続環境でも利用可能であり、必須要件として10Mbpsは過度に高い。
C.複数の医師の発話を同時に記録する場合、Speech-to-Textは単一話者のみ対応のため利用不可である
✗ Azure Speech-to-Textは複数話者の識別と記録に対応しています。話者分離機能により複数医師の発話を区別して記録することが可能です。
D.医療記録の言語は日本語に限定されるため、Azure Speech-to-Textは対応言語の制限から利用できない
✗ Azure Speech-to-Textは日本語を含む多数の言語に対応しており、言語対応は問題ではありません。日本語の医療音声記録の処理は十分実現可能です。

この問題のポイント

医療分野では専門用語が頻出するため、汎用モデルでは誤認識率が高くなります。カスタム音声モデルで医療用語を学習させることで精度向上が可能です。

AI-900:Microsoft Azure AI Fundamentals の問題一覧