自然言語処理比較

Azure AI Speech の「音声認識(Speech-to-Text)」と「音声翻訳(Speech Translation)」の機能上の違いとして正しいのはどれか?

A.音声翻訳は音声認識を含み、さらに認識結果を自動的に複数言語に翻訳して出力する← 正解
✓ 正解です。音声翻訳は音声を認識してテキスト化した後、自動的に指定言語に翻訳する統合機能です。音声認識は入力音声のテキスト化のみを行います。
B.音声認識は複数言語に対応するが、音声翻訳は英語のみに限定されている
✗ 誤りです。音声翻訳は複数の言語ペアに対応しており、英語のみに限定されていません。
C.音声認識はテキストのみ出力し、音声翻訳は翻訳後に音声として再出力する
✗ 誤りです。テキスト読み上げ(TTS)による音声出力はオプションであり、音声翻訳の主機能はテキスト形式の翻訳結果です。
D.音声翻訳はリアルタイム処理に対応していないが、音声認識はリアルタイム処理に対応している
✗ 誤りです。どちらのサービスもリアルタイム処理に対応しており、ストリーミング入力での処理が可能です。

この問題のポイント

音声翻訳は音声を認識してテキスト化した後、自動的に指定言語に翻訳する統合機能です。音声認識は入力音声のテキスト化のみを行います。

AI-900:Microsoft Azure AI Fundamentals の問題一覧