Azure AI Speech の「音声認識（Speech-to-Text）」と「音声翻訳… | AI-900：Microsoft Azure AI Fundamentals

自然言語処理比較

Azure AI Speech の「音声認識（Speech-to-Text）」と「音声翻訳（Speech Translation）」の機能上の違いとして正しいのはどれか？

A.音声翻訳は音声認識を含み、さらに認識結果を自動的に複数言語に翻訳して出力する← 正解

✓ 正解です。音声翻訳は音声を認識してテキスト化した後、自動的に指定言語に翻訳する統合機能です。音声認識は入力音声のテキスト化のみを行います。

B.音声認識は複数言語に対応するが、音声翻訳は英語のみに限定されている

✗ 誤りです。音声翻訳は複数の言語ペアに対応しており、英語のみに限定されていません。

C.音声認識はテキストのみ出力し、音声翻訳は翻訳後に音声として再出力する

✗ 誤りです。テキスト読み上げ（TTS）による音声出力はオプションであり、音声翻訳の主機能はテキスト形式の翻訳結果です。

D.音声翻訳はリアルタイム処理に対応していないが、音声認識はリアルタイム処理に対応している

✗ 誤りです。どちらのサービスもリアルタイム処理に対応しており、ストリーミング入力での処理が可能です。

この問題のポイント

音声翻訳は音声を認識してテキスト化した後、自動的に指定言語に翻訳する統合機能です。音声認識は入力音声のテキスト化のみを行います。

「自然言語処理」の他の問題

AWS Certified Cloud Practitioner（CLF-C02）

AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。

AWS Certified Solutions Architect - Associate（SAA-C03）

AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。

DP-900：Microsoft Azure Data Fundamentals

Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。