難問チャレンジ計算

Azure OpenAI Serviceのデプロイメントで、モデルの「TPM(Tokens Per Minute)」が5,000に設定されています。1つのリクエストで平均250トークンを消費する場合、1分間に処理できる最大リクエスト数は何個ですか?

A.最大20リクエスト/分← 正解
✓ 正解です。5,000 TPM ÷ 250トークン/リクエスト = 20リクエスト/分が理論値です。
B.最大15リクエスト/分
✗ 15リクエストは計算値よりも低く、TPMスロットル時の実効値ですが、この問題の設定では不正確です。
C.最大25リクエスト/分
✗ 25リクエストは6,250トークンを必要とし、5,000 TPMの制限を超過してしまいます。
D.最大30リクエスト/分
✗ 30リクエストは7,500トークンを必要とし、制限値を大きく超えるため不可能です。

この問題のポイント

5,000 TPM ÷ 250トークン/リクエスト = 20リクエスト/分が理論値です。

AI-900:Microsoft Azure AI Fundamentals の問題一覧