生成AI応用定義

Azure OpenAI Serviceにおける「トークン(Token)」の定義として最も正確なものはどれか?

A.自然言語処理で使用される神経ネットワークの層のことを指し、深さが増すほど精度が向上する単位
✗ 層の深さに関する説明は誤りです。トークンはテキスト処理の最小単位であり、ニューラルネットワークの層概念ではありません。
B.テキストを処理する際の最小単位であり、通常は単語の一部、完全な単語、または句読点などに分割されるもの← 正解
✓ 正解です。トークンはテキストを処理可能な最小単位に分割したもので、言語やコンテキストにより異なります。API利用料金の計算基準にもなります。
C.LLMが学習時に使用した教師データセットの個数を表す指標で、トークン数が多いほど汎化性能が高い
✗ トークンは教師データセット数の指標ではなく、入出力テキストの処理単位です。学習データサイズと異なります。
D.生成されたテキストの品質を評価するスコアであり、0から1の値で表現される信頼度メトリクス
✗ トークンは品質評価スコアではなく、テキストの構成要素です。生成品質の評価はトークンとは別の指標で行われます。

この問題のポイント

トークンはテキストを処理可能な最小単位に分割したもので、言語やコンテキストにより異なります。API利用料金の計算基準にもなります。

AI-900:Microsoft Azure AI Fundamentals の問題一覧