Skip to Content
評価単語の包含

単語含有評価

この例では、Mastraで特定の単語が出力テキストに含まれているかどうかを評価するカスタムメトリックの作成方法を示します。 これは、私たち自身の keyword coverage eval の簡易版です。

概要

この例では、以下の方法を示します:

  1. カスタムメトリッククラスを作成する
  2. 応答内の単語の存在を評価する
  3. インクルージョンスコアを計算する
  4. さまざまなインクルージョンのシナリオに対応する

セットアップ

依存関係

必要な依存関係をインポートします:

src/index.ts
import { Metric, type MetricResult } from "@mastra/core/eval";

メトリックの実装

Word Inclusion メトリックを作成します:

src/index.ts
interface WordInclusionResult extends MetricResult { score: number; info: { totalWords: number; matchedWords: number; }; } export class WordInclusionMetric extends Metric { private referenceWords: Set<string>; constructor(words: string[]) { super(); this.referenceWords = new Set(words); } async measure(input: string, output: string): Promise<WordInclusionResult> { const matchedWords = [...this.referenceWords].filter((k) => output.includes(k), ); const totalWords = this.referenceWords.size; const coverage = totalWords > 0 ? matchedWords.length / totalWords : 0; return { score: coverage, info: { totalWords: this.referenceWords.size, matchedWords: matchedWords.length, }, }; } }

使用例

すべての単語が含まれる例

すべての単語が出力に含まれている場合のテスト:

src/index.ts
const words1 = ["apple", "banana", "orange"]; const metric1 = new WordInclusionMetric(words1); const input1 = "List some fruits"; const output1 = "Here are some fruits: apple, banana, and orange."; const result1 = await metric1.measure(input1, output1); console.log("Metric Result:", { score: result1.score, info: result1.info, }); // Example Output: // Metric Result: { score: 1, info: { totalWords: 3, matchedWords: 3 } }

一部の単語が含まれる例

いくつかの単語が含まれている場合のテスト:

src/index.ts
const words2 = ["python", "javascript", "typescript", "rust"]; const metric2 = new WordInclusionMetric(words2); const input2 = "What programming languages do you know?"; const output2 = "I know python and javascript very well."; const result2 = await metric2.measure(input2, output2); console.log("Metric Result:", { score: result2.score, info: result2.info, }); // Example Output: // Metric Result: { score: 0.5, info: { totalWords: 4, matchedWords: 2 } }

どの単語も含まれない例

どの単語も含まれていない場合のテスト:

src/index.ts
const words3 = ["cloud", "server", "database"]; const metric3 = new WordInclusionMetric(words3); const input3 = "Tell me about your infrastructure"; const output3 = "We use modern technology for our systems."; const result3 = await metric3.measure(input3, output3); console.log("Metric Result:", { score: result3.score, info: result3.info, }); // Example Output: // Metric Result: { score: 0, info: { totalWords: 3, matchedWords: 0 } }

結果の理解

この指標は以下を提供します:

  1. 0から1の間の単語包含スコア:

    • 1.0: 完全包含 - すべての単語が含まれている
    • 0.5-0.9: 部分的包含 - 一部の単語が含まれている
    • 0.0: 含まれていない - 単語が見つからない
  2. 詳細な統計情報:

    • チェックする単語の総数
    • 一致した単語の数
    • 包含率の計算
    • 空の入力の処理





GitHubで例を見る