Skip to Content
評価テキストの違い

テキスト差分評価

この例では、Mastra のテキスト差分メトリックを使用して、シーケンスの違いや変更を分析することでテキスト文字列間の類似度を評価する方法を示します。

概要

この例では、以下の方法を示します:

  1. Textual Differenceメトリクスの設定方法
  2. テキストシーケンスの差分比較
  3. 類似度スコアと変更点の分析
  4. 異なる比較シナリオへの対応

セットアップ

依存関係

必要な依存関係をインポートします:

src/index.ts
import { TextualDifferenceMetric } from "@mastra/evals/nlp";

メトリックの設定

Textual Differenceメトリックを設定します:

src/index.ts
const metric = new TextualDifferenceMetric();

使用例

完全一致テキストの例

まったく同じテキストを評価します:

src/index.ts
const input1 = "The quick brown fox jumps over the lazy dog"; const output1 = "The quick brown fox jumps over the lazy dog"; console.log("Example 1 - Identical Texts:"); console.log("Input:", input1); console.log("Output:", output1); const result1 = await metric.measure(input1, output1); console.log("Metric Result:", { score: result1.score, info: { confidence: result1.info.confidence, ratio: result1.info.ratio, changes: result1.info.changes, lengthDiff: result1.info.lengthDiff, }, }); // Example Output: // Metric Result: { // score: 1, // info: { confidence: 1, ratio: 1, changes: 0, lengthDiff: 0 } // }

小さな違いの例

わずかな違いがあるテキストを評価します:

src/index.ts
const input2 = "Hello world! How are you?"; const output2 = "Hello there! How is it going?"; console.log("Example 2 - Minor Differences:"); console.log("Input:", input2); console.log("Output:", output2); const result2 = await metric.measure(input2, output2); console.log("Metric Result:", { score: result2.score, info: { confidence: result2.info.confidence, ratio: result2.info.ratio, changes: result2.info.changes, lengthDiff: result2.info.lengthDiff, }, }); // Example Output: // Metric Result: { // score: 0.5925925925925926, // info: { // confidence: 0.8620689655172413, // ratio: 0.5925925925925926, // changes: 5, // lengthDiff: 0.13793103448275862 // } // }

大きな違いの例

大きな違いがあるテキストを評価します:

src/index.ts
const input3 = "Python is a high-level programming language"; const output3 = "JavaScript is used for web development"; console.log("Example 3 - Major Differences:"); console.log("Input:", input3); console.log("Output:", output3); const result3 = await metric.measure(input3, output3); console.log("Metric Result:", { score: result3.score, info: { confidence: result3.info.confidence, ratio: result3.info.ratio, changes: result3.info.changes, lengthDiff: result3.info.lengthDiff, }, }); // Example Output: // Metric Result: { // score: 0.32098765432098764, // info: { // confidence: 0.8837209302325582, // ratio: 0.32098765432098764, // changes: 8, // lengthDiff: 0.11627906976744186 // } // }

結果の理解

この指標は以下を提供します:

  1. 0から1までの類似度スコア:

    • 1.0: 完全に同一のテキスト - 違いなし
    • 0.7-0.9: 軽微な違い - わずかな修正が必要
    • 0.4-0.6: 中程度の違い - かなりの修正が必要
    • 0.1-0.3: 大きな違い - 大幅な修正が必要
    • 0.0: 完全に異なるテキスト
  2. 詳細な指標:

    • 信頼度: テキストの長さに基づく比較の信頼性
    • 比率: シーケンスマッチングによる生の類似度スコア
    • 変更数: 必要な編集操作の数
    • 長さの差: テキスト長の正規化された差
  3. 以下の分析:

    • 文字レベルの違い
    • シーケンスマッチングのパターン
    • 編集距離の計算
    • 長さの正規化の影響





GitHubで例を見る