チャンクマークダウン
Markdownは生のHTMLよりも情報密度が高く、RAGパイプラインでの作業が容易です。Markdownを扱う際には、ヘッダーやフォーマットを保持しながら小さな部分に分割する必要があります。chunk
メソッドは、ヘッダー、リスト、コードブロックのようなMarkdown特有の要素を賢く処理します。この例は、検索や取得の目的でMarkdownドキュメントをチャンクする方法を示しています。
import { MDocument } from "@mastra/rag";
const doc = MDocument.fromMarkdown("# Your markdown content...");
const chunks = await doc.chunk();
GitHubで例を見る