Skip to Content
RAGチャンク化チャンクHTML

HTMLを意味的に分割する

HTMLコンテンツを扱う際、ドキュメントの構造を維持しながら、より小さく管理しやすい部分に分割する必要がよくあります。chunkメソッドは、HTMLタグと要素の整合性を保ちながら、HTMLコンテンツを賢く分割します。この例は、検索や取得の目的でHTMLドキュメントをどのように分割するかを示しています。

import { MDocument } from "@mastra/rag"; const html = ` <div> <h1>h1 content...</h1> <p>p content...</p> </div> `; const doc = MDocument.fromHTML(html); const chunks = await doc.chunk({ headers: [ ["h1", "Header 1"], ["p", "Paragraph"], ], }); console.log(chunks);





GitHubで例を見る