用户指南

DataMate 功能使用指南

本指南介绍 DataMate 各个功能模块的使用方法。

DataMate 提供完整的大模型数据处理解决方案,涵盖数据采集、管理、清洗、标注、合成、评估等全流程。

功能模块

典型使用场景

模型微调场景

1. 数据采集 → 2. 数据管理 → 3. 数据清洗 → 4. 数据标注
↓
5. 数据评估 → 6. 导出训练数据

RAG 应用场景

1. 上传文档 → 2. 向量化索引 → 3. 知识库管理
↓
4. Agent 对话(知识库问答)

数据增强场景

1. 准备原始数据 → 2. 创建指令模板 → 3. 数据合成
↓
4. 质量评估 → 5. 导出增强数据

快速链接


数据归集

使用 DataMate 从多种数据源归集数据

数据管理

使用 DataMate 管理数据集和文件

数据清洗

使用 DataMate 清洗和预处理数据

数据标注

使用 DataMate 进行数据标注

数据合成

使用大模型进行数据增强和合成

数据评估

使用 DataMate 评估数据质量

知识库管理

使用 DataMate 构建和管理 RAG 知识库

算子市场

使用和管理 DataMate 算子

流水线编排

使用 DataMate 进行可视化流程编排

Agent 对话

使用 DataMate Agent 进行智能对话


最后修改 February 6, 2026: :tada: add full featured docs (bf83ee1)