文本提取节点

节点说明

文本提取节点用于从非结构化文本中提取结构化字段,常用于获取关键信息如时间、地点、金额等,适合处理自然语言输入并转为可编程字段。

节点配置

文本提取节点包含五个模块:输入、提取变量、大模型、历史记录、输出。

1. 输入模块

文本提取的输入可以:

  • 引用前置节点的字段(如用户输入、识别结果等);
  • 或直接手动输入一段需要提取的文本内容。

字段示例:

字段名 字段值
需要提取的文本 引用:开始 > Question

2. 提取变量模块

在此模块中你需要配置要提取的字段:

  • 可通过”从工具导入”导入字段结构;
  • 或手动添加变量名、变量类型与变量描述。
配置项 说明
变量名 输出结构中字段的名称
变量类型 字段的数据类型,如 String、Integer、Boolean 等
描述 描述该变量的含义,若大模型模块中未填写提示词,则以此描述为提取依据

3. 大模型模块

用于配置大语言模型参数,指导模型完成文本提取任务。

配置项 说明
模型 选择用于提取的大语言模型,如 Qwen 系列
温度 控制结果随机性,值越小越稳定,默认 0.3
提取提示词 可填写用于指导模型提取逻辑的提示语,增强模型理解准确性

4. 历史记录模块

开启后可引入历史上下文,有助于提升模型在多轮对话中的提取准确性。

配置项 说明
使用方式 按对话轮数 或 Token 数量进行配置
对话配置 可设置对话轮数(如 1~3)或 Token 数量(如 200)

5. 输出模块

输出字段为 output,其结构如下:

{
  "output": {
    "extractedParams": {
      "time": "提取出的值(如时间)"
    },
    "success": true
  }
}
  • extractedParams:模型提取出的结构化字段,字段名与变量模块一致。
  • success:布尔值,表示本次提取是否成功。