NL2SQL + 数据报告生成 Agent 工作流

总览

用户问题
  → [1] 意图识别（3个并行子Agent投票）
  → [2] Schema Linking（多候选生成 + 判断选优）
  → [3] SQL生成 + 执行 + 自修复（ReAct，最多3次）
  → [4] 自然语言答案生成
  → [5] Markdown 报告生成

为什么用3个子Agent？ 意图识别是后续所有步骤的基础，单个模型容易偏向字面理解而忽略业务含义。用3个不同"视角"的Agent并行分析，再投票选最优，可以显著提升意图理解的准确率。

做法：

同时启动 3 个子 Agent，给同一个用户问题，但用不同的温度/角度提示：

三个 Agent 各自输出一段意图描述，然后由一个 IntentPicker 综合三份结果，选出最准确的那一个（或融合多个）作为最终意图。

输出： 一段清晰的意图描述，例如：

"用户想统计最近7天各省份的活跃用户数，按省份排名，关注TOP5"

为什么用生成-判断模式？ 一个模型直接做 schema 匹配容易漏掉相关字段或选错表。让多个候选方案竞争，再由判断模型选优，准确率更高。

做法：

输出格式：

["database.table.column", "database.table.column", ...]

例如：

["stats.province_summary.province", "stats.province_summary.active_users", "stats.province_summary.dt"]

核心思路： 先生成，执行后看结果，出错了不要直接重试，而是先用 ReAct 模式探索数据库找到根因，再带着诊断信息重新生成。

流程：

生成 SQL
  → 执行
  → 成功：进入阶段四
  → 失败：
      ReAct 探索（查表结构、跑简单验证SQL、收集错误上下文）
      → 带着探索结果重新生成 SQL
      → 最多重试 3 次，仍失败则报告原因

ReAct 探索阶段可用的动作：

SQL 生成要求：

将 SQL 执行结果转成一段自然语言回答，直接回应用户的原始问题。

基于前面所有阶段的结果，生成结构化 Markdown 报告。

报告结构：

# [报告标题]

## 摘要
[核心发现，2-3句话]

## 数据分析
[分维度解读，数字要有对比上下文]

## 结论与建议
[基于数据的洞察，可操作]

---
## 附录：SQL
\`\`\`sql
[完整 SQL]
\`\`\`

如果需要补充数据，报告生成前可以额外发起 1-2 次补充查询（比如同比数据、基准值），再写入报告。