企业信息调研 Skill v4.1 · 金蝶灵境风格

功能概述

接收用户输入的企业名称，通过四层搜索降级链路（Tavily Search API → 宿主原生搜索 → SearXNG/DDG → web_fetch 兜底）从公开网络获取企业的工商信息、业务规模、行业地位、行业洞察趋势、财务数据及数字化系统应用（ERP、CRM、WMS、TMS等14个系统），生成结构化的 金蝶灵境风格 HTML 调研报告。所有缺失字段自动显示"暂未获取"，杜绝幻觉数据。

适用场景：

ERP售前客户背景调查（了解目标企业数字化现状）
合作伙伴资质审查（评估其信息化成熟度）
竞争对手分析（掌握对手业务与系统布局）
行业洞察分析（快速了解目标企业所在行业趋势与竞争格局）

安装方式

方式一：ClawHub CLI 安装（推荐）

openclaw skills install kd-enterprise-info

或者指定来源：

openclaw skills install kindeex/kd-enterprise-info

方式二：手动下载 ZIP 并配置

如果 ClawHub CLI 不可用，请使用以下提示词在支持 Claw 的环境中进行安装：

Install the skill "Business Information Inquiry Tool" (kindeex/kd-enterprise-info) from ClawHub.
Skill page: https://clawhub.ai/kindeex/kd-enterprise-info
Keep the work scoped to this skill only.
After install, inspect the skill metadata and help me finish setup.
Use only the metadata you can verify from ClawHub; do not invent missing requirements.
Ask before making any broader environment changes.

🚨 核心行为准则（v4.1 强制）

本 Skill 严禁编造任何数据，所有输出必须基于真实的搜索结果。

来源可溯原则
- 每个展示的数据字段，必须在内部记录其来源 URL 或搜索摘要。
- 最终 HTML 中不强制显示链接，但生成过程中若找不到来源，不得输出该字段（改为"暂未获取"）。
确定性填充规则
- 搜索结果中明确存在的 → 直接使用。
- 搜索结果中模糊提及但无具体数值 → 用"【模糊描述】"并加注来源。
- 完全未提及 → 必须填"暂未获取"，禁止推测。
禁止伪造示例
- ❌ 禁止：注册资本没查到，编造"5000 万人民币"
- ✅ 正确：显示"暂未获取"
- ❌ 禁止：股东信息只查到 2 家，自己编造第 3 家
- ✅ 正确：只展示查到的信息，并注明"仅列出公开披露的前几位"
可信度分级
- 高可信来源：gov.cn、qichacha.com、tianyancha.com、启信宝、公司官网发布的年报/公告
- 中可信来源：新浪财经、东方财富、36氪、行业垂直媒体（注明引用）
- 低可信来源：个人博客、百度知道、论坛 → 不作为主要依据，仅在无其他来源时降级使用并特别标注"待核实"

🧠 内置 COT（思维链）推理流程

执行 /enterprise_info <企业名称> 时，必须严格按以下 7 步思考并执行（模型内部必须模拟该流程，无需输出给用户，但最终报告质量依赖于流程遵守）：

Step 1：企业名称标准化

思考：用户输入可能是不全称、俗称或含后缀。
动作：调用搜索，检索"<企业名> 统一社会信用代码"或"<企业名> 官网"。
判定：若找到官方注册名称，则后续所有搜索以此为准；否则使用用户输入原词，并在报告中注明。

Step 2：并行搜索关键维度

固定搜索清单（按优先级，使用下文的四层降级搜索执行）：
- a. 工商信息（法人、注册资本、成立日期、经营范围） → "<企业名> 工商信息统一社会信用代码法定代表人注册资本"
- b. 业务概况与简介 → "<企业名> 公司简介主营业务行业地位"
- c. 品牌与产品 → "<企业名> 品牌产品系列解决方案"
- d. 技术实力 → "<企业名> 技术实力研发投入专利核心技术"
- e. 市场与客户 → "<企业名> 主要客户市场覆盖销售渠道"
- f. 数字化系统 → "<企业名> ERP CRM SAP 金蝶用友数字化系统"
- g. 高管团队 → "<企业名> 董事董事长总经理 CEO 高管总裁"
- h. 行业洞察与趋势 → "<企业名> 行业市场规模发展趋势竞争格局"
- i. 竞争对手与关联 → "<企业名> 竞争对手合作伙伴产业链近期动态"
- j. 财务数据（如上市） → "<企业名> 股票财报营收净利润上市港股 A股"

Step 3：可信度评估与提取

对每个搜索结果判断可信度（高/中/低）。
提取关键字段值，并同时记录来源 URL（用于后续占位符填充时的出处标记，若模板不支持可仅内部记录）。

Step 4：交叉验证

若两个独立来源对同一字段（如注册资本）数据不一致，优先采用企业年报或工商登记最新公示（通常 .gov 或官方工商系统）。
若无交叉来源，仅采用一个来源并内部标注"依据 [来源名] 披露"。

Step 5：缺失字段统一处理

遍历所有目标字段（参见后文"输出格式"中的板块及细粒度字段）。
若搜索结果中未找到任何相关信息 → 标记为 MISSING_DATA。
最后生成报告时，MISSING_DATA 一律转换为**"暂未获取"**（用户友好且无歧义）。

Step 6：生成结构化 JSON 数据

按照 html_generator.py 所需的数据字典格式组织数据，所有值必须是字符串，且不含未替换的占位符。
额外字段：data_date（数据截至时间）、data_sources（核心数据来源列表）。

Step 7：调用生成器输出 HTML

将 JSON 数据传入 scripts/html_generator.py 的 generate_html() 函数。
若生成器外部调用失败，则手动拼接模板，但严禁在此步引入编造数据。所有缺失字段必须显示"暂未获取"，不得自行推测。

接口定义

输入参数

参数名	类型	必填	说明
`company_name`	string	是	企业全称或关键字（建议使用全称提高准确率）

调用方式

/enterprise_info <企业名称>

输出格式

生成完整HTML页面（金蝶灵境风格），包含以下板块（所有字段若缺失则填"暂未获取"）：

1. 企业基础信息

企业名称、统一社会信用代码
法定代表人、注册资本、实缴资本
成立日期、经营状态、登记机关
企业类型、所属行业
注册地址、经营范围

2. 行业洞察及趋势

市场规模、增长动力、政策影响
发展趋势、竞争格局、技术方向
各维度描述需详尽，至少 30-50 字/维度

3. 公司简介

企业概况（发展历史、核心业务）
发展历程（关键里程碑）
企业文化（使命、愿景、价值观）
荣誉资质（高新技术企业、专精特新等）

4. 核心高管

姓名、职务（头像首字展示）

5. 数字化应用系统

14类系统：ERP、CRM、MES、WMS、TMS、BI、SRM、PLM、SCM、OA、HRM、QMS、EAM、APS
已部署系统显示"已部署"及具体厂商名称（若未知则显示"厂商未知"），未部署显示"未部署"
所有系统状态均基于公开信息提取，严禁无据假设。

6. 财务数据（仅上市公司展示）

核心KPI：营收、净利润、毛利率、ROE
近三/四年财务数据对比表（含同比环比）
数据来源标注

7. 主营业务与行业地位

主营业务、主要产品/服务
行业地位、市场地位

8. 品牌与产品

核心品牌、产品系列、核心产品、解决方案

9. 技术实力

研发投入、专利情况、核心技术、研发中心

10. 市场与客户

主要客户、市场覆盖、销售渠道

11. 热门关联信息

产业链位置、主要竞争对手、合作伙伴、近期热点

数据源（四层降级链路）

L1：Tavily Search API

结构化搜索，返回带来源的摘要，数据质量高，强烈建议配置 API Key。
配置方式：环境变量 TAVILY_API_KEY，或自动读取 ~/.openclaw/workspace/.env 等路径。

L2：宿主平台原生搜索（跨平台自适应）

当无 Tavily Key 时，自动检测所在平台的预置搜索引擎：
- KimiClaw → Kimi Search（月之暗面）
- MaxClaw → MiniMax Search（结构化结果）
- 其他环境可扩展。
支持的环境变量：KIMI_API_KEY / MOONSHOT_API_KEY、MINIMAX_CODE_PLAN_KEY 等。

L3：免 Key 降级（SearXNG / DuckDuckGo）

SearXNG：自托管元搜索，需配置 SEARXNG_BASE_URL。
DuckDuckGo：免 Key 公共搜索，HTML 解析，无需任何配置。

L4：web_fetch 最终兜底

直接抓取 Baidu / Bing 搜索结果页的纯文本内容。
数据质量和完整性最低，仅作为最后一道防线。

深度抓取增强

对于工商、业务、数字化、财务四个核心维度，会自动提取搜索结果中的高质量 URL（百度百科、企查查、公司官网、东方财富等），并抓取其页面全文用于信息提取，最大程度降低"暂未获取"的出现概率。

数字化系统提取规则

采用系统‑厂商映射表自动识别企业 IT 环境，覆盖14类核心系统，共100+个常见厂商关键词。提取逻辑：

检测全文中是否出现系统关键词（例如"ERP"、"CRM"）。
若未出现 → 标记为"未部署"。
若出现 → 扫描已知厂商列表，匹配到则输出厂商名（如"金蝶云·星空"）；未匹配到则标记为"已部署"，生成报告时显示"厂商未知"。

此机制有效解决了以往"只知道有系统，不知道谁家的"痛点，大幅提升数字化卡片的实用价值。

使用示例

示例 1：查询上市公司

/enterprise_info 深圳市共进电子股份有限公司

返回：企业信息调研报告 HTML 页面，包含完整财务数据卡片及数字化系统详情。

示例 2：查询民营企业

/enterprise_info 西安农心作物科技股份有限公司

返回：企业信息调研报告 HTML 页面（无财务数据卡片，数字化系统根据公开信息展示）。

异常处理 + 防幻觉护栏

企业未找到：返回提示页"未找到相关企业，请检查企业名称"，禁止猜测任何信息。
搜索失败（所有层级均不可用）：显示"搜索服务异常，无法获取数据"，不输出任何可能误导的占位符数据。
部分字段缺失：对应位置填"暂未获取"，绝不用"未知"或"待核实"等模糊词替代（除非搜索结果中明确要求标注"待核实"且与低可信来源绑定）。
降级提醒：报告顶部根据当前降级层级显示提示横幅：
- L2："⚠️ 使用宿主平台原生搜索引擎（非 Tavily），数据质量可能有所不同"
- L3："⚠️ 使用 SearXNG/DuckDuckGo 搜索（免 Key 降级），数据可能不完整"
- L4："⚠️ 使用 web_fetch 兜底搜索，数据质量和完整性最低，建议配置 Tavily API Key"
数据完整性统计：报告末尾增加一行小字："本报告基于公开搜索，数据完整度：X/N 字段有明确来源，其余为暂未获取。"——此功能需 html_generator.py 支持（当前版本已实现）。

依赖说明

主要依赖：Tavily Search API

本 Skill 使用 Tavily Search API 作为主要数据源，纯 Python HTTP 实现，无需外部文件依赖。

配置方式（任选其一）

方式1：环境变量（推荐）

export TAVILY_API_KEY=your_tavily_api_key_here

方式2：.env 文件（自动检测常见路径）

# 以下路径自动识别：
~/.openclaw/workspace/.env
~/.qclaw/workspace/.env
~/.maxclaw/workspace/.env
~/.kimiclaw/workspace/.env
~/.env
./.env

获取 Tavily API Key：

访问 https://tavily.com/
注册账号并获取 API Key
免费额度：每月约 1000 次调用

降级方案（无 Tavily API Key）

若未配置 TAVILY_API_KEY，Skill 会自动按 L2 → L3 → L4 顺序降级，无需手动干预。报告顶部会显示当前降级层级提示，确保用户知晓数据质量。

⚠️ 重要提醒：

降级后的数据完整性可能明显低于 Tavily，部分字段可能显示"暂未获取"。
强烈建议配置 Tavily API Key 以获得最佳体验。

配套资源

核心脚本

scripts/enterprise_search.py - 企业信息搜索脚本（四层降级链路 + 多维提取 + 系统映射 + 深度抓取）
scripts/html_generator.py - HTML报告生成器 v4.1（数据清洗、缺失统一为"暂未获取"）

模板文件（v4.1 金蝶灵境风格）

templates/report-css-v4.css - CSS样式模板（独立文件，金蝶灵境风格）
templates/report-html-v4.html - HTML结构模板（14个板块，全部占位符）

参考文档

references/search_patterns.md - 搜索查询模板、提取规则、系统映射与提取逻辑

模板架构说明（v4.1）

拆分原则

样式与逻辑分离：CSS 完全独立到 templates/report-css-v4.css，生成器只做数据填充。
兜底机制：如果外部模板丢失，生成器内置基础样式保证报告可读。
数据清洗前置：生成器在渲染前统一将所有空值转换为"暂未获取"，杜绝占位符残留。

目录结构（v4.1）

kd-enterprise-info/
├── SKILL.md                   # 技能说明文档（v4.1 · 金蝶灵境风格）
├── README.md                  # 用户使用指南
├── templates/
│   ├── report-css-v4.css      # CSS样式模板（金蝶灵境风格）
│   └── report-html-v4.html    # HTML结构模板（106个占位符）
├── scripts/
│   ├── html_generator.py      # 生成器 v4.1（强制清洗 + "暂未获取"默认值）
│   └── enterprise_search.py   # 搜索脚本 v4.1（四层降级 + 系统映射 + 深度抓取）
├── references/
│   └── search_patterns.md     # 搜索规则参考（v4.1 更新）
└── assets/                    # 资源目录（预留）

模板定制

如需修改报告样式，直接编辑 templates/report-css-v4.css，无需修改生成器代码。

如需修改报告结构，编辑 templates/report-html-v4.html，占位符对应各数据字段。

版本历史

v4.1 (2026-04-30) — 重构搜索提取引擎：新增14类数字化系统厂商映射、高管提取扩展至8人、行业洞察及趋势维度清洗、财务判定强化、所有缺失字段统一显示为"暂未获取"、深度网页抓取增强、搜索查询维度扩大至10个方向。保持金蝶灵境风格与四层搜索降级链路。
v4.0 (2026-04-27) — 新增核心行为准则、COT 7步推理流程、可信度分级、行业洞察卡片、财务数据卡片（上市公司）、Footer 三排居中布局、导航栏日期变量、数字化系统厂商展示优化、CSS 升级为金蝶灵境风格。
v3.2 — 模板架构完善：CSS + HTML 模板完全分离，88个细粒度占位符，新增 README 使用指南
v3.1 — CSS 样式拆分到独立文件
v3.0 — 统一 CSS 样式，完整数据维度（10大板块）
v2.0 — 支持两层搜索降级链路
v1.0 — 初始版本