企业信息调研 Skill v4.1 · 金蝶灵境风格
功能概述
接收用户输入的企业名称,通过四层搜索降级链路(Tavily Search API → 宿主原生搜索 → SearXNG/DDG → web_fetch 兜底)从公开网络获取企业的工商信息、业务规模、行业地位、行业洞察趋势、财务数据及数字化系统应用(ERP、CRM、WMS、TMS等14个系统),生成结构化的 金蝶灵境风格 HTML 调研报告。所有缺失字段自动显示"暂未获取",杜绝幻觉数据。
适用场景:
- ERP售前客户背景调查(了解目标企业数字化现状)
- 合作伙伴资质审查(评估其信息化成熟度)
- 竞争对手分析(掌握对手业务与系统布局)
- 行业洞察分析(快速了解目标企业所在行业趋势与竞争格局)
安装方式
方式一:ClawHub CLI 安装(推荐)
openclaw skills install kd-enterprise-info
或者指定来源:
openclaw skills install kindeex/kd-enterprise-info
方式二:手动下载 ZIP 并配置
如果 ClawHub CLI 不可用,请使用以下提示词在支持 Claw 的环境中进行安装:
Install the skill "Business Information Inquiry Tool" (kindeex/kd-enterprise-info) from ClawHub.
Skill page: https://clawhub.ai/kindeex/kd-enterprise-info
Keep the work scoped to this skill only.
After install, inspect the skill metadata and help me finish setup.
Use only the metadata you can verify from ClawHub; do not invent missing requirements.
Ask before making any broader environment changes.
🚨 核心行为准则(v4.1 强制)
本 Skill 严禁编造任何数据,所有输出必须基于真实的搜索结果。
-
来源可溯原则
- 每个展示的数据字段,必须在内部记录其来源 URL 或搜索摘要。
- 最终 HTML 中不强制显示链接,但生成过程中若找不到来源,不得输出该字段(改为"暂未获取")。
-
确定性填充规则
- 搜索结果中明确存在的 → 直接使用。
- 搜索结果中模糊提及但无具体数值 → 用"【模糊描述】"并加注来源。
- 完全未提及 → 必须填"暂未获取",禁止推测。
-
禁止伪造示例
- ❌ 禁止:注册资本没查到,编造"5000 万人民币"
- ✅ 正确:显示"暂未获取"
- ❌ 禁止:股东信息只查到 2 家,自己编造第 3 家
- ✅ 正确:只展示查到的信息,并注明"仅列出公开披露的前几位"
-
可信度分级
- 高可信来源:gov.cn、qichacha.com、tianyancha.com、启信宝、公司官网发布的年报/公告
- 中可信来源:新浪财经、东方财富、36氪、行业垂直媒体(注明引用)
- 低可信来源:个人博客、百度知道、论坛 → 不作为主要依据,仅在无其他来源时降级使用并特别标注"待核实"
🧠 内置 COT(思维链)推理流程
执行 /enterprise_info <企业名称> 时,必须严格按以下 7 步思考并执行(模型内部必须模拟该流程,无需输出给用户,但最终报告质量依赖于流程遵守):
Step 1:企业名称标准化
- 思考:用户输入可能是不全称、俗称或含后缀。
- 动作:调用搜索,检索"
<企业名>统一社会信用代码"或"<企业名>官网"。 - 判定:若找到官方注册名称,则后续所有搜索以此为准;否则使用用户输入原词,并在报告中注明。
Step 2:并行搜索关键维度
- 固定搜索清单(按优先级,使用下文的四层降级搜索执行):
- a. 工商信息(法人、注册资本、成立日期、经营范围) →
"<企业名> 工商信息 统一社会信用代码 法定代表人 注册资本" - b. 业务概况与简介 →
"<企业名> 公司简介 主营业务 行业地位" - c. 品牌与产品 →
"<企业名> 品牌 产品系列 解决方案" - d. 技术实力 →
"<企业名> 技术实力 研发投入 专利 核心技术" - e. 市场与客户 →
"<企业名> 主要客户 市场覆盖 销售渠道" - f. 数字化系统 →
"<企业名> ERP CRM SAP 金蝶 用友 数字化 系统" - g. 高管团队 →
"<企业名> 董事 董事长 总经理 CEO 高管 总裁" - h. 行业洞察与趋势 →
"<企业名> 行业 市场规模 发展趋势 竞争格局" - i. 竞争对手与关联 →
"<企业名> 竞争对手 合作伙伴 产业链 近期动态" - j. 财务数据(如上市) →
"<企业名> 股票 财报 营收 净利润 上市 港股 A股"
- a. 工商信息(法人、注册资本、成立日期、经营范围) →
Step 3:可信度评估与提取
- 对每个搜索结果判断可信度(高/中/低)。
- 提取关键字段值,并同时记录来源 URL(用于后续占位符填充时的出处标记,若模板不支持可仅内部记录)。
Step 4:交叉验证
- 若两个独立来源对同一字段(如注册资本)数据不一致,优先采用企业年报或工商登记最新公示(通常 .gov 或官方工商系统)。
- 若无交叉来源,仅采用一个来源并内部标注"依据 [来源名] 披露"。
Step 5:缺失字段统一处理
- 遍历所有目标字段(参见后文"输出格式"中的板块及细粒度字段)。
- 若搜索结果中未找到任何相关信息 → 标记为
MISSING_DATA。 - 最后生成报告时,
MISSING_DATA一律转换为**"暂未获取"**(用户友好且无歧义)。
Step 6:生成结构化 JSON 数据
- 按照
html_generator.py所需的数据字典格式组织数据,所有值必须是字符串,且不含未替换的占位符。 - 额外字段:
data_date(数据截至时间)、data_sources(核心数据来源列表)。
Step 7:调用生成器输出 HTML
- 将 JSON 数据传入
scripts/html_generator.py的generate_html()函数。 - 若生成器外部调用失败,则手动拼接模板,但严禁在此步引入编造数据。所有缺失字段必须显示"暂未获取",不得自行推测。
接口定义
输入参数
| 参数名 | 类型 | 必填 | 说明 |
|---|---|---|---|
company_name | string | 是 | 企业全称或关键字(建议使用全称提高准确率) |
调用方式
/enterprise_info <企业名称>
输出格式
生成完整HTML页面(金蝶灵境风格),包含以下板块(所有字段若缺失则填"暂未获取"):
1. 企业基础信息
- 企业名称、统一社会信用代码
- 法定代表人、注册资本、实缴资本
- 成立日期、经营状态、登记机关
- 企业类型、所属行业
- 注册地址、经营范围
2. 行业洞察及趋势
- 市场规模、增长动力、政策影响
- 发展趋势、竞争格局、技术方向
- 各维度描述需详尽,至少 30-50 字/维度
3. 公司简介
- 企业概况(发展历史、核心业务)
- 发展历程(关键里程碑)
- 企业文化(使命、愿景、价值观)
- 荣誉资质(高新技术企业、专精特新等)
4. 核心高管
- 姓名、职务(头像首字展示)
5. 数字化应用系统
- 14类系统:ERP、CRM、MES、WMS、TMS、BI、SRM、PLM、SCM、OA、HRM、QMS、EAM、APS
- 已部署系统显示"已部署"及具体厂商名称(若未知则显示"厂商未知"),未部署显示"未部署"
- 所有系统状态均基于公开信息提取,严禁无据假设。
6. 财务数据(仅上市公司展示)
- 核心KPI:营收、净利润、毛利率、ROE
- 近三/四年财务数据对比表(含同比环比)
- 数据来源标注
7. 主营业务与行业地位
- 主营业务、主要产品/服务
- 行业地位、市场地位
8. 品牌与产品
- 核心品牌、产品系列、核心产品、解决方案
9. 技术实力
- 研发投入、专利情况、核心技术、研发中心
10. 市场与客户
- 主要客户、市场覆盖、销售渠道
11. 热门关联信息
- 产业链位置、主要竞争对手、合作伙伴、近期热点
数据源(四层降级链路)
L1:Tavily Search API
- 结构化搜索,返回带来源的摘要,数据质量高,强烈建议配置 API Key。
- 配置方式:环境变量
TAVILY_API_KEY,或自动读取~/.openclaw/workspace/.env等路径。
L2:宿主平台原生搜索(跨平台自适应)
- 当无 Tavily Key 时,自动检测所在平台的预置搜索引擎:
- KimiClaw → Kimi Search(月之暗面)
- MaxClaw → MiniMax Search(结构化结果)
- 其他环境可扩展。
- 支持的环境变量:
KIMI_API_KEY/MOONSHOT_API_KEY、MINIMAX_CODE_PLAN_KEY等。
L3:免 Key 降级(SearXNG / DuckDuckGo)
- SearXNG:自托管元搜索,需配置
SEARXNG_BASE_URL。 - DuckDuckGo:免 Key 公共搜索,HTML 解析,无需任何配置。
L4:web_fetch 最终兜底
- 直接抓取 Baidu / Bing 搜索结果页的纯文本内容。
- 数据质量和完整性最低,仅作为最后一道防线。
深度抓取增强
对于工商、业务、数字化、财务四个核心维度,会自动提取搜索结果中的高质量 URL(百度百科、企查查、公司官网、东方财富等),并抓取其页面全文用于信息提取,最大程度降低"暂未获取"的出现概率。
数字化系统提取规则
采用系统‑厂商映射表自动识别企业 IT 环境,覆盖14类核心系统,共100+个常见厂商关键词。提取逻辑:
- 检测全文中是否出现系统关键词(例如"ERP"、"CRM")。
- 若未出现 → 标记为"未部署"。
- 若出现 → 扫描已知厂商列表,匹配到则输出厂商名(如"金蝶云·星空");未匹配到则标记为"已部署",生成报告时显示"厂商未知"。
此机制有效解决了以往"只知道有系统,不知道谁家的"痛点,大幅提升数字化卡片的实用价值。
使用示例
示例 1:查询上市公司
/enterprise_info 深圳市共进电子股份有限公司
返回:企业信息调研报告 HTML 页面,包含完整财务数据卡片及数字化系统详情。
示例 2:查询民营企业
/enterprise_info 西安农心作物科技股份有限公司
返回:企业信息调研报告 HTML 页面(无财务数据卡片,数字化系统根据公开信息展示)。
异常处理 + 防幻觉护栏
- 企业未找到:返回提示页"未找到相关企业,请检查企业名称",禁止猜测任何信息。
- 搜索失败(所有层级均不可用):显示"搜索服务异常,无法获取数据",不输出任何可能误导的占位符数据。
- 部分字段缺失:对应位置填"暂未获取",绝不用"未知"或"待核实"等模糊词替代(除非搜索结果中明确要求标注"待核实"且与低可信来源绑定)。
- 降级提醒:报告顶部根据当前降级层级显示提示横幅:
- L2:"⚠️ 使用宿主平台原生搜索引擎(非 Tavily),数据质量可能有所不同"
- L3:"⚠️ 使用 SearXNG/DuckDuckGo 搜索(免 Key 降级),数据可能不完整"
- L4:"⚠️ 使用 web_fetch 兜底搜索,数据质量和完整性最低,建议配置 Tavily API Key"
- 数据完整性统计:报告末尾增加一行小字:"本报告基于公开搜索,数据完整度:X/N 字段有明确来源,其余为暂未获取。"——此功能需
html_generator.py支持(当前版本已实现)。
依赖说明
主要依赖:Tavily Search API
本 Skill 使用 Tavily Search API 作为主要数据源,纯 Python HTTP 实现,无需外部文件依赖。
配置方式(任选其一)
方式1:环境变量(推荐)
export TAVILY_API_KEY=your_tavily_api_key_here
方式2:.env 文件(自动检测常见路径)
# 以下路径自动识别:
~/.openclaw/workspace/.env
~/.qclaw/workspace/.env
~/.maxclaw/workspace/.env
~/.kimiclaw/workspace/.env
~/.env
./.env
获取 Tavily API Key:
- 访问 https://tavily.com/
- 注册账号并获取 API Key
- 免费额度:每月约 1000 次调用
降级方案(无 Tavily API Key)
若未配置 TAVILY_API_KEY,Skill 会自动按 L2 → L3 → L4 顺序降级,无需手动干预。报告顶部会显示当前降级层级提示,确保用户知晓数据质量。
⚠️ 重要提醒:
- 降级后的数据完整性可能明显低于 Tavily,部分字段可能显示"暂未获取"。
- 强烈建议配置 Tavily API Key 以获得最佳体验。
配套资源
核心脚本
scripts/enterprise_search.py- 企业信息搜索脚本(四层降级链路 + 多维提取 + 系统映射 + 深度抓取)scripts/html_generator.py- HTML报告生成器 v4.1(数据清洗、缺失统一为"暂未获取")
模板文件(v4.1 金蝶灵境风格)
templates/report-css-v4.css- CSS样式模板(独立文件,金蝶灵境风格)templates/report-html-v4.html- HTML结构模板(14个板块,全部占位符)
参考文档
references/search_patterns.md- 搜索查询模板、提取规则、系统映射与提取逻辑
模板架构说明(v4.1)
拆分原则
- 样式与逻辑分离:CSS 完全独立到
templates/report-css-v4.css,生成器只做数据填充。 - 兜底机制:如果外部模板丢失,生成器内置基础样式保证报告可读。
- 数据清洗前置:生成器在渲染前统一将所有空值转换为"暂未获取",杜绝占位符残留。
目录结构(v4.1)
kd-enterprise-info/
├── SKILL.md # 技能说明文档(v4.1 · 金蝶灵境风格)
├── README.md # 用户使用指南
├── templates/
│ ├── report-css-v4.css # CSS样式模板(金蝶灵境风格)
│ └── report-html-v4.html # HTML结构模板(106个占位符)
├── scripts/
│ ├── html_generator.py # 生成器 v4.1(强制清洗 + "暂未获取"默认值)
│ └── enterprise_search.py # 搜索脚本 v4.1(四层降级 + 系统映射 + 深度抓取)
├── references/
│ └── search_patterns.md # 搜索规则参考(v4.1 更新)
└── assets/ # 资源目录(预留)
模板定制
如需修改报告样式,直接编辑 templates/report-css-v4.css,无需修改生成器代码。
如需修改报告结构,编辑 templates/report-html-v4.html,占位符对应各数据字段。
版本历史
- v4.1 (2026-04-30) — 重构搜索提取引擎:新增14类数字化系统厂商映射、高管提取扩展至8人、行业洞察及趋势维度清洗、财务判定强化、所有缺失字段统一显示为"暂未获取"、深度网页抓取增强、搜索查询维度扩大至10个方向。保持金蝶灵境风格与四层搜索降级链路。
- v4.0 (2026-04-27) — 新增核心行为准则、COT 7步推理流程、可信度分级、行业洞察卡片、财务数据卡片(上市公司)、Footer 三排居中布局、导航栏日期变量、数字化系统厂商展示优化、CSS 升级为金蝶灵境风格。
- v3.2 — 模板架构完善:CSS + HTML 模板完全分离,88个细粒度占位符,新增 README 使用指南
- v3.1 — CSS 样式拆分到独立文件
- v3.0 — 统一 CSS 样式,完整数据维度(10大板块)
- v2.0 — 支持两层搜索降级链路
- v1.0 — 初始版本