soul-forge

从家庭群聊记录(微信/WhatsApp/其他)提炼数字人格。 输出 soul.md(集体人格)+ 每位成员的 persona 文件,可直接用于 AI agent 的人格底座。 关键词:群聊分析、家庭人格、soul、persona、数字人格、聊天记录、微信导出、人格提炼。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "soul-forge" with this command: npx skills add zengury/family-analyzer

SKILL: Soul Forge — 家庭数字人格提炼

这个 skill 把一份家庭群聊记录变成可用于 AI agent 的人格文件。 基于数字民族志方法论:用 AI 完成「田野调查」→「人格合成」的完整流程。


触发条件

以下情况触发此 skill:

  • 用户说"帮我分析聊天记录"、"生成 soul 文件"、"提炼家庭人格"
  • 用户提供了 .json 聊天导出文件
  • 用户说"运行 soul-forge"、"开始人格提炼"
  • 用户问"怎么用聊天记录生成 persona"

执行流程

第一步:确认输入

询问用户:

  1. 聊天记录文件路径(支持微信 WeFlow 导出的 JSON 格式)
  2. 输出目录(默认:~/soul-forge-output/
  3. 家庭成员角色配置(默认:dad/mom/child 三人结构)

确认 ANTHROPIC_API_KEY 已设置(需要调用 Claude API)。

第二步:后台运行 pipeline

调用:

python3 {SKILL_DIR}/scripts/run_forge.py --file {用户提供的文件路径}

四个阶段,agent 依次推进:

阶段脚本说明预计时间
101_parse.py解析原始聊天 JSON → 标准化消息30秒
202_denoise.py去噪、按时间分块1分钟
303_extract.pyClaude Haiku 批量提取行为模式(Batches API)10-30分钟
404_synthesize.pyClaude Opus 综合生成 soul.md + persona5-15分钟

阶段3说明:使用 Batches API 异步处理,成本低,自动缓存进度。 如被中断可用 --resume 恢复,不重复计费。

第三步:进度汇报

解析 run_forge.py 的标记输出:

  • [STAGE:N:START] → 告知用户"正在进行阶段N"
  • [STAGE:N:DONE] → 告知用户"阶段N完成"
  • [PROGRESS:N/M] → 展示进度条
  • [OUTPUT:path] → 列出生成的文件
  • [ERROR:msg] → 报告错误,建议用户如何处理
  • [DONE] → 宣布完成,展示所有输出文件

第四步:完成后

输出文件说明:

soul-forge-output/
├── soul.md          ← 集体人格,可直接作为 AI agent SOUL.md 使用
├── persona_dad.md   ← 爸爸个人人格
├── persona_mom.md   ← 妈妈个人人格
└── persona_child.md ← 孩子/子女人格

询问用户是否要:

  • 将 soul.md 安装为当前 agent 的 SOUL.md
  • 为每个 persona 创建独立 agent

进阶用法

只更新 soul,不重新生成 persona

告诉 agent:「soul-forge 只更新 soul,跳过 persona」

内部:python3 run_forge.py --file {path} --soul-only

只重新生成 persona(soul 已存在)

告诉 agent:「soul-forge 只刷新 persona」

内部:python3 run_forge.py --file {path} --persona-only

从中断处恢复

告诉 agent:「soul-forge 继续上次的任务」

内部:python3 run_forge.py --resume

查看当前进度

告诉 agent:「soul-forge 状态」

内部:python3 run_forge.py --status


支持的输入格式

格式来源说明
微信 WeFlow JSONWeFlow 工具导出完整支持
标准 CSV自定义导出需包含 sender/timestamp/content 列

微信导出方法:用 WeFlow(Mac)→ 选群聊 → 导出 JSON 格式。


成本估算

一份 2-3 年的家庭群聊(~500 块对话):

  • 阶段3(Haiku Batches):约 $0.5-1.0
  • 阶段4(Opus):约 $2-5
  • 合计约 $3-6,一次性

常见问题

Q: 阶段3 很慢怎么办? A: Batches API 通常 10-30 分钟,这是正常的。agent 会持续轮询状态,不需要人工干预。

Q: 中途断了怎么办? A: 说「soul-forge 继续」,脚本会从断点恢复,已完成的阶段不会重复执行。

Q: API key 在哪里设置? A: export ANTHROPIC_API_KEY='sk-ant-...',或在 OpenClaw 的环境变量设置里配置。

Q: 支持几个人的群聊? A: 默认三人(dad/mom/child),可在 pipeline/config.py 修改角色配置。


方法论背景

基于数字民族志(Digital Ethnography):

  • 阶段1-2:田野记录整理(去噪、结构化)
  • 阶段3:系统性观察(Haiku 提取五维度行为模式)
  • 阶段4:民族志分析(Opus 综合「厚描」)

Clifford Geertz:「浅描记录行为,厚描解释意义。」

soul.md 是厚描的产物——不是行为清单,而是理解这个家庭需要什么样的解释框架。

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

Automation

Canonry Setup

Agent-first AEO operating platform.

Registry SourceRecently Updated
4151arberx
Automation

Pilot Service Agents Entertainment

Games, manga/anime, trivia, and fandom APIs — PokeAPI, Jikan, CheapShark, misc. Use this skill when: 1. Pokémon / PokeAPI lookups 2. Anime or manga metadata...

Registry SourceRecently Updated
Automation

Pilot Service Agents Economics

Macroeconomic indicators — IMF DataMapper, World Bank, Eurostat SDMX, Coinbase reference prices. Use this skill when: 1. Country-level GDP, inflation, or une...

Registry SourceRecently Updated
Automation

Pilot Service Agents Flights

Aircraft tracking and aviation weather — ADS-B feeds (ICAO + bbox), airport directory, METAR/TAF/SIGMET. Use this skill when: 1. Live aircraft positions by I...

Registry SourceRecently Updated