Get笔记炼金术 — 录音→知识数字资产
💡 一句话说明:你的Get笔记里躺着几十上百条录音,每条都是"数字垃圾"。 这个技能把它们自动变成可搜索、可复用、有隐私保护的知识资产。
快速开始
30秒上手
- 确保已安装 Get笔记App 并开通录音转写
- 配置环境变量:
GETNOTE_API_KEY和GETNOTE_CLIENT_ID(获取方式) - 对 Agent 说:"处理我的录音" — 首次运行会自动创建飞书多维表格
就这么简单。Agent会自动拉取你的录音 → 隐私审查 → 蒸馏知识 → 写入多维表格。
进阶配置(可选)
编辑 config.json 解锁更多能力:
- 🧠 IMA知识库同步(语义搜索,问答时自动召回)
- 📚 飞书知识库同步(团队共享文档)
- 🏷️ 自定义分类体系(适配你的行业)
- 🔒 隐私策略调整(脱敏规则、确认超时)
- ⚙️ 处理参数(批量大小、最短时长过滤)
总览
Get笔记录音 → 隐私审查 → 内容蒸馏 → 分类归档 → 多端沉淀
(输入) (Step 1) (Step 2) (Step 3) (Step 4)
一条录音的完整旅程:
- Get笔记App录音 → 自动转写+AI摘要
- OpenClaw拉取录音笔记详情
- 🔴 隐私审查:扫描敏感信息,标记/脱敏/提醒所有者
- 内容蒸馏:从转写文本中提炼知识点、案例、法规、数据
- 分类归档:按领域自动分类
- 多端沉淀:飞书多维表格(结构化检索)+ 可选IMA知识库 + 可选飞书知识库
Step 1:拉取录音笔记
1.1 扫描新录音
从Get笔记API拉取录音类型笔记,筛选未处理的:
GET https://openapi.biji.com/open/api/v1/resource/note/list?cursor=0
录音类型过滤(note_type):
audio— 即时录音(谈案、电话)meeting— 会议录音class_audio— 课堂录音(培训、讲座)local_audio— 本地音频文件recorder_audio— 录音卡长录recorder_flash_audio— 录音卡闪念
1.2 获取笔记详情
GET https://openapi.biji.com/open/api/v1/resource/note/detail?id={note_id}
关键字段提取:
| 字段路径 | 内容 | 用途 |
|---|---|---|
data.note.title | 标题 | 录音主题 |
data.note.content | AI摘要+正文 | 蒸馏输入 |
data.note.audio.transcript | 完整转写文本 | 蒸馏输入(主要) |
data.note.audio.duration | 时长(秒) | 元数据 |
data.note.tags | 自动标签 | 分类参考 |
data.note.created_at | 创建时间 | 归档时间 |
data.note.note_type | 录音类型 | 场景分类 |
1.3 认证配置
Headers:
Authorization: $GETNOTE_API_KEY
X-Client-ID: $GETNOTE_CLIENT_ID
⚠️ 笔记ID是int64,JavaScript中必须当字符串处理,防止精度丢失。
Step 2:🔴 隐私审查(最关键环节)
铁律:任何录音内容在蒸馏和沉淀之前,必须先过隐私审查。
2.1 敏感信息三级分类
| 级别 | 类型 | 处理方式 |
|---|---|---|
| 🔴 P0-绝对禁止 | 身份证号、银行卡号、密码、当事人真名+案情 | 自动脱敏,不等确认 |
| 🟡 P1-需确认 | 客户名称、具体金额、商业策略、诉讼策略 | 提醒所有者确认后再入库 |
| 🟢 P2-可入库 | 法律条文、公开案例、行业通用数据、操作流程 | 直接入库 |
2.2 审查流程
转写文本
↓
自动扫描 → 识别P0/P1/P2内容
↓
P0内容 → 自动脱敏
P1内容 → 生成「隐私确认清单」→ 通知所有者确认
P2内容 → 直接进入蒸馏环节
↓
所有者确认P1(超时默认脱敏)
↓
生成「隐私审查报告」存档
详细的隐私审查规则、脱敏方法、审查报告模板见 references/privacy-rules.md
Step 3:内容蒸馏
目标:从原始转写文本中提炼出可复用的知识资产,不是存原文。
3.1 蒸馏产出物(7项)
| 产出物 | 说明 |
|---|---|
| 📋 录音概要 | 3-5句话概括核心内容 |
| 🎯 知识要点 | 可复用知识点(3-10条) |
| ⚖️ 法规引用 | 涉及的法律法规条文 |
| 📊 行业数据 | 提到的数据/统计信息 |
| 📁 案例素材 | 可复用的实务经验 |
| 🏷️ 标签 | 自动分类标签 |
| ✅ 待办事项 | 录音中的行动项 |
3.2 蒸馏提示词
详见 references/distill-prompts.md,包含:
- 通用蒸馏提示词(所有录音)
- 谈案专项提炼(客户画像、服务方案、风险点)
- 课堂专项提炼(知识框架、易错点)
- 会议专项提炼(决策、分歧、跟进)
3.3 默认分类体系
| 一级分类 | 二级分类示例 |
|---|---|
| 法律 | 诉讼、合同、知产、劳动 |
| 财税 | 税务筹划、税务争议、财务分析 |
| 金融 | 投融资、并购、跨境 |
| 行业 | 客户管理、AI应用、培训学习 |
可在
config.json中自定义分类体系。
Step 4:多端沉淀
4.1 飞书多维表格(必选,结构化检索)
首次使用时自动创建多维表格,包含以下字段:
| 字段名 | 类型 | 说明 |
|---|---|---|
| 录音标题 | 文本 | Get笔记原标题 |
| 录音日期 | 日期 | 录音创建时间 |
| 录音类型 | 单选 | 谈案/会议/课堂/电话/闪念/本地 |
| 时长(分钟) | 数字 | 录音时长 |
| 一级分类 | 单选 | AI自动分类 |
| 二级分类 | 单选 | AI自动分类 |
| 录音概要 | 文本 | 蒸馏产出 |
| 知识要点 | 文本 | 蒸馏产出 |
| 法规引用 | 文本 | 蒸馏产出 |
| 行业数据 | 文本 | 蒸馏产出 |
| 案例素材 | 文本 | 蒸馏产出 |
| 标签 | 多选 | 自动+手动 |
| 待办事项 | 文本 | 录音中的行动项 |
| 隐私级别 | 单选 | P0已脱敏/P1已确认/P2无敏感/P1待确认 |
| 处理状态 | 单选 | 待处理/已蒸馏/已入库/需确认 |
| Get笔记ID | 文本 | 溯源用 |
| 入库时间 | 日期 | 写入时间 |
详细建表指南见 references/bitable-setup.md
4.2 IMA知识库(可选,语义搜索)
在 config.json 中设置 ima.enabled = true 并填入 kb_id 后启用。
蒸馏后的知识要点会自动创建IMA笔记并添加到指定知识库。
4.3 飞书知识库(可选,团队共享)
在 config.json 中设置 feishu_wiki.enabled = true 并填入 space_id 后启用。
蒸馏后的内容会自动创建飞书文档并挂载到知识库空间。
执行模式
模式A:单条处理
用户:处理一下昨天那条XX录音
→ 拉取指定录音 → 隐私审查 → 蒸馏 → 沉淀
模式B:批量扫描
用户:把Get笔记里的录音都处理一下
→ 拉取全部录音 → 对比已处理列表 → 按batch_size逐批处理
→ 跳过时长<skip_short_duration_seconds的超短录音
模式C:定时自动(cron)
cron触发 → 扫描auto_scan_hours内新录音 → 自动处理
→ P1内容发确认给所有者 → 确认后完成入库
→ 超时按default_p1_action处理
模式D:搜索召回
用户:搜一下之前录音里关于XX的内容
→ 搜索飞书多维表格(结构化)+ IMA知识库(语义)→ 返回结果
模式E:查看统计
用户:我的录音处理了多少了?
→ 读取processed_notes.json → 统计已处理/待处理/各分类占比
已处理记录追踪
追踪文件:processed_notes.json
自动记录每条已处理录音的ID、处理时间、隐私状态、各平台入库状态,防止重复处理。
首次运行引导流程
当检测到 config.json 中 bitable.app_token 为空时,自动执行:
- 询问用户职业(用于优化蒸馏提示词)→ 写入 config.json
- 创建飞书多维表格「Get笔记录音知识台账」+ 全部17个字段
- 写入配置 → app_token/table_id/url 写入 config.json
- 询问可选配置 → IMA知识库?飞书知识库?自定义分类?
- 试跑一条 → 自动选最新一条录音跑全流程,让用户看到效果
环境变量
| 变量 | 说明 | 必需 |
|---|---|---|
GETNOTE_API_KEY | Get笔记API密钥(格式:gk_live_xxx) | ✅ |
GETNOTE_CLIENT_ID | Get笔记客户端ID(格式:cli_xxx) | ✅ |
IMA_OPENAPI_CLIENTID | IMA知识库客户端ID | 可选(启用IMA同步时需要) |
IMA_OPENAPI_APIKEY | IMA知识库API Key | 可选(启用IMA同步时需要) |
飞书的凭证由 OpenClaw 飞书通道统一管理,无需额外配置。
常见问题
Q:Get笔记API Key怎么获取?
访问 biji.com 开发者后台申请。需要Get笔记会员。
Q:没有飞书怎么办?
目前多维表格依赖飞书。未来版本会支持更多平台(Notion、本地CSV等)。
Q:录音转写不准怎么办?
蒸馏环节会自动纠正转写中的常见错别字和专业术语错误。如果原始转写质量太差,蒸馏结果也会标注"转写质量较低,建议人工核实"。
Q:处理一条录音需要多长时间?
取决于录音长度和模型速度,通常30秒-2分钟/条。
Q:已处理的录音可以重新处理吗?
可以。指定录音说"重新处理XX",会覆盖之前的结果。
安全红线
- 🔴 原始转写文本永远不直接入知识库 — 必须经过隐私审查+蒸馏
- 🔴 P0级敏感信息必须自动脱敏 — 不等所有者确认
- 🔴 P1级信息未确认前不入库 — 默认按脱敏处理
- 🔴 隐私审查报告必须存档 — 可追溯、可审计
- 🔴 录音音频文件本身不上传知识库 — 只处理转写文本
- 🔴 Get笔记API凭证不写入任何日志或知识库 — 仅在运行时使用