community-data-process

北汽社群数据导出:数据清洗 → 数据校对 → 数据合并。 从客户群导出文件中筛选温冷一期和试点店标签数据, 校对关键指标一致性,增量合并到 BI_社群数据上传表。 统计日期使用源文件创建时间(下载日期)。 每天 00:55 自动执行。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "community-data-process" with this command: npx skills add yuhui435/community-data-process

北汽社群数据导出

每日社群数据导出 → 清洗 → 校对 → 合并到 BI 系统。

流程概览

1. 数据清洗 → 2. 数据校对 → 3. 数据合并 → 4. 最终验证

使用方式

一键执行全流程

python ~/.openclaw/workspace-pm/skills/community-data-process/run.py

分步执行

# 第 1 步:数据清洗
python ~/.openclaw/workspace-pm/skills/community-data-process/run.py clean

# 第 2 步:数据校对
python ~/.openclaw/workspace-pm/skills/community-data-process/run.py audit

# 第 3 步:数据合并
python ~/.openclaw/workspace-pm/skills/community-data-process/run.py merge

# 第 4 步:最终验证
python ~/.openclaw/workspace-pm/skills/community-data-process/run.py verify

规则

清洗规则

  • 源文件:Downloads 目录下按**创建时间(下载时间)**排序,取最新的 客户群导出*.xlsx
  • 筛选条件:O 列(群标签)= 温冷一期 或 试点店
  • 数字列格式转换:群人数、员工人数、客户人数、今日入群、今日退群、今日消息 → int

校对规则

  • 三方对比:源文件 vs 清理后 vs 合并后
  • 8 个指标全部一致才通过
  • 数据质量:无空值、无负值

合并规则

  • 模式:增量添加(不去重)
  • 列映射:源文件 A-O 列 → 目标文件 E-S 列
  • D 列统计日期 = 源文件的创建时间(下载日期),文件是哪天下载的就填哪天(不是脚本执行日期)
  • A-C 列留空

列映射

源文件目标文件列名
AE群 ID
BF群名称
CG群主
DH群管理员
EI群人数
FJ群活跃
GK群类型
HL员工人数
IM客户人数
JN今日入群
KO今日退群
LP今日消息
MQ入群时间
NR最后发言时间
OS群标签

输出文件

文件说明
客户群导出_清理后_温冷一期 + 试点店_YYYYMMDD.xlsx清洗后数据
BI_社群数据上传_已更新_YYYYMMDD.xlsx合并后最终文件
数据校对报告_YYYYMMDD.txt校对报告

常见问题

Q1: 今日退群数据不一致

检查是否使用了正确的源文件。不同日期导出的文件数据不同。

Q2: 统计日期错误

脚本自动读取源文件的下载日期,不需要手动指定。

Q3: 数字列显示为文本

脚本自动转换 6 个数字列为 int 格式。

依赖

  • Python 3.11+
  • pandas
  • openpyxl

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Ephemeral Media Hosting

自動削除機能付き一時メディアホスティングシステム

Registry SourceRecently Updated
General

Ethereum Read Only

Foundry castを使用したウォレット不要のオンチェーン状態読み取り

Registry SourceRecently Updated
General

OpenClaw Memory

Manage, optimize, and troubleshoot the OpenClaw memory system — MEMORY.md curation, daily logs (memory/YYYY-MM-DD.md), memory_search tuning, compaction survi...

Registry SourceRecently Updated
General

ImageRouter

Generate AI images with any model using ImageRouter API (requires API key).

Registry SourceRecently Updated
2.6K2dawe35