bosszp

BOSS直聘岗位数据爬虫 + 可视化分析工具。使用 Scrapy 爬取职位数据，存入 MySQL，用 Flask + Highcharts 生成可视化报告。当用户需要批量采集 BOSS直聘职位数据、分析薪资分布、公司分布、岗位要求，或需要生成可视化报告时触发。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "bosszp" with this command: npx skills add aitowerofbabel-lang/bosszp

BOSS直聘数据爬虫分析 (bosszp)

环境要求

Python 3.x
MySQL
Scrapy
Pandas + SQLAlchemy
Flask + Highcharts

安装依赖

pip install scrapy
pip install flask pandas sqlalchemy pymysql
pip install flash

数据采集

1. 创建 Scrapy 项目

scrapy startproject bosszp
cd bosszp
scrapy genspider boss zhipin.com

2. 配置 Cookie 和请求头

编辑 settings.py：

COOKIES_ENABLED = True
USER_AGENTS = [
    'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36...',
    ...
]

# 爬取延迟（避免被封）
DOWNLOAD_DELAY = 2

3. 运行爬虫

scrapy crawl boss -o output.csv

数据导出

CSV 格式

岗位名称,岗位地区,薪资,公司名称,公司类型,公司规模,融资阶段,工作年限,学历,福利标签

导入 MySQL

python clean_data.py   # 数据清洗 + 导入 MySQL

可视化看板

cd web
export FLASK_APP=run.py
flask run
# 访问 http://127.0.0.1:8080/

看板包含：

饼图: 公司融资阶段分布
柱状图: 薪资分布 Top10
词云: 岗位福利标签词云
表格: 公司排名 Top10（按岗位数量）

字段说明

字段	说明
job_name	岗位名称
job_area	工作地区
job_salary	薪资范围
com_name	公司名称
com_type	公司类型（国企/民营等）
com_size	公司规模
finance_stage	融资阶段
work_year	工作年限要求
education	学历要求
job_benefits	福利标签

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Open Registry Record Open in ClawHub

Related Skills

Related by shared tags or category signals.

General

Gigo Lobster Resume

🦞 GIGO · gigo-lobster-resume: 续跑入口：v2 stable 当前会清理旧 checkpoint 并从头重跑；保留此 slug 作为旧 checkpoint 兼容入口。 Triggers: 继续试吃 / 恢复评测 / resume tasting / continue lobster...

Registry SourceRecently Updated

3160gigolab

General

YiHui CONTEXT MODE

context-mode is an MCP server that saves 98% of your context window by sandboxing tool outputs. It routes large file reads, shell outputs, and web fetches th...

Registry SourceRecently Updated

001yihui

General

xinyi-drink

Use when users ask about 新一好喝/新一咖啡 drinks, stores, menu, activities, Skill用户大礼包, today drink recommendations, afternoon tea, feeling sleepy, or personalized...

Registry SourceRecently Updated

2710domilin

General

vedic-destiny

吠陀命盘分析中文入口。用于完整命盘研判、命主盘 Rashi chart 与九分盘 Navamsha chart 联读、既往事件回看、出生时间稳定度判断、事业主题、婚姻主题、时空盘专题，以及基于 Jagannatha Hora PDF、星盘截图或文本命盘数据的系统拆盘。当用户提到完整星盘、事业方向、婚姻问题、关系窗...

Registry SourceRecently Updated

00seanding1998

bosszp

Safety Notice

Copy this and send it to your AI assistant to learn

BOSS直聘 数据爬虫分析 (bosszp)

环境要求

安装依赖

数据采集

1. 创建 Scrapy 项目

2. 配置 Cookie 和请求头

3. 运行爬虫

数据导出

CSV 格式

导入 MySQL

可视化看板

字段说明

Source Transparency

Related Skills

Gigo Lobster Resume

YiHui CONTEXT MODE

xinyi-drink

vedic-destiny

BOSS直聘数据爬虫分析 (bosszp)