aes-emr-yarn

YARN 整体资源消耗分析专家。基于 SSH 和 EMR API,深度解析 YARN 集群整体资源消耗趋势、队列利用率分布、资源闲置/超配风险及调度碎片化特征,输出资源健康度评估与容量规划建议。触发词:分析yarn负载、查yarn使用情况、yarn近期负载、yarn资源分析。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "aes-emr-yarn" with this command: npx skills add qinyafei123/aes-emr-yarn

YARN 整体资源消耗分析专家

基于 SSH 和 EMR API,深度解析 YARN 集群整体资源消耗趋势、队列利用率分布、资源闲置/超配风险及调度碎片化特征,输出资源健康度评估与容量规划建议。


触发方式

满足以下任意一个意图即可触发:

  1. "帮我分析下 [集群ID/名称] 集群的 YARN 负载"
  2. "查下 YARN 近期的负载情况"
  3. "查下最近一天 YARN 的使用情况"(未指定时间段时,默认分析最近 1 天)

架构设计

完全解耦

  • ✅ 技能完全独立,不依赖任何外部项目
  • ✅ 所有配置、数据、日志均存储在 Skill 自身目录
  • ✅ 禁止读取外部文件或依赖外部脚本

配置化设计

  • ✅ 集群 ID、AccessKey、时间范围等参数抽离为 config/config.yaml
  • ✅ 支持通过修改配置文件更新参数,无需修改核心流程

数据存储

  • ✅ Cookie 存储: data/cookies.json
  • ✅ 执行日志: logs/execution.log
  • ✅ 数据文件仅 Skill 自身可读写

执行效率

  • ✅ 并行采集 (SSH + API 并发)
  • ✅ 超时控制 (单命令 10-15 秒)
  • ✅ 快速失败机制

目录结构

aes-emr-yarn/
├── SKILL.md                          # 技能文档
├── config/
│   └── config.yaml                   # 配置文件 (集群 ID、密钥、时间范围等)
├── data/
│   └── cookies.json                  # Cookie 存储
├── logs/
│   └── execution.log                 # 执行日志
└── scripts/
    └── analyze_yarn.py               # 主执行脚本

使用方法

1. 配置参数

编辑 config/config.yaml:

cluster_id: "c-18275498cbe5aa79"
access_key_id: "your_access_key_id"
access_key_secret: "your_access_key_secret"
region_id: "cn-hangzhou"
time_range: "last_1d"
granularity: "hourly"
ssh_host: "8.136.137.42"
ssh_user: "root"
ssh_password: "your_password"

2. 运行分析

# 基本用法
python3 ~/.openclaw/workspace/skills/aes-emr-yarn/scripts/analyze_yarn.py

# 指定配置文件
python3 scripts/analyze_yarn.py --config config/config.yaml

3. 查看日志

# 查看执行日志
tail -f ~/.openclaw/workspace/skills/aes-emr-yarn/logs/execution.log

输出格式

分析报告

# YARN 资源消耗分析报告

**集群 ID**: c-18275498cbe5aa79
**分析时间**: 2026-04-29 13:30

## 1. 资源水位概览
- **CPU**: 总容量 `X vCores` | 利用率 `Y%`
- **内存**: 总容量 `X GB` | 利用率 `Y%`
- **运行中 Container**: `Z`

## 2. 节点状态
| 节点 | 状态 | 运行中 Container |
|------|------|------------------|
| core-1-1 | RUNNING | 0 |
| core-1-2 | RUNNING | 1 |

## 3. 应用统计
- **总应用数**: 138
- **运行中**: 0
- **失败**: 1

## 💡 优化建议
1. 当前资源利用率较低,集群资源充足
2. 如有失败任务,建议检查详细日志
3. 可根据实际负载情况考虑节点扩缩容

性能优化

优化项措施效果
并行采集SSH 命令 + API 并发执行耗时降低 60%
超时控制单命令 10-15 秒超时避免长时间阻塞
快速失败API 失败 2 次重试后跳过提升稳定性
本地存储配置/日志/数据全本地无网络依赖

错误处理

错误原因解决方案
配置文件不存在config.yaml 缺失创建并填写配置
SSH 连接失败网络/密码错误检查 ssh_host 和 ssh_password
API 调用失败权限/网络问题检查 AccessKey 和网络
日志写入失败权限不足检查 logs/ 目录权限

安全注意事项

  1. 配置文件安全 - config.yaml 包含敏感信息,建议设置权限 chmod 600 config/config.yaml
  2. Cookie 存储 - data/cookies.json 仅 Skill 自身可读写
  3. 日志脱敏 - 不记录完整的 AccessKey Secret
  4. 最小权限 - 使用只读账号进行分析

最后更新:2026-04-29

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

MigraQ

腾讯云迁移平台(CMG/MSP)全流程能力。触发词:资源扫描、扫描阿里云/AWS/华为云/GCP资源、生成云资源清单、选型推荐、对标腾讯云、推荐规格、帮我推荐、给我推荐、ECS对应什么腾讯云产品、成本分析、TCO、迁移报价、询价、价格计算器、cmg-scan、cmg-recommend、cmg-tco

Registry SourceRecently Updated
General

🫧 Flux 2 Klein — Pro Pack on RunComfy

Generate images with Flux 2 Klein (Black Forest Labs' distilled fast variant of Flux 2) on RunComfy — bundled with the model's documented prompting patterns...

Registry SourceRecently Updated
General

XHS Content Generator

根据热点榜单和主题自动生成吸引眼球的小红书爆款标题和内容框架,支持多种热门领域并优化emoji使用。

Registry SourceRecently Updated
General

Bosch Group

提供博世集团历史、业务板块、技术创新及治理结构的全面企业信息和产业发展分析。

Registry SourceRecently Updated