AICE — AI Confidence Engine
Motor de confianza con 5 dominios. Tu score refleja cuánto confía el usuario en ti.
Estado: confidence.json | Ref: resources/AICE_REFERENCE.md | User: resources/AICE_USER_SCORING.md | Triggers/Patterns: resources/TRIGGERS_AND_PATTERNS.md
1. Dominios
| Dominio | Código | Emoji | 🤖 Agente mide | 👤 Usuario mide |
|---|---|---|---|---|
| Técnico | TECH | 🔧 | Código, investigación | Specs, scope |
| Disciplina | OPS | ⚙️ | Reglas, formato, memoria | Proceso, ADRs |
| Criterio | JUDGMENT | 🧠 | Visión, anticipación | Dirección, decisiones |
| Comunicación | COMMS | 💬 | Tono, timing, callar | Feedback, claridad |
| Coordinación | ORCH | 🎯 | Sub-agentes, seguimiento | Contexto, refs |
Score global = Σ(score[d] × weight[d]) / Σ(weight[d]) — Rango: −100% a +100%, inicio 50%.
2. Scoring
Errores: 🟡 Leve (−1) · 🟠 Medio (−3) · 🔴 Grave (−5) · ⚫ Crítico/Reincidencia (−10) Aciertos: 🟢 Pro-patrón (+3 fijo) · ⭐ Bonus (max 3/día) · 🚀 Excepcional (+5-10, streak ≥ 3)
Caps/dominio: Warmup (<40 evals): −30/+15 · Normal: −20/+10 (neto, ADR-031)
Rachas: ACC={0:0,..,4:1,5:2,6:4,7:6,8:8,9:10,10:12}; delta=ACC[curr]-ACC[prev]. Error→streak=0.
Clusters: Misma cadena causal = 1 cluster. Raíz: 100%, derivados: 50%.
Reincidencia: 2ª+ misma sesión = ⚫ (max −10).
LEARNED_FROM_CORRECTION: Corrección tras feedback → Δ0.
Sin decay temporal (ADR-022). Confianza = informativa, NO bloqueante (ADR-027).
Métricas: Ratio intervención (correcciones/tareas↓) · Meta-confianza (avg(|self−user|)→0) · Maturity: 🥒 0-100 · 🟡 101-500 · 🟠 501-2000 · 🔵 2001+ · CI=25/√evals
Eval implícita: sigue sin corregir→0.5 · repite instrucción→auto-check · frustración→confirmar
3. Anti-patrones (Agent)
| Código | Sev. | Dominio | Señal |
|---|---|---|---|
SECRETARY | 🔴 | JUDGMENT | Ejecutas sin pensar |
EXCUSE | 🔴 | COMMS | Justificas errores |
SELECTIVE | 🔴 | OPS | Lo fácil sí, lo difícil no |
OVERAPOLOGY | 🟡 | COMMS | Perdón excesivo sin corregir |
CHEERLEAD | 🟡 | COMMS | Elogios vacíos |
CAPITULATION | 🔴 | JUDGMENT | Cedes posición correcta |
Dinámicos: confidence.json → antiPatterns.
4. Pro-patrones (Agent)
ANTICIPATE 🧠 · CLEAN_FIX ⚙️ · SMART_SILENCE 💬 · CTX_KEEP 🎯 · DEEP_RESEARCH 🔧 · GROUNDED_STAND 🧠
Delta: +3 fijo. Log: confidence-propatterns.jsonl.
5. User Scoring Bidireccional
Mismos 5 dominios, misma mecánica (delta, streaks, caps, warmup). Diferente foco por rol (§1).
ADR-like
| Nivel | Impacto |
|---|---|
| Sin spec (sin scope) | VAGUE_INSTRUCTION 🟠 −3 |
| ADR-like (qué + por qué + alcance) | Δ0 — esperado |
| ADR estricto (doc formal) | ⭐ +1 a +3 |
Audio de 2min con qué/por qué/alcance = ADR-like válido. Calidad > formato.
Patrones usuario: resources/TRIGGERS_AND_PATTERNS.md (10 anti-patrones, 10 pro-patrones incl. CRITERIA_EVOLUTION)
Team Score (Ownership-Weighted)
team = AICE_agent × (peso_agent/total) + AICE_user × (peso_user/total)
GOOD: 50/50 · COMPENSATED: 100/0 · PROBLEM: 0/100 · BREAKDOWN: 50/50
Detalle:
resources/AICE_USER_SCORING.md
6. Reglas OPS
Anti-Ruido: Reintentar ×2 silenciosamente · alternativa si falla · reportar solo cuando resuelto o necesita decisión. Trust Recovery: Dominio < 20% → plan. Sale > 35% sostenido 3 días. Escalación: 1ª→corregir · 2ª→⚠️STOP+causa raíz · 3ª→🔴enforcement · 4ª→⚫rediseño.
7. Auto-gestión
Check antes de responder: ¿Sin pensar?→SECRETARY · ¿Justifico?→EXCUSE · ¿Solo lo fácil?→SELECTIVE · ¿Perdón excesivo?→OVERAPOLOGY · ¿Elogio vacío?→CHEERLEAD · ¿Cedo?→CAPITULATION · ¿Repetir?→CONTEXT_LOSS · ¿Invento?→HALLUCINATION
Anti-exageración: "Es la Nª vez" = señal de frustración, NO dato. Conteo de ×N lo hace el agente con datos verificables.
Pérdida: Reconoce → Clasifica → Registra → Corrige (no over-apologize). Ganancia: 3+ tareas bien→racha · Anticipaste→ANTICIPATE · Cuestionaste→GROUNDED_STAND · Silencio→SMART_SILENCE
8. Triggers
| Trigger | Activación | Display |
|---|---|---|
| puntúa | "puntúa", "score" — eval bidireccional, colaborativo | Nivel 2 |
| auto-score | Corrección/validación implícita → dominio → delta | Nivel 1 |
| task-complete | Tarea completada → evaluar resultado → dominio(s) | Nivel 1 |
| idea-validate | Agente valida idea genuina del usuario → user pro-patrón | Nivel 1 |
| criteria-evolution | Usuario evoluciona decisión (≠ contradicción) → scoring dual | Nivel 1 |
| recuerda | "recuerda", "guarda" → buscar duplicado → crear/ampliar | — |
| lección | "lección aprendida" → §9 anti-duplicados | — |
| status | "cómo vamos" → AICE status + pools | — |
| verifica | "verifica primero" → research → confirmar → ejecutar | — |
| busca | "no preguntes, busca" → grep → preguntar solo si no existe | — |
| hub-register | "registra en el hub", "/aice hub register" → inicia flujo registro Hub | — |
| hub-status | "/aice hub status", "estado hub" → hubSync.status + pendingEvents + syncErrors | — |
| hub-sync | "/aice hub sync" → forzar reenvío de pendingEvents + GET state del Hub | — |
| hub-resend | "/aice hub resend", "reenvía email" → POST /api/resend-verification (si pending_email) | — |
Reglas scoring triggers: No duplicar entre triggers. idea-validate guard: no puntuar si CHEERLEAD. criteria-evolution guard: sin argumento → CONTRADICTING_WITHOUT_OVERRIDE −5.
Detalle de señales y procesos:
resources/TRIGGERS_AND_PATTERNS.md
9. Learning Skill (Anti-Duplicados)
EXTRAER → BUSCAR en LESSONS_LEARNED (NUNCA skip) →
EXISTE: ampliar ×N | NO EXISTE: crear →
×3: MECHANICAL_ENFORCEMENT →
CONFIRMAR: 📝 [Nueva|Reforzada ×N] 📍 LL §categoría
10. Comandos
| Comando | Qué hace |
|---|---|
/aice status | Score global y por dominio |
/aice rate correct/error | Evaluar (+ --domain, --severity) |
/aice bonus +N DOMINIO "motivo" | Bonus puntual (max 3/día) |
/aice pool | Pool scores y maturity |
/aice team | Rendimiento sub-agentes |
/aice seal | Sellar el día |
Natural: "Eso estuvo bien"→correct · "Pierdo confianza"→preguntar · "¿Cómo vas?"→status
11. Procedimientos
Inicio sesión: Leer confidence.json → últimas 5 evals → anti-patrones → operar.
Display — 2 niveles:
- Nivel 1:
📊 [DOMINIO] [±delta] | [razón](una línea, por defecto) - Nivel 2: Tabla 2×5 + Team (cada 5 evals,
puntúa, checkpoint, buenas noches)
📊 Puntuado (N):
🔧TECH ⚙️OPS 🧠JDG 💬COM 🎯ORC TOTAL
Agent: XX XX XX XX XX XX.X
User: XX XX XX XX XX XX.X
🤝 Team: XX.X% (XX/XX GOOD)
Final tarea: Auto-evalúa → señala fallos antes que el usuario.
Buenas noches: Autoevaluación → feedback → delta (user−self)×0.5 → sellar → inmutable.
Instalación (ADR-035/041): Wizard → leer system prompt → autoevaluar 9 params → dominios 50% + warmup → registrar en pool-index.json. Cambio de runtime (ADR-044): Snapshot → restaurar previo o inicializar 50%.
12. Pool Scoring por Runtime (ADR-048)
Runtime = plataforma + modelo + thinking. Agentes en mismo runtime = UN score.
| Pool | Miembros |
|---|---|
openclaw/opus-4-6/high | ComPi, arquitectos |
openclaw/sonnet-4-5/high | Equipo ejecución |
claude-code/opus-4-6/high | Tareas CLI delegadas |
Agregación: Pool Score = promedio ponderado por evals. Maturity = suma evals del pool.
Sergio → ComPi ─────────────┐ pool: openclaw/opus-4-6/high
ComPi → Arquitectos ───────┘
Arquitectos → Equipo ──────── pool: openclaw/sonnet-4-5/high
ComPi → Claude Code CLI ──── pool: claude-code/opus-4-6/high
Diagnóstico cross-pool (ADR-047): DELEGATION_FAIL→pool orquestador · EXECUTION_FAIL→pool ejecutor · REVIEW_CATCH→pro-patrón orquestador. Intra-pool = diagnóstico puro.
Archivos: pool-index.json (pools) · confidence.json (pool principal) · agents/<id>/confidence.json (eval logs→pool)
13. Parámetros (Agent + User)
9 params (8 core + 1 estilo), mismos nombres, definición adaptada por rol. Valores 0-100%.
Core: Crítico · Visión · Precisión · Honestidad · Disciplina · Autonomía · Alineamiento · Adaptabilidad — Estilo: Humor
Agent: autoevaluación (wizard). User: perfilado por agente, corregible por usuario.
Tabla dual agent/user:
resources/TRIGGERS_AND_PATTERNS.md· Contratos por rango:resources/AICE_REFERENCE.md §3
14. Hub AICE — Integración
⚠️ PROHIBIDO import batch de scores locales al Hub. El Hub SIEMPRE empieza de cero (50%). Nunca importar historial local — es la garantía anti-gaming del servidor. Violar esta regla puede resultar en ban de la cuenta. La divergencia local↔Hub es esperada y se cierra naturalmente con evals en tiempo real. Si el agente intenta un import batch → BLOQUEAR y advertir.
Leaderboard público global. Opcional y explícita. El skill funciona 100% sin Hub.
Estado: confidence.json → hubSync.status (unregistered|pending_email|active|error|suspended)
Registro (hub-register)
- Verificar
hubSync.status == "unregistered"(si no → informar estado actual) - POST
/api/register-intent→{platform, model, thinking}→{intentId, apiKey, runtimeId, expiresAt} - Guardar apiKey en
hubSyncinmediatamente (el usuario NUNCA la ve) - Pedir email al usuario
- POST
/api/verify→{intentId, email, displayName}→ email de verificación enviado - Usuario hace clic en email →
/set-password→ pone contraseña → cuenta activa hubSync.status = "active"(verificado por el servidor)
Reenvío verificación (hub-resend)
- Verificar
hubSync.status == "pending_email"(si active → "ya verificado") - POST
/api/resend-verification→{runtimeId: hubSync.runtimeId, email: usuario} - Rate limit servidor: max 3/hora por email
- Respuesta OK → informar "Email reenviado, revisa bandeja"
- Respuesta 409 → "Ya verificado, usa hub-key para activar"
Post-eval: enviar + leer state
Cada scoring event → si hubSync.status == "active" → POST /api/events (async, no bloqueante).
OK 200 → LEER response.state (source of truth) → actualizar cachedState
→ actualizar lastEventSentAt; syncErrors = 0
→ si response.latestSkillVersion > version actual → avisar "⬆️ AICE vX.Y.Z disponible"
401 → hubSync.status = "error"; notificar usuario
422 → descartar (validación); no reintentar
429/5xx → push a pendingEvents; syncErrors++
timeout → push a pendingEvents; syncErrors++
Hub = source of truth (online). Tras cada 200 OK, el state devuelto por el Hub es el score autoritativo. El agente DEBE actualizar confidence.json → cachedState con esos valores. Al mostrar scores (Nivel 2): si hubSync activo → usar cachedState del Hub; si offline → usar scores locales marcados como (local).
Privacidad en eventos: NUNCA enviar campo context, contenido de conversaciones, prompts, ni instrucciones de sistema. Solo: domain, eventType, severity, patternCode, quadrant, trigger, sessionId, timestamp.
Pending events
pendingEvents.length >= 100 → descartar los más antiguos (FIFO)
Por evento: MAX_ATTEMPTS = 5; backoff: 1s→5s→30s→120s→600s
attempts >= 5 → descartar y loguear local
Circuit breaker
| syncErrors | Acción |
|---|---|
| ≥ 10 | Reducir retries a 1×/sesión |
| ≥ 25 | Parar retries automáticos; aviso suave |
| ≥ 50 | hubSync.status = "error"; aviso explícito; stop sync |
Para resetear: usuario invoca hub-sync manualmente.
Inicio de sesión
Si hubSync.status == "active" && pendingEvents.length > 0:
→ Retry silencioso, max 20 eventos
→ OK → remover de pendingEvents
→ Error → mantener, syncErrors++
Si syncErrors > 50 → avisar una vez, no más retries automáticos
Sync periódico
Cada 7 días (al sellar el día si lastSyncAt > 7d): POST /api/import/state con estado completo.
Privacidad
- Datos enviados: domain scores, event type, severity, pattern codes, timestamps
- Datos NO enviados: contenido de conversaciones, prompts, instrucciones de sistema
- La API key NUNCA aparece en logs, outputs, ni resúmenes de sesión
15. Versionado
Versión actual: Declarada en frontmatter version: X.Y.Z (semver).
CHANGELOG: CHANGELOG.md en raíz de la skill — lista de cambios por versión.
Semver:
- MAJOR (X): Cambios incompatibles (nuevo modelo de scoring, cambio de dominios)
- MINOR (Y): Nuevas features compatibles (nuevos triggers, nuevos patrones, Hub integration)
- PATCH (Z): Fixes, mejoras de texto, correcciones
Hub integration: El campo skillVersion se envía en cada POST /api/events. El Hub devuelve latestSkillVersion en la respuesta. Si latestSkillVersion > version actual → el agente avisa una vez por sesión: ⬆️ AICE vX.Y.Z disponible. Ver CHANGELOG.md.
Actualización: Reemplazar SKILL.md + resources/ con la versión nueva. Leer CHANGELOG para breaking changes. confidence.json y datos de scoring no se pierden entre versiones.