Auditoria De Capacidades

Objetivo

Evaluar skills y subagentes con pruebas repetibles antes de promocionarlos como capacidades fiables del sistema.

Esta auditoria es de uso admin/privado hasta que exista suficiente evidencia.

No marcar una capacidad como buena sin prueba.
No eliminar duplicados sin comparar contenido util.
Si dos skills se solapan, la opcion preferente es fusionar el contenido valioso en una sola skill clara.
Mantener trazabilidad: entrada, salida, criterio de evaluacion y decision.
Separar pruebas de lectura, escritura, investigacion, UI, automatizacion y despliegue.

- listar skills;

- listar subagentes;

- mapear que subagentes usan que skills;

- detectar solapes por nombre, tags, descripcion y contenido.

- definir 3 casos por skill/subagente: basico, realista y limite;

- ejecutar con runtime controlado;

- guardar salida, tiempo, errores y observaciones.

- utilidad real;

- claridad de instrucciones;

- robustez ante ambiguedad;

- riesgo de acciones no deseadas;

- dependencia de herramientas externas;

- necesidad de confirmacion humana.

- mantener;

- mejorar;

- fusionar;

- archivar;

- bloquear hasta revisar.