Inteligencia Artificial·27 may 2026
ITBench-AA: modelos de frontera obtienen menos del 50% en benchmark de tareas IT empresariales
IBM y Artificial Analysis presentan ITBench-AA, el primer benchmark especializado para evaluar agentes de IA en tareas de infraestructura IT empresarial. Los modelos más avanzados actualmente disponibles alcanzan desempeños inferiores al 50%, revelando brechas significativas en capacidades de automa
Fuente: Hugging Face Blog