
¿Son los modelos abiertos lo suficientemente agentes? El nuevo benchmark de Hugging Face
Hugging Face ha publicado un benchmark que evalúa modelos de lenguaje abiertos en tareas de uso de herramientas personalizadas. Los resultados muestran que, aunque han mejorado, aún están lejos de los modelos propietarios en escenarios agentes complejos.

