Inteligencia Artificial21 de junio de 2026 · 4 min
OpenAI lanza benchmark LifeSciBench: su mejor modelo falla 63.9%
OpenAI presentó LifeSciBench, un conjunto de 750 tareas para medir la capacidad de la IA en ciencias de la vida. Su modelo estrella, GPT-Rosalind, fracasó en el 63.9% de las pruebas, demostrando que la IA aún está lejos de reemplazar a los científicos.