GPT-Rosalind — noticias y análisis

white and black typewriter with white printer paper

Inteligencia Artificial21 de junio de 2026 · 4 min

OpenAI lanza benchmark LifeSciBench: su mejor modelo falla 63.9%

OpenAI presentó LifeSciBench, un conjunto de 750 tareas para medir la capacidad de la IA en ciencias de la vida. Su modelo estrella, GPT-Rosalind, fracasó en el 63.9% de las pruebas, demostrando que la IA aún está lejos de reemplazar a los científicos.