Los chatbots en línea como ChatGPT de OpenAI y Gemini de Google a veces tienen dificultades para resolver problemas matemáticos simples. El código informático que generan suele tener errores y estar incompleto. Incluso inventan cosas.
El jueves, OpenAI presentó una nueva versión de ChatGPT que podría solucionar estos defectos. La compañía dijo que el chatbot, impulsado por una nueva tecnología de inteligencia artificial llamada OpenAI o1, podría «razonar» sobre tareas que involucran matemáticas, codificación y ciencias.
«Con modelos anteriores como ChatGPT, les haces una pregunta e inmediatamente empiezan a responder», dijo Jakub Pachocki, científico jefe de OpenAI. “Este modelo puede tomar su tiempo. Puede pensar en el problema –en inglés– e intentar desglosarlo y buscar ángulos para intentar dar la mejor respuesta. »
En una demostración para The New York Times, el Dr. Pachocki y Szymon Sidor, un investigador técnico de OpenAI, mostraron al chatbot resolviendo un acróstico, un tipo de rompecabezas de palabras que es significativamente más complejo que un crucigrama ordinario. El chatbot también respondió una pregunta de química a nivel de doctorado y diagnosticó una enfermedad basándose en un informe detallado de los síntomas y la historia del paciente.
Esta nueva tecnología es parte de un esfuerzo mayor para crear una IA que pueda razonar sobre tareas complejas. Empresas como Google y Meta están desarrollando tecnologías similares, mientras que Microsoft y su filial GitHub están trabajando para integrar el nuevo sistema OpenAI en sus productos.
El objetivo es crear sistemas que puedan resolver un problema de forma lógica y cuidadosa, siguiendo una serie de pasos distintos, cada uno de los cuales se basa en el siguiente, la forma en que razonan los humanos. Estas tecnologías podrían resultar particularmente útiles para los programadores informáticos que utilizan sistemas de inteligencia artificial para escribir códigos. También podrían mejorar los tutores automatizados para matemáticas y otras materias.
OpenAI dijo que su nueva tecnología también podría ayudar a los físicos a generar fórmulas matemáticas complejas y ayudar a los investigadores de atención médica en sus experimentos.
Con el lanzamiento de ChatGPT a finales de 2022, OpenAI ha demostrado que las máquinas pueden manejar consultas como los humanos, responder preguntas, escribir trabajos finales e incluso generar código informático. Pero a veces las respuestas eran erróneas.
ChatGPT adquirió sus habilidades analizando grandes cantidades de texto extraído de Internet, incluidos artículos, libros y registros de chat de Wikipedia. Al identificar patrones a lo largo de este texto, aprendió a generar texto de forma independiente.
(El New York Times demandó a OpenAI y Microsoft en diciembre por infracción de derechos de autor sobre contenido de noticias relacionado con sistemas de inteligencia artificial).
Como Internet está lleno de información falsa, la tecnología ha aprendido a repetir las mismas falsedades. A veces ella inventa cosas.
El Dr. Pachocki, el Sr. Sidor y sus colegas intentaron remediar estos problemas. Diseñaron el nuevo sistema de OpenAI utilizando algo llamado aprendizaje por refuerzo. A través de este proceso, que puede durar varias semanas o meses, un sistema puede aprender el comportamiento mediante prueba y error exhaustivos.
Al resolver diversos problemas matemáticos, puede, por ejemplo, aprender qué métodos conducen a la respuesta correcta y cuáles no. Si repite este proceso con un número extremadamente elevado de problemas, podrá identificar patrones. Pero el sistema no necesariamente puede razonar como un humano. Todavía puede cometer errores y alucinar.
“No será perfecto”, dijo Sidor. «Pero puede estar seguro de que el sistema trabajará más duro y será mucho más probable que produzca la respuesta correcta». »
El acceso a la nueva tecnología comenzó el jueves para consumidores y empresas que se suscriban a los servicios ChatGPT Plus y ChatGPT Teams de la compañía. La empresa también vende la tecnología a desarrolladores de software y empresas que crean sus propias aplicaciones de IA.
OpenAI dijo que la nueva tecnología funcionó mejor que las tecnologías anteriores en algunas pruebas estandarizadas. En el examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO, el principal concurso de matemáticas para estudiantes de secundaria), su tecnología anterior obtuvo un 13%. OpenAI o1, dijo la compañía, obtuvo una puntuación del 83%.
Sin embargo, las pruebas estandarizadas no siempre determinan con precisión qué tan bien se desempeñan las tecnologías en situaciones del mundo real y, si bien el sistema puede ser eficaz para responder una pregunta de un examen de matemáticas, aún puede tener dificultades para enseñar matemáticas.
«Existe una diferencia entre la resolución de problemas y el apoyo», dice Angela Fan, científica investigadora de Meta. “Los nuevos modelos basados en la razón pueden resolver problemas. Pero es muy diferente a ayudar a alguien con su tarea. »