Hace dos años, OpenAI inició la moda de los chatbots con el lanzamiento de ChatGPT. La empresa ahora espera despertar el interés en una nueva ola de tecnologías de inteligencia artificial.
El jueves, OpenAI presentó una herramienta llamada Operador que puede acceder a Internet y realizar tareas de forma autónoma, como hacer recados o reservar un restaurante.
“Puede navegar por sitios web y realizar acciones en sitios web, como usted y yo”, dijo en una entrevista Yash Kumar, jefe de producto e ingeniería de OpenAI.
Los investigadores de inteligencia artificial llaman a este tipo de tecnología agente de IA. Mientras que los chatbots pueden responder preguntas, escribir poemas y generar imágenes, los agentes pueden utilizar otro software en Internet.
En una sesión informativa con The New York Times, Kumar demostró cómo el sistema podía realizar una reserva en un restaurante en San Francisco a través del sitio web OpenTable y comprar una lista de alimentos a través de Instacart. El operador se ve y se comporta de manera muy similar a ChatGPT y otros chatbots. El usuario escribe una solicitud en una ventana pequeña. Entonces el sistema reacciona lo mejor que puede.
El usuario puede ver cómo la herramienta abre un navegador web y visita sitios concretos. El operador puede cometer errores. Pero en algunos casos ayuda a corregir estos errores. En la demostración para The Times, el sistema asumió incorrectamente que Kumar estaba en Iowa, antes de encontrar correctamente un restaurante en San Francisco.
El operador no es del todo autónomo. A veces, un usuario necesita corregir sus errores y proporcionar solicitudes y sugerencias adicionales. Para sitios como OpenTable e Instacart, los usuarios deben proporcionar sus nombres de usuario y contraseñas privados. Pero OpenAI dijo que no almacena esta información privada.
Sin embargo, la empresa captura datos que muestran cómo el sistema interactúa con los usuarios y accede a los sitios en su nombre. Puede utilizar estos datos para entrenar versiones futuras de Operador.
OpenAI dijo que a partir del jueves, Operador estará disponible para cualquiera que se suscriba a ChatGPT Pro, un servicio de 200 dólares al mes que brinda acceso a todas las herramientas más recientes de la compañía. Planea ofrecer la herramienta a través de otros servicios pagos y, eventualmente, integrarla con la versión gratuita de ChatGPT.
(El New York Times demandó a OpenAI y su socio Microsoft, acusándolos de infracción de derechos de autor sobre contenido de noticias relacionado con sistemas de inteligencia artificial. OpenAI y Microsoft han negado las acusaciones).
En los últimos meses, otras empresas importantes, incluidas Google y Anthropic, han presentado herramientas similares. Sin embargo, muchas de estas herramientas aún no están ampliamente disponibles.
El operador se basa en la misma tecnología que sustenta ChatGPT. Esta tecnología es lo que los investigadores de IA llaman una red neuronal: un sistema matemático capaz de aprender habilidades analizando enormes cantidades de datos.
Las versiones más nuevas de esta tecnología aprenden de una amplia gama de datos, incluidos texto, imágenes y sonidos. En este caso, Operador aprendió de imágenes que muestran cómo la gente usa hojas de cálculo, sitios de compras y otros servicios en línea. Después de identificar patrones en estos datos, el nuevo sistema puede utilizar servicios similares en nombre de los usuarios de computadoras.
Kumar reconoció que, al igual que ChatGPT y otros chatbots, Operador sigue siendo una tecnología experimental. Pero añadió que la situación seguirá mejorando en los próximos meses.
“No es la cosa más resistente del mundo”, dijo. “Pero es mucho mejor que antes este tipo de tecnología”.