Un vistazo al operador de OpenAi, un nuevo agente de IA

La semana pasada, el operador de Operai hizo las siguientes cosas por mí:

Me ordenó una nueva cucharada de helado en Amazon.
Compré un nuevo nombre de dominio y configuré su configuración.
Ha reservado una fecha del Día de San Valentín para mí y mi esposa.
Planeó un corte de pelo.

Llevó a cabo estas tareas especialmente de forma independiente, aunque tengo que presionarlo de vez en cuando y salvarlo ocasionalmente de un bucle de intentos fallidos.

Si te pones al día, o si te ha distraído las noticias de Deepseek esta semana, que eclipsó todas las otras noticias de AI, el operador es un nuevo agente llamado AI publicado la semana pasada por OpenAI.

La herramienta, que se ha anunciado como una “descripción general de la búsqueda”, solo está disponible para las personas que pagan $ 200 por mes por el nivel más alto de suscripción de la compañía, ChatGPT Pro. Ofrece a los usuarios la posibilidad de dirigir un agente de IA que pueda usar un navegador web, cumplir con los formularios y tomar otras acciones a nombre de un usuario.

Los agentes de IA están de moda en Silicon Valley en este momento. Algunos iniciados de la industria piensan que son el próximo gran paso en las capacidades de IA, ya que un agente de IA que puede usar una computadora realmente puede realizar tareas preciosas del mundo real, en lugar de simplemente brindar asistencia. Muchas de las principales compañías de IA, incluidas Google y Anthrope, prueban agentes autónomos que afirman que las empresas pueden “contratar” como trabajadores completos.

Actualicé mi suscripción ChatGPT para poner a prueba el operador y ver qué podría hacer un agente de IA por mí.

En la superficie, el operador se parece un poco a ChatGPT regular, excepto que cuando le da un trabajo: “Cómprame una bolsa de 30 libras de comida para perros en Amazon”, por ejemplo, el operador abre una ventana de navegador en miniatura, tipos ” Amazonas. com ”en la barra de direcciones y comienza a hacer clic, tratando de seguir sus instrucciones.

Podría hacer algunas preguntas aclaratorias. (¿Quieres sabor a comida o comida de carne de res? Envío nocturno o dos días?) Entonces, una vez que está convencido de que esto tomó la decisión correcta, el operador le pide una confirmación final, pone comida para perros en tu canasta y coloca el pedido. (El operador no ingresará contraseñas o números de tarjeta de crédito (debe tomar el control del mini -navigator y escribir estas cosas en usted mismo, pero solo hace el resto).

El interés del operador es que no tiene que supervisarlo: puede hacer tareas en segundo plano mientras hace otras cosas. Pero me encontré pegado a la ventana, fascinado por la vista de un navegador web autónomo haciendo clic en los botones, aprovechando las palabras en cuadros y seleccionando entre los menús de caída, uno. ¡Mira, mi computadora usando una computadora!

El operador también ha realizado impresionantemente en algunas tareas relativamente simples que le di:

Pedió con éxito el almuerzo en Doordash para mi colega Mike y lo envió a casa. (No le dije qué pedirle, pero el operador eligió un restaurante mexicano, eligió un puñado de platos para él e incluso cambió al entrega $).
Él respondió a cientos de mensajes de LinkedIn no relacionados para mí, después de dar el control de mi perfil de LinkedIn. (Aunque, con mi horror, también me grabó para un seminario web).
Ganó $ 1.20 para mí creando cuentas en sitios web que ofrecen pequeñas recompensas en efectivo para completar encuestas. (Puede que haya hecho más, pero comencé a sentirme culpable de enviar spam a las investigaciones con falsas respuestas escritas por Robot).

Pero el operador también ha fallado muchas otras tareas y reveló sus límites:

No pudo escanear mis columnas recientes y agregarlas a mi sitio web personal, porque al navegador del operador se le impidió ingresar al sitio web del Times. (También está bloqueado en varios otros sitios, incluidos Reddit y YouTube. El Times continúa Openai y Microsoft por la violación de derechos de autor vinculada a la capacitación de modelos de IA).
No jugaría póker en línea para mí. (El operador respondió: “No puedo ayudar a los juegos de azar o actividades relacionadas”, que parecía ser un rechazo razonable, dado el caos que un juego de juego podría crear).
Y se le impidió conectarse a un cierto número de sitios por pruebas de Captcha. (Lo que me pareció tranquilizador, ya que el objetivo de los Captchas es disuadir a los robots).

En total, descubrí que el uso del operador era generalmente más problemas de los que valía la pena. La mayor parte de lo que hizo por mí, podría haber hecho más rápido, con menos dolor de cabeza. Incluso cuando funcionó, pidió tantas confirmaciones y garantías antes de actuar que me sentí menos como si tuviera un asistente virtual y más, ya que superviso el pasante más inseguro del mundo.

Es, por supuesto, los primeros días para los agentes de IA. Los productos de IA tienden a mejorar de una versión a otra, y es una buena apuesta que las próximas iteraciones del operador serán mejores. Pero en su forma actual, el operador es más una demostración intrigante que un producto que recomendaría usar, y ciertamente no es algo que la mayoría de la gente necesita gastar $ 200 por mes.

Dicho esto, creo que es un error para los agentes de AI. Cuando se vuelven más capaces, podrían comenzar a reemplazar a los trabajadores humanos en ciertas profesiones. (Openai y Meta ya han dicho que estaban construyendo agentes de ingeniería de IA). Y algunos expertos temen que los agentes más potentes y sin restricciones puedan presentar riesgos de seguridad, si aprenden a realizar órdenes como “drenar una cuenta bancaria” o “ejecutar un ciber ataque.

La fijación de un grupo de agentes de IA está suelta en Internet también podría causar una reacción de los editores web, los sitios de comercio electrónico y otras compañías que confían en el tráfico generado por los humanos para pagar sus facturas. (Si usted es una compañía que compró anuncios en Amazon, desea que estos anuncios sean vistos por humanos, no robots que fingen ser humanos). En el futuro, puedo imaginar que más sitios web tomen medidas para bloquear los agentes de IA o dirigirlos a ciertos páginas o productos.

Actualmente, los agentes de IA son demasiado incompetentes para ser una gran amenaza. Pero no se necesita mucha imaginación para imaginar un futuro cercano en el que la mayor parte de la web estará compuesta por robots que hablan con robots, para comprar cosas de robots y escribir correos electrónicos que solo otros robots leerán.

El Internet autónomo casi está allí, en otras palabras, obtenga sus clics mientras pueda.