El que no existe: Google responde a Sora con nuevas herramientas de creación de vídeos con IA | Tecnología

La estrategia es la primera de marketing: Primero creas la necesidad y luego vendes la solución. Las herramientas de trabajo de Google, como Gmail, Drive, Calendar, Meet o Docs, cuentan con 3.000 millones de usuarios, gran parte de los cuales son gratuitos y limitados. Pero 10 millones de ellos (40% particulares y 60% empresas) se dedican a organizar estas aplicaciones. Y ahora, que forma parte del día a día de millones de personas y que ha creado la necesidad, expresa la inteligencia artificial con la promesa de mejorar esta experiencia. Pero la solución no será gratuita, si cada venta te costará 10 dólares más al mes, o 9,2 euros. La compañía hizo este anuncio en Las Vegas, donde celebra la reunión anual de la compañía para presentar innovaciones digitales (Google Next). Mientras tanto, la reacción de la multinacional ante Sora, la herramienta de Open AI que permite crear vídeos de alta calidad a partir de simples peticiones de texto. La respuesta es un editor audiovisual, llamado Vids e Imagen 2, similar al competidor Sora, de Open AI.

La mayoría de los usuarios utilizan de forma limitada, pero gratuita, algunas de las 11 aplicaciones incluidas en la plataforma de trabajo Google Workspace (Gmail, Drive, Calendar, Chat, Docs, Sheets, Slides, Forms, Sites, Keep y Apps Script). Otros paganos a mi 5,75 euros (Business stater), 11,50 euros (estándar) o 17,25 euros (Plus). Thomas Kurian, director general de Google Cloud, anunció esta renovación de esta popular y mayor combinación de herramientas con Gemini for Workspace, la inteligencia artificial de Google.

Argumento kuriano de que la innovación responde a la demanda de los usuarios. Según un comunicado, “el 70% utiliza la función ayuda para escribir y el 75% crea presentaciones de diapositivas”. La nueva “nueva oferta de innovaciones y mejoras en Google Workspace con Gemini” incluye un complemento para reuniones y mensajería ($10 por mes) que le permite, como lo hizo antes, ver la versión del sitio ChatGPT, para tomar nota de las reuniones, resumirlas y discusiones (aplicaciones de chat relacionadas) y traducción simultánea en 69 idiomas.

Por alrededor de $10, otro complemento de seguridad ayuda a clasificar y proteger automáticamente archivos y datos confidenciales en medio de la IA. Según Aparna Pappu, directora general de Google Workspace, “utilizando modelos de lenguaje grandes, identifica un 20% más correo no deseado (correo basura o no deseado) en Gmail, revisa 1.000 veces más quejas de usuarios en el registro y responde un 90% más rápido a nuevos ataques de Suplantación de identidad (estafa por suplantación)”.

Vídeos

Pero una de las grandes capacidades de Google está centrada en la creación de vídeos. En este sentido, la plataforma de trabajo también incluye la aplicación Google Vids, que permite preparar guías, producir y crear audiovisuales compatibles con el resto de utilidades de la plataforma. «Los videos se lanzarán brevemente en Workspace Labs y esperamos tener acceso a todos los clientes para fines de este año», dice Kurian. “Probablemente en junio”, afirma Aparna Pappu, directora general de Google Workspace.

“Vids es un asistente de vídeo, redacción, producción y edición, todo en uno. Podrás generar una guía gráfica fácilmente editable y, después de elegir un estilo, crear un primer prestador a partir de escenas sugeridas con vídeos de archivo, imágenes y música de fondo. También puedes ayudar a completar tu mensaje con la voz de narración adecuada, lo que te permitirá obtener una de nuestras personas preestablecidas o utilizar el usuario”, dice Pappu.

«Todo lo que necesitas es un navegador, y ese es el punto clave», añade la directriz. “No es necesario enviar registros por correo electrónico de un lado a otro; el equipo puede continuar en la historia al mismo tiempo con los mismos controles de acceso y seguridad de todo el espacio de trabajo,

El lanzamiento de Vids estará restringido a los suscriptores de Google en sus primeras etapas. “Tenemos un correo para que nuestros clientes de pagos reciban sus comentarios. Este producto está diseñado para un trabajo, que es nuestra prioridad. Una vez que implementemos estas funciones para nuestros clientes de pagos y obtengamos comentarios de nuestros usuarios, consideraremos expandirlas”, dice Pappu.

Imágenes de mesas y manos creadas con inteligencia artificial mediante la aplicación Imagen 2 de Google.

Imagen 2 frente a Sora

El programa más interesante para Sora también está reservado para usuarios de Gemini 1.5 Pro, Está disponible en versión preliminar en la plataforma Vertex AI para desarrolladores. Se trata de Imagen 2, un modelo de IA que, según Amin Vahdat, director de Google Cloud, “Brinda la ventana contextuale más grande del mádo a los desarrolladores”. «Nuestra familia de plantillas de generación de imágenes ahora se puede utilizar para crear videos de cuatro segundos a partir de mensajes de texto, incluidas las marcas de agua digitales».

“Creemos que las organizaciones han confiado en Image 2 para generar videos precisos y de alta calidad a escala comercial. “Los equipos creativos y marketing Puedes generar imágenes animadas a partir de un mensaje de texto. Inicialmente, los vídeos tendrán 24 fotografías por segundo (fps) con una resolución de 360×640 píxeles y una duración de cuatro segundos, continuando con tomas de mayor calidad”, explica Vahdat.

El programa está preparado para ofrecer variados ángulos y movimientos de cámara manteniendo la coherencia con la seguridad e incluyendo filtros de seguridad y marcas de agua digitales a través de SynthID (Google DeepMind). La nueva ley europea sobre inteligencia artificial exige que se distinga inequívocamente que una creación fue generada por inteligencia artificial.

Esto también facilitará en las versiones actualizadas la eliminación de aspectos no deseados en una imagen, la adición de nuevos elementos y la ampliación de los bordes para crear un campo de visión más amplio.

Esto responde al movimiento Open AI con Sora, un modelo de inteligencia artificial que crea videos a partir de direcciones con texto de hasta un minuto de duración. Este productor audiovisual se reúne durante las pruebas, explica la empresa, «para evaluar áreas críticas en busca de problemas o riesgos» y para obtener sugerencias y propuestas de artistas visuales, creadores y cineastas.

Open AI reconoce la necesidad de revisar el proyecto porque, debido al espectacular realismo que ofrecen sus resultados, «el modelo actual presenta deficiencias», como errores de precisión o indicaciones como mostrar una escena que supone la modificación de un objeto, sin embargo , en las siguientes fotos las fotos aparecen intactas o se mezclan espacios o se confunden trayectorias.

Puedes seguir un EL PAÍS Tecnología fr. FacebookX o haga clic aquí para recibir el nuestro boletín semanal.