Google Eats Rocks, una victoria para la interpretabilidad de la IA y el control del entorno de seguridad


Esta semana, Google se encontró en crisis, esta vez por su nueva función de descripción general de IA y una serie de documentos internos filtrados. Josh Batson, investigador de la startup de inteligencia artificial Anthropic, se une a nosotros a continuación para explicar cómo un experimento que obsesionó al chatbot Claude con el puente Golden Gate representa un avance importante en la comprensión de cómo funcionan los grandes modelos de lenguaje. Y finalmente, analizamos los desarrollos recientes en la seguridad de la IA, después de que se eliminó el acceso temprano de Casey al nuevo y mejorado asistente de voz de OpenAI debido a problemas de seguridad.

Huéspedes:

Otras lecturas:

“Hard Fork” está alojado por Kevin Roose Y Casey Newton y producido por Whitney Jones Y Raquel Cohn. El espectáculo está organizado por Jen Poyant. Ingeniería por Alicia Moxley y música original de Daniel Powell, Elisheba Ittoop, marion lozano, sophie lanman Y Rowan Niemisto Verificación de hechos por caitlin amor.

Agradecimientos especiales a Paula Szuchman, Pui-Wing Tam, Nell Gallogly, Kate LoPresti Y Jeffrey Miranda.