El mayor peligro para la IA

La mayoría de la gente teme a una máquina que despierta.

El peligro real es más silencioso.

Es posible que la IA no falle por volverse demasiado inteligente. Podría fallar porque envenenamos los datos de los que aprende.

Para 2029, los modelos serán más grandes. Tendrán un mejor razonamiento y más agentes. Las empresas confiarán más en ellos.

Estos modelos se entrenan con internet. Leen blogs, foros, redes sociales y artículos de investigación.

Pero internet está cambiando.

Los bots, las empresas y los grupos políticos ahora publican contenido a una escala masiva. No solo publican spam. Publican contenido bien escrito y creíble.

Internet se está convirtiendo en un campo de batalla para los conjuntos de datos de entrenamiento.

La propaganda tradicional se dirige a las personas. En un mundo de IA, el objetivo es el propio modelo.

Si una mentira o un sesgo entra en los datos de entrenamiento, se convierte en parte de la IA. No se queda como una cita. Se convierte en una suposición predeterminada. Se convierte en la respuesta que suena correcta.

Esto no es solo un ataque técnico. Es un cambio sutil.

El objetivo no es romper el modelo. El objetivo es doblegarlo.

Considere estos riesgos:

  • Miles de páginas falsas hacen que un producto parezca seguro.
  • Chats falsos de desarrolladores hacen que el código inseguro parezca una buena práctica.
  • Se siembran historias políticas años antes de una elección.
  • Las opiniones sintéticas se convierten en la voz de los futuros asistentes.

El peligro no es una sola mentira. El peligro es un mapa distorsionado de la realidad.

Internet fue creado para la comunicación y el comercio. No fue creado para ser un conjunto de datos limpio.

Ahora la gente escribe para modelos futuros en lugar de para lectores humanos.

  • Una publicación de blog se convierte en una semilla.
  • Una reseña falsa se convierte en una señal de entrenamiento.
  • Un artículo técnico se convierte en una sugerencia de comportamiento.

Mil pequeñas mentiras se convierten en una verdad estadística.

La IA hereda nuestros documentos, nuestro ruido y nuestras manipulaciones. Si internet sigue contaminado, los modelos aprenderán de nuestras distorsiones.

La pregunta no es solo "¿Cómo hacemos que la IA sea segura?"

La verdadera pregunta es "¿Cómo mantenemos nuestro conocimiento a salvo para que la IA aprenda de él?"

Los modelos del mañana aprenden del internet de hoy. Y la gente ya está escribiendo para esos modelos.

Fuente: https://dev.to/marrouchi/the-greatest-danger-to-ai-6km