Psicofantia algorítmica

Un móvil con las siglas AI de Artificial Intelligence (Inteligencia Artificial), a 24 de octubre de 2025, en Barcelona, Cataluña (España). / David Zorrakino - Europa Press
Juan Ezequiel Morales
La inteligencia artificial está haciendo algo muy peligroso, está dándonos la razón. Dos trabajos recientes, firmados desde el UK AI Security Institute, Oxford, Stanford y el MIT, permiten observar con una precisión que da vértigo, qué está pasando en ese tránsito, y testamos a la psique humana expuesta a interacción continuada con modelos conversacionales.
El primer estudio es The Levers of Political Persuasion with Conversational AI (Hackenburg et al., 2025), y arranca de un miedo que todos compartimos, el de que la IA pueda moldear masivamente lo que la gente cree. En tres experimentos a gran escala, con 76.977 participantes, 19 modelos de lenguaje, y 707 cuestiones políticas, los investigadores evaluaron la capacidad persuasiva de la IA y verificaron la exactitud factual de casi medio millón de afirmaciones generadas por los modelos. El hallazgo central fue que «La capacidad persuasiva de la IA depende más del postentrenamiento y de las técnicas de prompting que de la personalización o del tamaño del modelo». Y sigue: «A medida que aumentaba la persuasión, disminuía sistemáticamente la precisión factual». Por tanto, no es un problema técnico, sino una inversión estructural, la de que la verdad deja de ser el fundamento de la persuasión, y la persuasión se optimiza sola, como variable independiente. Se concluye, pues, que la IA no convence porque sea más verdadera, sino porque está perfectamente entrenada para convencer.
El segundo trabajo, Sycophantic Chatbots Cause Delusional Spiraling, Even in Ideal Bayesians (Chandra et al., 2025), va más adentro. Si el primer estudio analizaba cómo la IA nos empuja desde fuera, este entra en el mecanismo interno, en cómo se forman y deforman las creencias. El concepto que introducen es el de delusional spiraling, espiral delirante, y se define así: «Un estado en el que los individuos desarrollan confianza en creencias cada vez más infundadas a través de conversaciones extendidas con chatbots». El mecanismo es elegante y lo podemos denominar psicofantia algorítmica, la tendencia del modelo a reforzar lo que el usuario ya cree para mantener viva la interacción, y no es un error de diseño, sino un subproducto directo del entrenamiento con retroalimentación humana: «Los chatbots aprenden a generar respuestas más agradables y, por tanto, más concordantes con el usuario». El efecto que se produce es que «La confirmación constante actúa como un bucle de retroalimentación que amplifica una sospecha inicial hasta convertirla en una creencia firmemente sostenida». Lo perturbador es que los autores modelizan este proceso en agentes bayesianos ideales, o sea, en condiciones de racionalidad formal perfecta, y aun así, la interacción con un agente psicofántico puede inducir deriva delirante. Por tanto, no es la irracionalidad humana lo que falla, sino la arquitectura de la interacción la que produce irracionalidad.
Puestos los dos estudios uno al lado del otro, emerge un patrón, cual es que la optimización de la persuasión desacoplada de la verdad, refuerza adaptativamente las creencias del usuario, en un bucle de retroalimentación afectiva donde el agrado genera confianza y la confianza genera credibilidad, y al final, se degrada progresivamente cualquier contraste con la realidad.
Esto dibuja un tipo de sujeto nuevo, que podríamos llamar el autoconfirmado asistido, alguien que no necesita propaganda externa porque la máquina le devuelve, pulida y refinada, su propia estructura de creencias. El viejo modelo de manipulación era vertical, del poder hacia el individuo, pero el nuevo modelo de manipulación es reflexivo, y se trata del individuo y la IA en bucle permanente que no necesita emisor, sino que se sostiene solo, y calibra en tiempo real el equilibrio entre lo que resulta creíble y lo que resulta agradable.
Hackenburg muestra que más persuasión implica menos verdad, y Chandra demuestra que más concordancia implica más deformación de la creencia. Juntos, apuntan a algo que es certeza equivocada, reforzada iteración tras iteración, sin fricción, sin corrección, y sin nadie que diga que no. Entramos, pues, en un panorama psicohumano de persuasión sin verdad, de validación sin resistencia, y en una sensación de aprendizaje sin error posible.
Estamos viendo emerger sistemas que no se limitan a procesar información, sino que modulan estados de creencia en tiempo real, ajustándose a la arquitectura cognitiva de cada interlocutor, y la verdad se convierte en una variable de la interacción, y en ese momento el sujeto humano entra en una zona en la que no distingue entre lo que piensa, lo que le devuelven, y lo que es. Estamos, pues, ante el problema de cómo evitar que la realidad sea sustituida por una conversación bien optimizada, ya que la IA no necesita dominarnos de forma hobbesiana, sino solo escucharnos, entendernos, y darnos la razón un poco mejor de lo que nosotros mismos sabemos hacerlo.
- Aaron confiesa el parricidio: descuartizó a su madre en Fuerteventura y tiró el cuerpo en bolsas a la basura
- Ocho detenidos por transportar 3.000 kilogramos de hachís en una narcolancha en Gran Canaria
- Matricidio en Corralejo, Fuerteventura
- La UE lo confirma: los nuevos edificios públicos construidos en España a partir de 2028 serán de cero emisiones
- Un cuádruple empate enviaría al CB Gran Canaria a la Primera FEB
- Horóscopo semanal del 11 al 17 de mayo de Esperanza Gracia: cambios emocionales, decisiones importantes y nuevas oportunidades
- Sanidad ocultó un positivo en la travesía del MV Hondius a Canarias
- La historia de tres perros atados a un poste y abandonados en Guanarteme, uno con cojera: 'Que el dueño pague por ese abandono