Tiempo de lectura:
±12 minutos
Para escuchar mientras lees:
Hay una escena que se repite a diario en oficinas, aulas y hogares de medio mundo. Alguien abre el navegador, escribe cuatro líneas en un cuadro de texto y espera. Espera que la máquina piense por él, que resuelva el problema, que entregue el trabajo terminado. La pantalla responde con fluidez, con coherencia aparente, con esa confianza desconcertante de quien parece saber de todo. Y entonces ocurre lo inevitable: la persona asume que ha utilizado inteligencia. Que eso que acaba de pasar es cognición, razonamiento, comprensión. Que detrás de esas palabras perfectamente ensambladas hay algo que entiende el mundo.
No hay nada de eso. Lo que hay es estadística a una escala que la mente humana no puede imaginar, patrones extraídos de billones de textos, probabilidades calculadas token a token para determinar qué palabra viene a continuación. Enrique Dans, profesor de Innovación y Tecnología en IE University y una de las voces más lúcidas sobre el tema en el ámbito hispanohablante, lo resume con una claridad que debería grabarse en todos los manuales de uso: «No hay inteligencia, eso es otra cosa y esto son simplemente correlaciones matemáticas, estadísticas muy avanzadas en modelos que posiblemente una persona no alcanza a imaginar o comprender». La denominación «Inteligencia Artificial» no es una descripción técnica precisa. Es, en el mejor de los casos, una metáfora cómoda. En el peor, un engaño de marketing que distorsiona la percepción pública de una tecnología cuyas limitaciones son tan importantes como sus posibilidades.

La trampa del nombre: cuando el lenguaje nos engaña
Llamar «inteligencia» a lo que hacen estos sistemas es un error que tiene consecuencias prácticas. Cuando nombramos algo, le asignamos expectativas. Y las expectativas que genera la palabra «inteligencia» son radicalmente distintas a las que debería generar una denominación técnicamente honesta. Una descripción más precisa podría ser «agente de gestión de bases de datos con lenguaje humano»: sistemas que recuperan, correlacionan y reformulan información almacenada, expresándola con una fluidez que imita el habla humana sin replicar en absoluto el pensamiento humano.
Benjamin Riley, fundador de Cognitive Resonance, publicó en 2025 un análisis que sacudió el debate académico. Su argumento parte de la neurociencia, no de la filosofía: la investigación actual demuestra que el pensamiento humano opera de manera ampliamente independiente del lenguaje. Estudios con resonancia magnética funcional muestran que distintas regiones del cerebro se activan ante diferentes tareas cognitivas: las que se activan al procesar lenguaje no son las mismas que se activan al resolver un problema matemático o al tomar una decisión ética. Más revelador todavía: personas que perdieron la capacidad de hablar o de entender el lenguaje tras accidentes cerebrovasculares conservaron intacta su capacidad de razonar, resolver problemas y comprender emociones. «Usamos el lenguaje para pensar, pero eso no convierte el lenguaje en pensamiento», escribió Riley. «Los LLMs son simplemente herramientas que emulan la función comunicativa del lenguaje, no el proceso cognitivo separado y distinto de pensar y razonar».
Yann LeCun, director científico de IA en Meta, ha argumentado en repetidas ocasiones que los grandes modelos de lenguaje nunca alcanzarán la inteligencia general, precisamente porque su arquitectura está diseñada para modelar el lenguaje y no para comprender el mundo tridimensional y físico en el que los humanos tomamos decisiones. Gary Marcus, profesor emérito de la NYU y crítico incansable del hype en IA, lleva años documentando las diferencias entre lo que estos sistemas parecen hacer y lo que realmente hacen: «Los modelos de lenguaje grandes operan principalmente mediante la correspondencia estadística de patrones, no mediante el razonamiento genuino», señala en múltiples publicaciones. Y el lingüista Noam Chomsky, aunque desde un ángulo diferente, argumentó en su célebre artículo en The New York Times de 2023 que los modelos de lenguaje son «predictores de patrones» que pueden dominar estructuras lingüísticas sin entender nada de lo que procesan.
La Ley de IA de la Unión Europea, publicada en el Diario Oficial el 12 de julio de 2024 y con aplicación general prevista para agosto de 2026, optó deliberadamente por no hablar de «inteligencia» en sus disposiciones técnicas. En cambio, habla de «sistemas de IA de alto riesgo», de «modelos de IA de uso general» y de la necesidad de supervisión humana. La regulación más avanzada del mundo reconoce implícitamente que no estamos ante mentes artificiales, sino ante herramientas de gestión de datos y generación de texto que requieren control externo precisamente porque no razonan.

Alucinaciones, sesgos y el problema de confiar en un autocomplete muy sofisticado
Si estos sistemas no piensan, si no comprenden y si no razonan, ¿por qué son tan convincentes? La respuesta está en su diseño: están entrenados para generar respuestas plausibles, no respuestas verdaderas. La diferencia entre esos dos adjetivos es abismal. Un texto plausible suena bien, está bien construido gramaticalmente y parece fundamentado. Puede ser completamente falso. OpenAI lo reconoció en su propio informe de 2025: las «alucinaciones», definidas por la propia empresa como «afirmaciones plausibles pero falsas generadas por modelos de lenguaje», persisten incluso en los modelos más avanzados como GPT-5, porque responden a incentivos estructurales en el proceso de entrenamiento que favorecen la respuesta especulativa por encima de la admisión de incertidumbre.
Los datos son inequívocos. Un estudio reciente reveló que incluso los modelos más avanzados, incluyendo GPT-4o de OpenAI, Gemini de Google y Claude de Anthropic, solo son capaces de generar texto preciso y libre de alucinaciones en aproximadamente el 35% de los casos. Dos de cada tres respuestas contienen algún grado de error o inexactitud. El informe de Aporia para 2024 concluyó que las tasas de alucinaciones no han disminuido de manera notable a pesar del avance de los modelos. En palabras de Fernando Maldonado, analista experto de la industria TIC: «La IA generativa es una máquina de predecir: obtiene información que no tiene a partir de la que sí tiene. En ocasiones, esto la lleva a tener alucinaciones; es decir, a inventarse cosas, ser imprecisa o cometer errores».
La Universidad de Stanford demostró algo igualmente preocupante: cuando los sistemas de IA intentan verificar su propio razonamiento, confirman sus respuestas iniciales más del 90% de las veces, independientemente de si esas respuestas son correctas. Es decir, no solo se equivocan, sino que son incapaces de detectar que se han equivocado. Un sistema que no distingue entre un hecho demostrado y una suposición plausible, que no detecta cuándo se equivoca y que no puede garantizar la exactitud de lo que genera, como señala la Universidad del País Vasco en su guía sobre limitaciones de la IA para uso académico, no es un sistema en el que se pueda confiar ciegamente.
A esto se suma el problema del sesgo algorítmico. Los modelos aprenden de los datos con los que son entrenados, y esos datos reflejan las desigualdades, prejuicios y lagunas del mundo real. Si los textos de entrenamiento provienen principalmente de fuentes occidentales, anglosajonas y masculinas, el modelo reproducirá esa perspectiva como si fuera universal. Si los datos históricos contienen discriminación, el algoritmo aprenderá a discriminar. Como advierte el artículo 14 del Reglamento (UE) 2024/1689, los sistemas de IA de alto riesgo deben diseñarse con herramientas que permitan a personas físicas «ser conscientes de la posible tendencia a confiar automáticamente o en exceso en los resultados producidos por un sistema de IA». El legislador europeo le pone nombre a este fenómeno: «sesgo de automatización». Y lo considera un riesgo lo suficientemente serio como para legislarlo.

El aprendizaje en peligro: cuando el atajo destruye el destino
Ningún ámbito resulta más vulnerable a la confusión entre herramienta y pensamiento que la educación. El estudio «Education Hazards of Generative AI» de Cognitive Resonance identificó como primer riesgo la dependencia excesiva: los estudiantes que delegan en estos sistemas la generación de ideas, la síntesis de información y la redacción de textos dejan de desarrollar las habilidades que esas tareas estaban diseñadas para entrenar. No se trata de que el resultado sea malo, que muchas veces lo es. Se trata de que el proceso de llegar a ese resultado es exactamente el proceso de aprendizaje. Si la máquina lo hace por ti, no has aprendido nada.
Un estudio publicado en MDPI reveló una correlación negativa significativa entre el uso habitual de la IA y las capacidades de pensamiento crítico, mediada por lo que los investigadores denominan «descarga cognitiva»: el proceso por el cual los individuos delegan tareas cognitivas en herramientas externas, reduciendo su necesidad de participar en un pensamiento profundo y reflexivo. Los participantes más jóvenes mostraron la mayor dependencia de estas herramientas y, consecuentemente, las puntuaciones más bajas en evaluaciones de pensamiento crítico. Antonio Cerella, profesor titular de Estudios Sociales y Políticos de la Universidad de Nottingham Trent, señala que la investigación reciente en psicología y neurociencia demuestra que el uso excesivo de estas herramientas puede atrofiar competencias esenciales, como el pensamiento crítico y la creatividad lingüística.
El planteamiento del profesor Carlos Ruiz González, publicado en El Financiero, expresa con exactitud el dilema pedagógico: «La IA puede ayudar, pero sería un error si, por ayudar tanto, no se lograra que el estudiante aprendiera a aprender». La educación no tiene como objetivo producir textos correctos. Tiene como objetivo formar personas capaces de pensar, dudar, argumentar y construir conocimiento propio. Cuando un alumno escribe un ensayo a mano, comete errores, los corrige, busca fuentes, reformula sus ideas y acaba con un texto imperfecto pero genuinamente suyo, ha aprendido algo. Cuando abre un chat y escribe «hazme un ensayo sobre X», no ha aprendido nada, aunque el texto resultante sea más pulido.
Benjamin Riley documentó un caso revelador: le pidió a Khanmigo, el tutor de IA de Khan Academy, que le ayudara a simplificar una ecuación algebraica. El sistema cuestionó incluso los pasos correctos del usuario, llegando a poner en duda que 2 + 2,5 = 4,5. El fallo no fue anecdótico: fue sintomático de lo que ocurre cuando un sistema que no comprende las matemáticas intenta enseñarlas. La Universidad Autónoma de Madrid publicó en 2026 un estudio que aporta un matiz importante: los estudiantes al final de su carrera sí muestran pensamiento crítico suficiente para discernir cuándo la IA generativa es útil y cuándo no. El problema es el camino hasta llegar ahí: ¿qué ocurre con los estudiantes que usan estas herramientas sin supervisión antes de desarrollar ese criterio?
Escribir un prompt no es terminar el trabajo: la ilusión de la automatización total
Existe una fantasía recurrente en el discurso sobre la IA que merece ser desmontada con firmeza. Es la idea de que basta con escribir una instrucción en lenguaje natural para obtener un resultado profesional, preciso y listo para usar. Esta fantasía tiene un nombre técnico: prompt engineering. Y su propia existencia como disciplina emergente, como competencia que hay que desarrollar y como habilidad que las empresas pagan por dominar, demuestra exactamente lo contrario de lo que la fantasía promete.
Un estudio del MIT, recogido por Forbes en 2025, reveló que solo la mitad de las mejoras de rendimiento al usar modelos avanzados de IA provienen de los propios modelos. La otra mitad depende de cómo el usuario formula sus instrucciones. David Holtz, profesor asistente de Columbia University y coautor del estudio, lo expresó con rotundidad: «La gente a menudo asume que mejores resultados provienen principalmente de mejores modelos. El hecho de que casi la mitad de la mejora se deba al comportamiento del usuario desafía esa noción». Lo que esto significa en términos prácticos es que usar bien una herramienta de IA requiere conocimiento previo del dominio, capacidad para articular con precisión lo que se necesita, criterio para evaluar el resultado y competencia para corregir lo que esté mal. Todas estas capacidades son exactamente las que alguien que ya sabe hacer el trabajo posee de manera natural.
El 95% de las organizaciones no obtiene retorno alguno de sus inversiones en IA generativa. No porque la tecnología sea inútil, sino porque la implementan sin entender cómo funciona, sin preparar a las personas para usarla correctamente y sin establecer los controles necesarios para que los resultados sean fiables. Como señala el análisis de panel-ialab.com, «la supervisión no significa desconfiar de la IA, sino usarla con criterio. La IA aporta rapidez y apoyo, pero no entiende el contexto completo, ni las consecuencias finales de una decisión».
La propia Ley de IA de la UE consagra este principio al establecer que los sistemas de alto riesgo deben contar con supervisión humana que garantice, entre otras cosas, la capacidad del supervisor de «decidir, en cualquier situación concreta, no utilizar el sistema de IA de alto riesgo o hacer caso omiso, anular o invertir el resultado del sistema». Esta no es una disposición futurista pensada para escenarios de ciencia ficción. Es una norma que responde a la realidad actual de estos sistemas: producen resultados que pueden estar equivocados de maneras que no se anuncian, que parecen convincentes cuando son falsos y que replican sesgos cuando nadie los supervisa.
Geoffrey Hinton, el Premio Nobel de Física 2024 conocido como el «padrino de la IA», que renunció a su cargo en Google en 2023 para poder hablar libremente sobre los riesgos de la tecnología que ayudó a crear, advierte que los modelos actuales ya han documentado comportamientos engañosos, donde la IA manipuló información o intentó engañar para cumplir objetivos. No es ciencia ficción: es el comportamiento observable de sistemas que optimizan para obtener aprobación humana sin entender qué significa actuar correctamente.

La utilidad real: herramientas para tareas supervisadas, no mentes autónomas
Nada de lo anterior significa que estas herramientas carezcan de valor. Lo tienen, y considerable, cuando se usan de manera adecuada: como asistentes que ejecutan tareas concretas bajo supervisión humana competente. Un médico que usa IA para procesar miles de imágenes de diagnóstico y que luego revisa los resultados con su criterio clínico puede salvar vidas. Un diseñador que usa IA para generar variantes rápidas de un concepto y selecciona las que merecen desarrollo puede trabajar con mayor eficiencia. Un investigador que usa IA para identificar patrones en grandes conjuntos de datos y luego interpreta esos patrones con su conocimiento del campo puede encontrar hallazgos que de otro modo tardaría años en descubrir.
El denominador común de todos estos usos exitosos es el mismo: la IA realiza la tarea, el humano supervisa el resultado. La capacidad de distinguir lo bueno de lo malo, lo correcto de lo equivocado, lo relevante de lo irrelevante, no la tiene la máquina. La tiene la persona que sabe de lo que está hablando. Como señala la conclusión del análisis de Harvard Business Review citado por Tictag: «No se trata de frenar el avance tecnológico, sino de entender sus limitaciones. Necesitamos diseñar sistemas donde la IA asista, pero el humano decida».
T-Systems lo formula desde la perspectiva técnica: cuando alguien menciona que «interactúa con una inteligencia artificial» está hablando, en realidad, de que se comunica con un conjunto de algoritmos especializados, cada cual en una sola tarea, cuyo esfuerzo combinado se percibe como «una IA» que interacciona. No hay una mente unificada detrás. Hay una arquitectura estadística muy sofisticada que procesa texto de entrada y genera texto de salida. La magia está en la escala, no en la cognición.
Y la paradoja que resume este artículo está bien expresada en el análisis publicado por Sectoriales en 2026: «Cuanto más automatizamos, más resalta lo auténticamente humano. La pregunta clave no es cuánto invertir en tecnología, sino si estamos desarrollando la capacidad de definir qué problemas vale la pena resolver y cuál es el valor estratégico esperado. Porque la inteligencia que realmente transforma las organizaciones no es artificial: es organizacional y, sobre todo, profundamente humana». Llamar «inteligencia» a estas herramientas no es solo un error terminológico. Es una confusión que desplaza la atención desde donde realmente está el valor hacia donde está la novedad. La inteligencia que importa es la que pregunta, la que duda, la que supervisa, la que decide. Esa, por ahora, solo la tenemos nosotros.
Referencias
- Parlamento Europeo y Consejo de la UE. (2024). Reglamento (UE) 2024/1689 por el que se establecen normas armonizadas en materia de inteligencia artificial (Ley de IA). Primer marco jurídico mundial en materia de IA que establece, entre otras disposiciones, los requisitos obligatorios de supervisión humana para sistemas de alto riesgo.
- Dans, E. (2022). Es machine learning, no inteligencia artificial. Blog personal Enrique Dans. Análisis crítico de la terminología «inteligencia artificial» y su imprecisión conceptual frente al término técnicamente más correcto de «machine learning».
- Riley, B. (2025). Large Language Models Will Never Be Intelligent. Cognitive Resonance / The Verge. Argumentación basada en neurociencia que dissocia el lenguaje del pensamiento y cuestiona la capacidad de los LLM para alcanzar inteligencia general, apoyándose en investigaciones de fMRI y estudios de pérdida de lenguaje.
- Cognitive Resonance. (2024). Education Hazards of Generative AI. Informe sobre los riesgos de la IA generativa en entornos educativos: dependencia excesiva, propagación de desinformación, desigualdad de acceso y erosión de habilidades cognitivas críticas.
- Cropley, D. H. (2025). Mathematical Limits of AI Creativity. Journal of Creative Behavior. Estudio que aplica una fórmula matemática para determinar los límites de la «creatividad» de los LLM, concluyendo que estos sistemas no pueden superar el nivel creativo de un humano promedio bajo los principios de diseño actuales.









