Hay un dato que la conversación pública sobre inteligencia artificial en la educación todavía no ha asimilado, y conviene decirlo de frente: la IA no ha hecho trampa en los exámenes universitarios. Ha hecho visible que los exámenes universitarios eran tramposos.
Durante años, las universidades —en España, en Argentina, en casi todas partes— han venido evaluando lo que es fácil de medir: la capacidad de reproducir contenidos, resolver ejercicios cerrados, redactar piezas con estructura previsible. Eso es, en términos estrictos, trabajo operativo. Es la parte de cualquier disciplina que se puede formalizar, automatizar y, ahora, delegar a una máquina. Cuando un estudiante de derecho memoriza la jerarquía de fuentes, cuando uno de filosofía resume la Ética a Nicómaco, cuando uno de medicina enuncia los criterios diagnósticos del DSM, está haciendo una tarea que un modelo de lenguaje hoy resuelve con más velocidad, más precisión y, en algunos casos, mejor estilo.
La pregunta no es si los estudiantes están haciendo trampas con la IA. La pregunta es por qué, durante décadas, llamábamos "examen" a algo que una máquina sin sujeto puede aprobar. Si una operación cognitiva se puede automatizar, no era una operación cognitiva: era un procedimiento. Y los procedimientos no se examinan. Se ejecutan.
Lo que la IA está haciendo —sin proponérselo, como efecto lateral— es desnudar la diferencia entre lo operativo y el criterio. Y esa diferencia es exactamente lo que la universidad olvidó enseñar.
Qué es el criterio
Llamo criterio a algo muy concreto, no a una abstracción humanista. Es la capacidad de hacer cuatro cosas que ningún sistema automatizado puede hacer hoy, y probablemente no podrá hacer mañana sin un cambio de naturaleza:
Distinguir evidencia de fluidez
Cuando un modelo escribe que "Foucault sostiene que el panóptico es la metáfora central de la modernidad disciplinaria," lo hace con sintaxis impecable. La pregunta operativa —si la frase es gramatical— la resuelve la máquina mejor. La de criterio es otra: ¿en qué obra, en qué página, en qué traducción está sostenida exactamente esa formulación? Y si no está, ¿qué hay realmente en su lugar? El criterio empieza donde termina la fluidez.
Saber abstenerse
La máquina no sabe abstenerse. Si le preguntas algo que no sabe, te responde igual, con la misma confianza. Es estructuralmente incapaz de decir no sé. No es un defecto técnico: es la consecuencia directa de que su función es producir el siguiente token probable, no decir la verdad. Saber abstenerse —saber dónde uno se queda corto— es la primera virtud intelectual. Y es lo contrario de lo que evaluamos hoy, donde quien escribe diez páginas saca mejor nota que quien escribe dos diciendo aquí no tengo elementos para concluir.
Distinguir tipos de afirmación
Una afirmación verificable ("Lacan publicó Escritos en 1966"), una interpretativa ("Lacan considera que el lenguaje precede al sujeto"), una argumental ("la teoría lacaniana puede aplicarse a los LLMs") y una especulativa ("Lacan habría reconocido en los LLMs su propio descubrimiento") tienen estatus epistémicos completamente distintos. La máquina las produce todas con el mismo registro, sin marcar la frontera. El criterio es, en buena medida, la capacidad de marcar esa frontera.
Firmar
Asumir, frente a una afirmación, la responsabilidad de sostenerla en público —ante un tribunal, una comunidad, un editor, un alumno. La máquina no firma porque no tiene sujeto. Si un texto producido por IA contiene un error grave, no hay nadie a quien pedirle cuentas. La firma es lo que convierte el texto en acto. Y la universidad, cuando funciona bien, es la institución que enseña a firmar.
Estas cuatro capacidades —distinguir evidencia de fluidez, saber abstenerse, marcar el estatus de las afirmaciones, asumir responsabilidad de firma— no son un complemento humanístico añadido al saber técnico. Son el saber. Lo demás es procedimiento. Y los procedimientos, hoy, los ejecuta la máquina mejor que nosotros.
Por qué la universidad está perdida
He hablado en los últimos meses con profesores de varias instituciones. La descripción es repetitiva. La IA ha entrado en sus aulas sin pedir permiso. Los estudiantes la usan para todo: resúmenes, ensayos, traducciones, ejercicios, exámenes domiciliarios. Algunos profesores la prohíben, sabiendo que la prohibición es inverificable. Otros la integran sin saber muy bien cómo. La mayoría no sabe qué hacer.
En marzo describí en estas mismas páginas cómo dos herramientas aparecidas en la misma semana —OpenMAIC, liberada por Tsinghua, y Wondering, creada por un ex-ingeniero de NotebookLM— estaban convirtiendo cualquier tema en una experiencia de aprendizaje personalizada por menos de dos dólares. Producir un MOOC cuesta veinticinco mil euros y cien horas. Generar una sesión de tutor IA cuesta menos de dos dólares y treinta minutos. La asimetría no es un problema técnico que vaya a resolverse: es la nueva línea base. Y la universidad todavía no se ha enterado.
La parálisis es comprensible, pero diagnosticarla requiere honestidad. La universidad está perdida no porque la IA haya llegado demasiado rápido. Está perdida porque la IA ha hecho visible que buena parte de lo que evaluábamos era reproducible sin pensar. Si una máquina sin sujeto puede aprobar un examen, lo que medía ese examen no era pensamiento — era reproducción. Y la respuesta institucional no puede ser prohibir la máquina. Tiene que ser cambiar el examen.
Esto exige cosas que la universidad como institución no quiere oír. Exige reconocer que muchas asignaturas estaban midiendo lo equivocado durante décadas. Exige rediseñar formas de evaluación que sean caras —porque examinar criterio es caro: requiere conversación sostenida, defensa argumentada, lectura cuidadosa de un texto corto en lugar de marcar a vuelo de pájaro un texto largo. Exige formar profesores que sepan distinguir entre el output fluido de un modelo y el pensamiento sostenido de un estudiante. Y exige aceptar que durante un período de transición —cinco años, diez años— las titulaciones van a tener que reformarse de fondo o quedar marcadas como obsoletas.
Nada de esto va a ocurrir solo. Y no va a ocurrir desde dentro de las facultades, donde cada departamento defiende su statu quo. Va a ocurrir, si ocurre, desde una posición que hoy casi no existe: la del articulador entre lo técnico y lo humanístico, alguien que conoce las dos lenguas y puede traducir entre ellas. En la mayoría de las universidades europeas y latinoamericanas, esa posición no tiene cargo, no tiene presupuesto, no tiene departamento. Y es exactamente lo que la situación actual exige.
El falso debate sobre prohibir o permitir
La discusión pública sobre IA en la universidad sigue atrapada en una falsa dicotomía: ¿prohibirla o permitirla? Es una discusión inútil.
Prohibir
Técnicamente inverificable y socialmente regresivo: castiga al estudiante torpe que copia y pega, premia al hábil que la usa con disimulo.
Permitir sin más
Sin pensar el rediseño de la evaluación es renunciar a evaluar. La máquina aprueba el examen — el examen pierde sentido.
La pregunta correcta es otra: ¿qué tiene sentido seguir enseñando, cómo, y cómo se evalúa?
Mi respuesta tentativa, que ofrezco para discusión y no como dogma, tiene tres partes.
Lo operativo se enseña y se evalúa con IA, no contra ella. Si la tarea es resumir, traducir, calcular, redactar una carta formal — el estudiante usa el modelo, lo declara, y se evalúa otra cosa: la capacidad de detectar errores en lo que el modelo produjo, de mejorarlo, de juzgar si su output sirve para el propósito. Eso ya es criterio aplicado a lo operativo, y es enseñable.
El criterio se enseña en formato pequeño, dialógico, sostenido, y caro. No hay manera barata de enseñar a abstenerse, a marcar el estatus de una afirmación, a defender una lectura. Requiere lo que la universidad medieval ya tenía y la universidad masificada perdió: la conversación sostenida entre alguien que sabe y alguien que aprende, sobre un texto concreto, durante el tiempo necesario.
Esa conversación puede ocurrir hoy de maneras distintas —cara a cara en un seminario, en defensas asíncronas grabadas con feedback puntual, en intercambios escritos extensos sobre un texto, en peer review estructurado entre estudiantes con protocolo— pero tiene que ser conversación real: con respuesta, con pregunta de vuelta, con corrección. Lo que no se puede sustituir es la presencia de alguien que sostiene una posición frente al estudiante, porque la máquina no la sostiene: solo produce.
La universidad necesita herramientas específicas, construidas para esta tarea, no productos genéricos importados desde Silicon Valley. ChatGPT no es una herramienta universitaria —es un producto de consumo masivo entrenado para complacer al usuario. Una herramienta universitaria sería un sistema que se abstuviera por diseño cuando no tiene archivo que lo sostenga, que distinguiera tipos de afirmación, que separara cita literal de lectura interpretativa, que hiciera visible al estudiante el itinerario por el cual una respuesta llega a serlo.
Ese tipo de herramienta no existe en el mercado. Hay que construirla. Y construirla requiere exactamente la traducción entre lo técnico y lo humanístico de la que hablábamos. Es ahí donde Ateneo, el sistema sobre el que llevo año y medio trabajando, intenta ser una prueba de concepto. No el producto. Una prueba de que se puede hacer.
¿Y la educación para todos?
Aquí surge una pregunta política inmediata, que conviene nombrar antes de que la nombre otro contra este texto: ¿significa esto renunciar a la educación universitaria para todos?
La respuesta honesta es que la pregunta está mal planteada. La universidad masificada ya estaba estratificada antes de la IA. Las universidades de élite siempre ofrecieron tutoría individualizada; las universidades públicas masificadas ofrecieron clases de doscientas personas y MOOCs. La IA no creó esa diferencia, pero sí la profundiza: hoy la educación operativa es virtualmente gratis —cualquiera puede aprender a programar, a traducir, a redactar, con un modelo de lenguaje y conexión— mientras que la educación de criterio sigue siendo cara, lenta y artesanal.
La cuestión política no es cómo enseñar criterio al conjunto del estudiantado con presupuesto cero. Eso no se puede. Es decidir cuánta capa fina de criterio recibe cada estudiante, y construir formatos intermedios que escalen sin volverse pasivos: peer review estructurado entre estudiantes con protocolo, defensas asíncronas grabadas con feedback de profesor, anotación dialógica colectiva de textos comunes, exámenes orales breves alternados con escritos largos. No es lo mismo que la conversación uno a uno con un maestro. Pero está mucho más cerca del criterio que un MOOC pasivo. Es la frontera donde se está librando la batalla, y donde se pierde si nadie la nombra.
Una digresión personal
Un catedrático de informática, reciente Premio Nacional1, me dijo en una conversación reciente algo que conviene retener: que el oficio de programador probablemente se reduzca pero no desaparezca, porque siempre alguien tendrá que revisar; que los profesores universitarios están perdidos y acuden a él para saber qué hacer; que la propia universidad está perdida; y que el lugar que él, desde la informática, ha ocupado durante décadas —el lugar bisagra entre lo técnico y la institución— necesita ser ocupado ahora desde las humanidades, pero que ese lugar genera poco trabajo. Solo unos cuantos serán necesarios.
Esa frase última, dicha con el realismo del que ha pasado treinta años en universidades, conviene tomarla en serio. Esta función no es una nueva profesión de masas. Es una posición estrecha, exigente, que requiere conocer las dos lenguas y poder hablarlas con autoridad ante interlocutores muy distintos: rectores, decanos, ingenieros, filósofos, programadores, profesores. Hace falta poca gente. Pero hace falta que sea muy buena.
Y eso, que parece desalentador, es en realidad la noticia más interesante. Porque significa que el trabajo no es construir un mercado masivo de "consultores de IA en humanidades" —cosa que, si llegara, vendría llena de oportunismo y de ruido. El trabajo es ocupar bien unos pocos puestos clave, en algunas universidades concretas, durante el período crítico en el que las instituciones reformulan qué van a evaluar y cómo. Es una ventana de oportunidad estrecha y temporal. Quien la ocupe ahora, en serio, tendrá un peso desproporcionado en lo que la universidad sea dentro de diez años.
Qué pediría yo, si pudiera pedir algo
Si pudiera dirigirme a un rector, a una decana, a un consejo de gobierno universitario, pediría tres cosas concretas, no abstractas.
Que cada facultad designe a una persona —solo una, pero específica— responsable de pensar la integración de IA en evaluación y docencia. Con tiempo descargado de docencia, con interlocutor claro en el rectorado, con acceso a ingeniería y a humanidades. Que coordine entre las tres orillas: rectorado, ingeniería, humanidades.
Que se asigne un fondo estable a construir o adquirir herramientas específicas: sistemas de IA configurables, auditables, con capacidad de abstención, entrenables sobre los corpus propios de la institución. No suscripciones a productos de consumo masivo.
Que se rediseñe la evaluación de las titulaciones en humanidades, ciencias sociales y derecho, sustituyendo progresivamente lo operativo —resúmenes, comentarios, ensayos largos sin defensa— por formatos que evalúen criterio: lectura cuidadosa de textos cortos, defensas argumentadas (orales o escritas), detección de errores en outputs producidos por IA, ejercicios de abstención motivada, conversaciones evaluadoras grabadas, peer review estructurado. Esto no es objetivo de mandato siguiente. Es objetivo de este curso académico y el siguiente, si la universidad quiere llegar a tiempo.
Estas tres peticiones no son nuevas en este texto: cubren exactamente las tres capas que el diagnóstico de marzo dejó abiertas. Verificación de fuentes en dominios humanísticos — eso es la herramienta del segundo punto. Evaluación de pensamiento complejo — eso es el rediseño del tercer punto. Reformulación curricular que asuma que explicar ya no es el cuello de botella, pensar sí lo es — eso es la coordinación del primer punto. El diagnóstico era abstracto; las peticiones son concretas. Pasar de uno a otro es exactamente el trabajo de la traducción entre las dos lenguas.
Coda: por qué no es solo un problema técnico
Hay una tentación, cuando se habla de IA en la universidad, de pasar inmediatamente al lenguaje de la "competencia digital", la "alfabetización tecnológica", el "uso responsable". Es lenguaje de informe. No nombra el problema.
El problema no es tecnológico. Es que la universidad europea —y en alguna medida también la latinoamericana— construyó durante el siglo XX un modelo de evaluación basado en la presunción de que el alumno escribía solo, contra reloj, con su cabeza. Esa presunción se rompió. No se va a recomponer. Y el debate verdadero no es cómo restaurar las condiciones que la sostenían, sino qué evaluamos ahora que la cabeza del alumno tiene una extensión computacional que nadie le va a quitar.
Eso es una pregunta filosófica antes que técnica. Es una pregunta sobre qué cuenta como pensamiento, qué cuenta como autoría, qué cuenta como formación. Y por eso el cruce entre humanidades y técnica no es opcional. Sin alguien que pueda pensar esto desde las dos orillas, la universidad va a tomar decisiones equivocadas durante años, dictadas por consultoras tecnológicas que no entienden lo que está en juego o por departamentos humanísticos que quieren ignorar el problema con la esperanza de que pase.
No va a pasar.
La carta llegó. Pero no llegó a la dirección correcta. Alguien tiene que leer el sobre antes de declararla entregada, y ese alguien no puede ser una máquina. Tiene que ser una institución que haya decidido, en serio, qué quiere seguir enseñando y por qué.
Esa decisión está pendiente. Está, de hecho, vacía.
Y por eso es el trabajo más urgente que la universidad tiene por delante.
Parte II de un díptico. Parte I: Del MOOC al tutor IA (marzo 2026).