Cómo identificar si alguien ha usado ChatGPT en un texto

Desde redactar artículos, pasar exámenes de admisión universitaria, hasta componer poesía y código de programación, ChatGPT demuestra una flexibilidad y versatilidad que abre nuevas posibilidades y plantea interrogantes en igual medida. ¿Es posible identificar sus creaciones?
Cómo identificar si alguien ha usado ChatGPT en un texto

La relevancia de ChatGPT en el ámbito de la generación de texto automatizado no puede subestimarse. Su capacidad para entender y generar lenguaje natural ha encontrado aplicaciones en una amplia gama de campos, desde la automatización de respuestas en servicios de atención al cliente hasta la asistencia en la escritura creativa y técnica. Sin embargo, esta capacidad también trae consigo desafíos importantes, especialmente en lo que respecta a la autenticidad y la originalidad del contenido generado.

Identificar textos generados por IA se ha convertido en una necesidad en diversos contextos. En el ámbito académico, por ejemplo, es fundamental para mantener la integridad de los trabajos y asegurar que los estudiantes desarrollen y demuestren sus habilidades de investigación y escritura. En el ámbito profesional, diferenciar entre contenido creado por humanos y por IA puede influir en la toma de decisiones, la credibilidad de la información y la propiedad intelectual. En el campo creativo, aunque la IA puede ser una herramienta para inspirar y asistir en el proceso creativo, reconocer la autoría y la contribución humana sigue siendo esencial para valorar el arte y la literatura.

Cómo identificar si alguien ha usado ChatGPT en un texto. Foto: Istock

Por tanto, la capacidad de identificar si un texto ha sido generado por ChatGPT o por una inteligencia artificial similar se ha vuelto una habilidad crítica. No solo para proteger valores académicos y profesionales, sino también para navegar con confianza en un paisaje mediático cada vez más influenciado por la tecnología de generación de texto automatizado. Este artículo busca explorar métodos y señales que pueden ayudar a distinguir entre el ingenio humano y la destreza artificial, un desafío creciente en la era digital.

Entendiendo a ChatGPT

ChatGPT, desarrollado por OpenAI, es un modelo de inteligencia artificial especializado en procesamiento de lenguaje natural (PLN) que se basa en la arquitectura de los Transformadores (Transformer). Esta arquitectura permite al modelo prestar atención a diferentes partes de un texto para generar respuestas coherentes y contextuales. La "magia" detrás de ChatGPT y otros modelos GPT (Generative Pre-trained Transformer) radica en su método de entrenamiento y funcionamiento.

ChatGPT es entrenado en un vasto corpus de texto recopilado de internet, libros, artículos y otros medios. Durante este entrenamiento, el modelo aprende patrones de lenguaje, estructuras gramaticales, conocimiento factual y estilos de escritura. Esta fase de entrenamiento previo es fundamental, ya que dota al modelo de una base de conocimiento general sobre el mundo y el lenguaje humano.

Después del entrenamiento previo, ChatGPT puede ser ajustado mediante técnicas de aprendizaje automático para tareas específicas. Esto significa que, además de su entrenamiento general, puede recibir entrenamiento adicional para mejorar en áreas específicas, como conversaciones técnicas, escritura creativa o asistencia al cliente.

Al generar texto, ChatGPT evalúa millones de posibilidades basándose en el prompt (instrucción inicial) que recibe, seleccionando la secuencia de palabras que considera más probable y adecuada para la continuación del texto. Esto se logra mediante la evaluación de la probabilidad de secuencias de palabras, teniendo en cuenta no solo la coherencia y relevancia con el prompt, sino también el estilo y tono del texto solicitado.

Aunque la generación de texto con ChatGPT es muy sencilla, su identificación puede no serlo tanto. Foto: Juan Diego Polo

Diferencias clave entre la escritura humana y la generada por IA

Aunque ChatGPT puede imitar de manera impresionante el estilo y la estructura de la escritura humana, existen diferencias clave que pueden ayudar a distinguir entre textos generados por humanos y por IA. Veamos algunas de ellas:

  • Mientras que la escritura humana puede reflejar una profundidad de emoción, experiencias personales y creatividad únicas, los textos generados por IA, aunque coherentes y fluidos, a menudo carecen de esa chispa de originalidad o de un contexto profundo y personal. Los humanos son capaces de tejer experiencias vividas y emociones sutiles en sus escritos, algo que la IA todavía no puede replicar completamente.
  • ChatGPT, a pesar de su avanzado entrenamiento, puede cometer errores en la interpretación del contexto o en el manejo de conocimiento muy específico o actualizado. A veces, genera información que, aunque plausible, puede ser incorrecta o basada en malentendidos del texto fuente.
  • La escritura generada por IA puede caer en repeticiones o usar patrones de fraseo menos variados en comparación con la escritura humana. Los humanos tienden a utilizar una mayor diversidad de vocabulario y estructuras sintácticas, y son más capaces de evitar la redundancia de manera intuitiva.
  • La escritura humana puede incorporar y responder a eventos muy recientes o a información que no estaba disponible durante el entrenamiento del modelo de IA. En cambio, ChatGPT puede no estar al tanto de los acontecimientos o descubrimientos más recientes, limitando su capacidad para generar respuestas actualizadas sobre temas de última hora.

Con estas cuatro diferencias ya tenemos algunas pistas para descubrir si un texto ha sido creado con ChatGPT o no.

Características de los textos generados por ChatGPT

La generación de texto por ChatGPT ha revolucionado la forma en que concebimos la escritura automatizada, ofreciendo resultados que, a primera vista, pueden parecer indistinguibles de los textos humanos. Sin embargo, hay características distintivas y patrones que pueden ayudar a identificar los textos generados por inteligencia artificial. Analizaremos estos aspectos bajo tres categorías principales: estilo y coherencia, repeticiones y patrones, y errores comunes y limitaciones.

Existen distintas claves que pueden ser útiles a la hora de detectar un texto generado por IA. Foto: Istock - iStock

Estilo y Coherencia

Una de las señales más reveladoras de un texto generado por IA es una coherencia y uniformidad excesivas en el estilo. ChatGPT mantiene un nivel de cohesión muy alto a lo largo del texto, algo que, aunque deseable en ciertos contextos, puede parecer poco natural comparado con la escritura humana, que a menudo exhibe variaciones de tono y estilo.

Las transiciones entre oraciones y párrafos en los textos de ChatGPT, por otro lado, suelen ser suaves y lógicas, pero pueden carecer de la creatividad o el ingenio espontáneo que caracteriza a los escritores humanos. La IA tiende a seguir patrones de transición más predecibles y menos variados.

Repeticiones y patrones

Una característica común de los textos generados por ChatGPT es la repetición de frases o estructuras de oraciones similares dentro de un mismo texto. Esto puede manifestarse como la reutilización de ciertas construcciones sintácticas o vocabulario específico más frecuentemente de lo que normalmente se observaría en la escritura humana.

Aunque ChatGPT es capaz de generar textos con un vocabulario rico y variado, a veces puede elegir palabras o frases que, aunque correctas, pueden parecer inusuales o poco típicas en el contexto dado. Estas elecciones pueden reflejar las limitaciones en su entrenamiento o una comprensión imperfecta de las sutilezas del lenguaje.

Errores comunes y limitaciones de ChatGPT

ChatGPT, a pesar de su avanzada capacidad para procesar y generar lenguaje, a veces puede cometer errores de comprensión, especialmente en contextos complejos o sutiles. Esto puede incluir malinterpretaciones del significado pretendido de una pregunta o prompt, resultando en respuestas que, aunque coherentes, son incorrectas o irrelevantes.

Por otro lado, dado que ChatGPT se entrena en un conjunto de datos que no incluye información en tiempo real, puede mostrar limitaciones al abordar temas muy recientes o en evolución. La incapacidad de referenciar eventos actuales o datos específicos de última hora es una clara señal de contenido generado por IA.

Aunque ChatGPT es capaz de generar contenido que suena convincente, puede caer en inconsistencias fácticas o crear "hechos" que, aunque plausibles, no se basan en información verificable. Esta tendencia a fabricar detalles puede ser especialmente notable en temas altamente específicos o nichos.

Identificar estas características en los textos es esencial en la era de la información en la que vivimos. Al familiarizarnos con las sutilezas de los textos generados por IA, podemos navegar mejor el panorama digital, discerniendo entre la creatividad humana y la generación automatizada de contenido.

Si buscáis alguna herramienta automática que os diga si un texto ha sido generado por ChatGPT o no, no perdáis el tiempo, ninguna de las existentes hoy es infalible, por lo que necesitaremos el olfato humano del que tanto presumimos.

Recomendamos en

Hemos puesto a prueba la función “Estudiar y aprender” de ChatGPT para enseñar a estudiantes de 1º de ESO. Esto es lo que pasó

¿Puede una inteligencia artificial explicar bien matemáticas a un estudiante de 1º de ESO? Este artículo recoge una conversación real con ChatGPT y analiza sus aciertos, sus límites y lo que ocurre cuando imita métodos pedagógicos sin comprenderlos. En el camino, abrimos uno de los debates más antiguos —¿es el cero un número natural o no?— y escuchamos la opinión de un matemático que lo tiene claro… o no tanto.
  • Eugenio M. Fernández Aguilar