Crean una herramienta capaz de identificar con más de un 99 % de precisión que un texto científico lo ha escrito una IA

Se trata de un detector de textos muy especializado, pues los existentes hasta la fecha eran de tipo generalista.
Chatbot mano mujer

ChatGPT genera textos y conversaciones en un lenguaje muy parecido al humano y eso tiene su lado bueno y su lado malo. El bueno es que puede ayudar a las personas a realizar ciertas tareas tediosas de su trabajo y el malo es que, de tan parecido que es el lenguaje empleado, se hace complicado distinguir que el texto lo ha redactado una inteligencia artificial.

Lo que vieron los investigadores fue que humanos y AI escribimos de manera distinta. - iStock

Por ese motivo, la misma empresa creadora de ChatGPT, OpenAI, ha desarrollado una herramienta que distingue el texto creado por un robot del que ha sido ideado por un ser humano. Su nombre es OpenAI AI Text Classifer y usarla es gratis.

Con este mismo objetivo de distinguir un texto generado con IA de otro escrito por un humano, un grupo de investigadores se propuso idear una herramienta que hiciera esta distinción, pero a nivel académico, es decir, que indicara que un texto científico académico estuviera escrito por un chatbot o por una persona. Los investigadores han logrado que la herramienta tenga una precisión superior al 99 %.

"Nos esforzamos por crear un método accesible para que, con poca orientación, incluso los estudiantes de secundaria pudieran construir un detector de IA para diferentes tipos de escritura", afirma la primera autora, Heather Desaire, profesora de la Universidad de Kansas. "Es necesario abordar la escritura con IA, y la gente no necesita un título en informática para contribuir a este campo".

"Ahora mismo, hay algunos problemas bastante flagrantes con la escritura de IA", dice Desaire. "Uno de los mayores problemas es que ensambla texto de muchas fuentes y no hay ningún tipo de comprobación de exactitud".

En Internet existen detectores de texto que funcionan bastante bien y, ahora, además contamos con OpenAI AI Text Classifer. Sin embargo, estos detectores no están diseñados específicamente para la escritura académica. Para rellenar esa laguna, el equipo se propuso crear una herramienta de detección ad hoc.

Los investigadores se centraron en un tipo de artículos que en ciencia se llaman artículos de perspectiva. Estos escritos ofrecen una visión general de temas de investigación específicos escritos por científicos. El equipo seleccionó 64 de estos y creó 128 artículos con ChatGPT sobre los mismos temas de investigación para entrenar al modelo. Cuando compararon los artículos, descubrieron un indicador de la escritura de la IA: la previsibilidad.

Lo que vieron los investigadores fue que humanos y AI escribimos de manera distinta. Se dieron cuenta de que los seres humanos empleamos estructuras de párrafos más complejas, variando el número de frases y el total de palabras por párrafo. Las preferencias en cuanto a signos de puntuación y vocabulario también son reveladoras. Por ejemplo, los científicos se inclinan por palabras como "sin embargo", "pero" y "aunque", mientras que ChatGPT utiliza a menudo "otros" e "investigadores" en sus escritos. El equipo reunió 20 características que el modelo debía tener en cuenta.

En la prueba, el modelo que desarrollaron obtuvo una precisión del 100 % a la hora de distinguir los artículos generados por la IA de los escritos por humanos. En cuanto a la identificación de párrafos individuales dentro del artículo, el modelo obtuvo una tasa de precisión del 92 %. En pruebas similares también superó con creces a un detector de texto por IA disponible en el mercado.

Ahora, el equipo quiere probar la herramienta en conjuntos de datos más amplios y en distintos tipos de escritos científicos académicos. Quieren comprobar si con el avance de los chatbots de IA, su modelo seguirá funcionando.

A medida que los chatbots de IA avancen y se vuelvan más sofisticados, los investigadores también quieren saber si su modelo seguirá siendo eficaz.

"Lo primero que la gente quiere saber cuando se entera de la investigación es: '¿Puedo utilizar esto para saber si mis alumnos han escrito de verdad su trabajo?”, dice Desaire. Aunque el modelo es muy hábil a la hora de distinguir entre IA y científicos, la investigadora afirma que la herramienta no se diseñó para que los profesores detectaran las redacciones de los alumnos generadas por IA. Sin embargo, señala que la gente puede replicar fácilmente sus métodos para construir modelos para sus propios fines.

Referencia: Desaire, H., Chua, A. et. al. 2023. Distinguishing academic science writing from humans or ChatGPT with over 99% accuracy using off-the-shelf machine learning tolos. Cell Reports Physical Science. DOI: https://doi.org/10.1016/j.xcrp.2023.101426

Recomendamos en

Hemos puesto a prueba la función “Estudiar y aprender” de ChatGPT para enseñar a estudiantes de 1º de ESO. Esto es lo que pasó

¿Puede una inteligencia artificial explicar bien matemáticas a un estudiante de 1º de ESO? Este artículo recoge una conversación real con ChatGPT y analiza sus aciertos, sus límites y lo que ocurre cuando imita métodos pedagógicos sin comprenderlos. En el camino, abrimos uno de los debates más antiguos —¿es el cero un número natural o no?— y escuchamos la opinión de un matemático que lo tiene claro… o no tanto.
  • Eugenio M. Fernández Aguilar

Así resuelve ChatGPT el dilema del tranvía: la respuesta definitiva

¿Salvarías a cinco personas sacrificando a una? ChatGPT se enfrenta al dilema ético más famoso de la filosofía… y lo llevamos al límite: le pedimos que decida sabiendo que esa única vida en peligro es la suya. Esta es su respuesta. Y lo que revela dice mucho más sobre nosotros que sobre la máquina.
  • Eugenio M. Fernández Aguilar

Una nueva IA logra detectar autismo y TDAH en solo 15 minutos con asombrosa precisión, según una publicación científica

Un nuevo estudio demuestra que una IA puede analizar el movimiento de la mano con sensores milimétricos y clasificar con más del 70 % de precisión si una persona tiene autismo, TDAH o ambos. Además, permite medir la severidad del trastorno mediante biomarcadores como la entropía y el Factor de Fano, abriendo la puerta a diagnósticos más rápidos, objetivos y personalizables.
  • Eugenio M. Fernández Aguilar