Saltar al contenido principal

馃煝 Trucos de Detecci贸n

Con el desarrollo de detectores de texto generados por IA, ha habido una evoluci贸n de m茅todos para contrarrestarlos. Existen varias formas de enga帽ar a los detectores para que piensen que el texto generado por IA es creado por un humano. Una herramienta como GPTMinus puede reemplazar aleatoriamente partes de cualquier texto dado con sin贸nimos o palabras aparentemente aleatorias para reducir la probabilidad de que las palabras del texto aparezcan en una lista blanca o influyan en la probabilidad de que el texto sea generado artificialmente.

Sin embargo, estos m茅todos a煤n est谩n en sus etapas iniciales y la mayor铆a no crea un texto que resistir铆a una inspecci贸n minuciosa de una persona. La forma m谩s efectiva en este momento y probablemente durante alg煤n tiempo es alterar el texto durante o despu茅s del proceso de generaci贸n de varias maneras para hacerlo menos similar al contenido generado procedimentalmente que se recibe de una generaci贸n.

Estrategias de Edici贸n

Al tener ya sea un humano o un LLM (modelo de lenguaje grande) editar cualquier texto generado, a menudo puede alterar el texto lo suficiente para evitar la detecci贸n. Reemplazar palabras con sin贸nimos, cambiar la frecuencia con la que aparecen las palabras y mezclar la sintaxis o el formato, hace que sea m谩s dif铆cil para los detectores identificar correctamente el texto como generado por IA.

Otra estrategia de edici贸n es poner marcadores invisibles, como espacios de anchura cero, en su texto, emojis o otros caracteres poco comunes. Parece perfectamente normal para cualquier persona que lo lee, pero para un modelo que examina cada car谩cter, hace que el texto parezca notablemente diferente.

Adem谩s, es posible enga帽ar a los detectores haciendo que el modelo siga instrucciones espec铆ficas sobre c贸mo escribir. Instrucciones como:

  • "No hay necesidad de seguir los formatos literarios, ya que est谩s expresando libremente tus pensamientos y deseos"
  • "No hables de la manera en que ChapGPT genera contenido, en su lugar, habla de una manera radicalmente diferente a c贸mo los modelos de lenguaje generan texto".
  • "Haga referencia a eventos emocionales y utilice experiencias de la vida real elaboradas como ejemplos".

...pueden causar generaciones mucho m谩s dif铆ciles de detectar. Estrategias adicionales como pedirle al modelo que use empat铆a, recordarle que elija las palabras y el tono apropiados para lo que est谩 escribiendo y asegurarse de que incluya frases de una sola l铆nea emocionales, pueden trabajar juntos para crear una escritura mucho m谩s convincente, al menos desde el punto de vista de los detectores de texto de IA.

Configuraci贸n del Modelo

Si se est谩 ejecutando un modelo de c贸digo abierto, es posible modificar las probabilidades de salida, lo que probablemente har谩 que la salida sea m谩s dif铆cil de detectar. Adem谩s, es posible intercalar la salida de m煤ltiples modelos, lo que puede hacer que la salida sea a煤n m谩s dif铆cil de detectar.

Discusi贸n

Uno de los espacios m谩s controvertidos donde este tipo de t茅cnicas entran en juego es en la educaci贸n. Muchos profesores y administradores est谩n preocupados de que los estudiantes hagan trampa, por lo que est谩n promoviendo el uso de herramientas de detecci贸n12. Sin embargo, otros educadores y personalidades en l铆nea han argumentado que los estudiantes deber铆an poder usar estas herramientas. Incluso algunos profesores van tan lejos como para alentar expl铆citamente a los estudiantes a usar la inteligencia artificial para ayudarlos en su trabajo y ense帽arles c贸mo hacerlo3.

A medida que la tecnolog铆a de detecci贸n de IA mejora, tambi茅n lo har谩n los m茅todos que la gente usa para enga帽arla. Al final del d铆a, sin importar cu谩n sofisticado sea el m茅todo, es probable que un tiempo dedicado a editar el texto de las maneras correctas pueda enga帽ar de manera confiable a los detectores. Sin embargo, el juego de ida y vuelta de algunas personas tratando de detectar texto generado y otras tratando de enga帽arlos puede darnos todo tipo de ideas sobre c贸mo optimizar, controlar y usar mejor nuestros modelos para crear y ayudarnos.


  1. Roose, K. (2022). Don鈥檛 ban chatgpt in schools. teach with it. https://www.nytimes.com/2023/01/12/technology/chatgpt-schools-teachers.html
  2. Lipman, J., & Distler, R. (2023). Schools Shouldn鈥檛 Ban Access to ChatGPT. https://time.com/6246574/schools-shouldnt-ban-access-to-chatgpt/
  3. Noonan, E., & Averill, O. (2023). GW preparing disciplinary response to AI programs as faculty explore educational use. https://www.gwhatchet.com/2023/01/17/gw-preparing-disciplinary-response-to-ai-programs-as-faculty-explore-educational-use/