BURSTINESS ANALYSIS
El Análisis de Ráfaga (Burstiness Analysis) es una métrica de Procesamiento de Lenguaje Natural (NLP) que evalúa la variabilidad rítmica y estructural de las oraciones en un documento. En la detección forense, una alta ráfaga (frases muy largas mezcladas con frases muy cortas) indica autoría humana dinámica y caótica, mientras que una baja ráfaga revela la sintaxis uniforme y monótona típica de los Grandes Modelos de Lenguaje (LLMs).
Un texto generado por IA es el equivalente literario a un metrónomo. Nunca se cansa, nunca se emociona y jamás altera su ritmo base. Los humanos, por el contrario, escribimos en explosiones de inspiración. Redactamos una frase inmensamente compleja con múltiples cláusulas subordinadas para explicar un concepto difícil, seguida inmediatamente por una frase corta de tres palabras. Corta. Directa. Así. Las máquinas no saben improvisar este caos.
01. La Mecánica del Caos Estructural
Los Grandes Modelos de Lenguaje (LLMs) están alineados mediante aprendizaje por refuerzo para ser claros, concisos y útiles. Como efecto secundario de esta optimización, generan documentos donde casi todas las oraciones tienen una longitud estadísticamente similar (baja varianza).
El Burstiness Score mide precisamente esta entropía estructural. Un motor de análisis divide el texto en oraciones individuales y calcula la desviación estándar de la longitud de los tokens, cruzándolo con la complejidad gramatical. Si el gráfico resultante es una línea casi plana, el documento ha sido sintetizado. Si presenta picos y valles extremos, el autor respira, duda y siente.
# Motor Analítico: Extracción de Varianza Estructural (Burstiness) import nltk import numpy as np def calculate_burstiness_variance(document_text): # 1. Tokenización del corpus en oraciones individuales sentences = nltk.sent_tokenize(document_text) # 2. Extracción de longitud de tokens por oración sentence_lengths = [len(nltk.word_tokenize(sent)) for sent in sentences] # 3. Computar Desviación Estándar (Varianza del Ritmo) burstiness_score = np.std(sentence_lengths) mean_length = np.mean(sentence_lengths) # 4. Índice de Coeficiente de Variación (CV) cv_index = burstiness_score / mean_length if cv_index < 0.25: print("[!] Ritmo Monótono Detectado. Alta probabilidad de IA.") return "LOW_BURSTINESS (SYNTHETIC)" return "HIGH_BURSTINESS (HUMAN)"
02. Vectores de Detección (Casos de Uso)
El análisis de Burstiness es el contramedida forense más letal contra atacantes que intentan "ofuscar" textos generados por IA:
- Bypass de Prompts "Actúa como Humano": Un atacante puede pedirle a ChatGPT que escriba con faltas de ortografía o en un tono informal. Sin embargo, el LLM mantendrá su métrica de ráfaga predeterminada. Alterar el vocabulario no altera la monotonía estructural profunda.
- Auditoría Contractual (IP Fraud): En litigios por infracción de derechos de autor, el análisis de Burstiness de un documento legal permite demostrar si una cláusula específica fue generada por una máquina, careciendo del flujo argumentativo denso y variable típico de un abogado.
- Validación de "AI Humanizers": Herramientas como QuillBot intentan evadir la detección inyectando sinónimos aleatorios. El Burstiness expone que, aunque las palabras sean extrañas, el esqueleto del párrafo sigue siendo un bloque uniforme y robótico.
03. El Binomio Definitivo
La métrica de Burstiness es poderosa, pero alcanza su grado de certeza militar cuando se triangula con su métrica hermana: el Perplexity Score. Un documento con baja Perplejidad (palabras predecibles) y bajo Burstiness (frases de idéntica longitud) es, matemáticamente y sin margen de error, un texto generado artificialmente. ScanTrue AI fusiona ambos modelos junto a pruebas de Autenticidad Semántica para garantizar dictámenes libres de falsos positivos.
Perplejidad y Ráfaga: Cazando a los LLMs
Descubre la matemática exacta que utilizan los peritos forenses para anular informes académicos y contratos generados por inteligencia artificial.
LA VERDAD ES ESCANEABLE
Verifica la entropía estructural de tus documentos. Sube el archivo a nuestro motor forense y detecta el ritmo monótono de la IA en segundos.
Analizar Ritmo Estructural