Trigrama
Los trigramas son un caso especial del n-grama, donde n es 3. A menudo se utilizan en el procesamiento del lenguaje natural para realizar análisis estadísticos de textos y en criptografía. para el control y uso de cifrados y códigos.
Frecuencia
El contexto es muy importante, las distintas clasificaciones y porcentajes de análisis se derivan fácilmente a partir de diferentes tamaños de muestra, diferentes autores; o diferentes tipos de documentos: poesía, ciencia ficción, documentación tecnológica; y niveles de escritura: cuentos para niños versus adultos, órdenes militares y recetas.
El análisis de frecuencia criptoanalítico típico encuentra que los 16 trigramas de nivel de carácter más comunes en inglés son:
Rank | Trigram | Frecuencia (Diferente fuente) |
---|---|---|
1 | el | 1.81% |
2 | y | 0,73% |
3 | tha | 0,33% |
4 | ent | 0,42% |
5 | ing | 0,72% |
6 | ion | 0,42% |
7 | Tio | 0,31% |
8 | para | 0,34% |
9 | nde | |
10 | tiene | |
11 | nce | |
12 | edt | |
13 | Tis | |
14 | oft | 0,22% |
15 | sth | 0.21% |
16 | hombres |
Debido a que los mensajes cifrados enviados por telégrafo a menudo omiten la puntuación y los espacios, el análisis de frecuencia criptográfica de dichos mensajes incluye trigramas que se extienden a ambos lados de los límites de las palabras. Esto hace que trigramas como "edt" ocurrir con frecuencia, aunque puede que nunca ocurra en ninguna palabra de esos mensajes.
Ejemplos
Showing translation forThe sentence "the quick red fox jumps over the lazy brown dog " has the following word-level trigrams:
el rojo rápido zorro rojo rápido zorro rojo salta Fox salta sobre saltos sobre el sobre el perezoso el perezoso marrón perritoDid you mean:
And the word-level trigram "the quick red " has the following character-level trigrams (where an underscore "" marks a space):
el Él... e_q ¿Qué? qui uic . # k_r ¡No! rojo
Contenido relacionado
Grado de distorsión isócrona
Conmutación de ráfagas
El ordenador contradictorio