Legomenon Hapax
En lingüística de corpus, un hapax legomena (también o; pl. hapax legomena; a veces abreviado como hapax, plural hapaxes) es una palabra o una expresión que ocurre solo una vez dentro de un contexto: ya sea en el registro escrito de toda una lengua, en las obras de un autor, o en un solo texto. A veces, el término se usa incorrectamente para describir una palabra que aparece solo en una de las obras de un autor, pero más de una vez en esa obra en particular. Hapax legomenon es una transliteración del griego ἅπαξ λεγόμενον, que significa "dicho una vez".
Los términos relacionados dis legomenon, tris legomenon y tetrakis legomenon respectivamente (,) se refieren a ocurrencias dobles, triples o cuádruples, pero se usan con mucha menos frecuencia.
Hapax legomena son bastante comunes, como predice la ley de Zipf, que establece que la frecuencia de cualquier palabra en un corpus es inversamente proporcional a su rango en la tabla de frecuencia. Para grandes corpus, alrededor del 40% al 60% de las palabras son hapax legomena, y otro 10% al 15% son dis legomena. Por lo tanto, en el Brown Corpus of American English, aproximadamente la mitad de las 50.000 palabras distintas son hapax legomena dentro de ese corpus.
Hapax legomenon se refiere a la aparición de una palabra o una expresión en un cuerpo de texto, no a su origen ni a su prevalencia en el habla. Por lo tanto, se diferencia de una palabra nonce, que puede que nunca se registre, puede encontrar moneda y puede registrarse ampliamente, o puede aparecer varias veces en el trabajo que la acuña, y así sucesivamente.
Importancia
Hapax legomena en los textos antiguos suele ser difícil de descifrar, ya que es más fácil inferir el significado de múltiples contextos que de uno solo. Por ejemplo, muchos de los glifos mayas restantes sin descifrar son hapax legomena, y los hapax legomena bíblicos (particularmente hebreos; ver § Ejemplos en hebreo) a veces plantean problemas en la traducción. Hapax legomena también plantea desafíos en el procesamiento del lenguaje natural.
Algunos estudiosos consideran que Hapax legomena es útil para determinar la autoría de obras escritas. P. N. Harrison, en El problema de las epístolas pastorales (1921) popularizó hapax legomena entre los estudiosos de la Biblia, cuando argumentó que hay considerablemente más de ellas en las tres epístolas pastorales. que en otras epístolas paulinas. Argumentó que el número de hapax legomena en el corpus de un autor putativo indica su vocabulario y es característico del autor como individuo.
La teoría de Harrison ha perdido importancia debido a una serie de problemas planteados por otros académicos. Por ejemplo, en 1896, W. P. Workman encontró los siguientes números de hapax legomena en cada epístola paulina:
Pauline Epistle | Hapax legomena |
---|---|
Epístola a los romanos | 113 |
Primera Epístola a los Corintios | 110 |
Segunda epístola a los Corintios | 99 |
Epístola a los Gálatas | 34 |
Epístola a los Efesios | 43 |
Epístola a los Filipenses | 41 |
Epístola a los Colosenses | 38 |
Primera Epístola a los Tesalonicenses | 23 |
Segunda epístola a los tesalonicenses | 11 |
Primera epístola a Timothy | 82 |
Segunda epístola a Timothy | 53 |
Epístola a Titus | 33 |
Epistola a Philemon | 5 |
A primera vista, los últimos tres totales (para las Epístolas Pastorales) no están fuera de línea con los demás. Para tener en cuenta la longitud variable de las epístolas, Workman también calculó el número promedio de hapax legomena por página del texto griego, que oscilaba entre 3,6 y 13, como se resume en el diagrama de la derecha. Aunque las Epístolas Pastorales tienen más hapax legomena por página, Workman encontró que las diferencias son moderadas en comparación con la variación entre otras Epístolas. Esto se reforzó cuando Workman observó varias obras de Shakespeare, que mostraban variaciones similares (de 3,4 a 10,4 por página de la edición de un volumen de Irving), como se resume en el segundo diagrama de la derecha.
Además de la identidad del autor, hay varios otros factores que pueden explicar el número de hapax legomena en una obra:
- longitud del texto: esto afecta directamente al número y porcentaje esperados hapax legomena; la brevedad de las Epístolas Pastorales también hace que cualquier análisis estadístico sea problemático.
- tópico de texto: si el autor escribe sobre diferentes temas, por supuesto, muchas palabras específicas de temas se producirán sólo en contextos limitados.
- audiencia de texto: si el autor está escribiendo a un par en lugar de un estudiante, o su cónyuge en lugar de su empleador, aparecerá un vocabulario muy diferente.
- tiempo: a lo largo de los años, tanto el lenguaje como el conocimiento y uso del lenguaje del autor cambiarán.
En el caso particular de las Epístolas Pastorales, todas estas variables son bastante diferentes de las del resto del corpus paulino, y hapax legomena ya no son ampliamente aceptados como fuertes indicadores de autoría (aunque la autoría de las Pastorales está sujeta a debate por otros motivos).
También hay preguntas subjetivas sobre si dos formas equivalen a "la misma palabra": perro contra perros, pista contra despistado, signo contra firma; también surgen muchos otros casos grises. La Enciclopedia judía señala que, aunque hay 1.500 hapaxes en la Biblia hebrea, solo unas 400 no están obviamente relacionadas con otras formas de palabras atestiguadas.
No sería especialmente difícil para un falsificador construir una obra con cualquier porcentaje de hapax legomena deseado. Sin embargo, parece poco probable que los falsificadores mucho antes del siglo XX hubieran concebido tal estratagema, y mucho menos pensaron que valía la pena el esfuerzo.
Una dificultad final con el uso de hapax legomena para la determinación de la autoría es que existe una variación considerable entre las obras que se sabe que pertenecen a un solo autor, y los autores dispares a menudo muestran valores similares. En otras palabras, hapax legomena no son un indicador confiable. Los estudios de autoría ahora suelen utilizar una amplia gama de medidas para buscar patrones en lugar de depender de medidas únicas.
Ciencias de la computación
En los campos de la lingüística computacional y el procesamiento del lenguaje natural (NLP), esp. lingüística de corpus y PNL de aprendizaje automático, es común ignorar hapax legomena (y, a veces, otras palabras poco frecuentes), ya que es probable que tengan poco valor para las técnicas computacionales. Esta indiferencia tiene el beneficio adicional de reducir significativamente el uso de memoria de una aplicación, ya que, según la ley de Zipf, muchas palabras son hapax legomena.
Ejemplos
Los siguientes son algunos ejemplos de hapax legomena en lenguajes o corpus.
Ejemplos árabes
En el Corán:
- Los sustantivos apropiados Iram (Q 89:7, Iram de los Pilares), Bābil (Q 2:102, Babilonia), Bakka(t) (Q 3:96, Bakkah), Jibt (Q 4:51), Ramadán (Q 2:185, Ramadán), ar-Rūm (Q 30:2, Imperio Bizantino), Tasnīm (Q 83:27), Qurayš (Q 106:1, Quraysh), Majūs (Q 22:17, Magian/Zoroastrian), Mārūt (Q 2:102, Harut y Marut), Makka(t) (Q 48:24, Meca), Nasr (Q 71:23), (ūū) an-Nūn (Q 21:87) y Hārūt (Q 2:102, Harut y Marut) ocurren sólo una vez.
- zanjabīl ()Антеливаних – jengibre) es un hapax Qur primaānic (Q 76:17).
- El epiteton ornans a Ashamad ()الد – El Uno oró) es un hapax Qurānic (Q 112:2).
- İūd (). - montaña) es un hapax coránico (Q 26:63).
Caracteres chinos y japoneses
La literatura clásica china y japonesa contiene muchos caracteres chinos que aparecen solo una vez en el corpus, y su significado y pronunciación a menudo se han perdido. Conocido en japonés como kogo (孤語), literalmente "caracteres solitarios", estos pueden considerarse un tipo de hapax legomenon. Por ejemplo, el Clásico de la poesía (c. 1000 BC) utiliza el carácter 篪 exactamente una vez en el verso "伯氏吹埙,仲氏吹篪", y fue solo a través del descubrimiento de una descripción de Guo Pu (276–324 d. C.) que el personaje podría estar asociado con un tipo específico de flauta antigua.
Ejemplos en inglés
- Flother, como un sinónimo de copo de nieve, es un hapax legomenon del inglés escrito encontrado en un manuscrito titulado Los XI dolores del infierno (circa 1275).
- Hebenon, un veneno referido en el 'Hamlet' de Shakespeare sólo una vez.
- Honorificabilitudinitatibus es un hapax legomenon de las obras de Shakespeare.
- ÍndiceEn Bram Stoker Drácula, utilizado como adjetivo para describir un estado situacional sin otro uso adicional en el lenguaje "'Si ese hombre hubiera sido un lunático ordinario habría tenido mi oportunidad de confiar en él; pero parece tan mezclado con el Conde de una manera indice que tengo miedo de hacer algo malo ayudando a sus modas."
- Manticratic, que significa "de la regla por la familia o clan del Profeta", fue aparentemente inventado por T. E. Lawrence y aparece una vez en Siete Pilares de la Sabiduría.
- Nortelrye, una palabra para "educación", ocurre sólo una vez en Chaucer.
- Sassigassity, tal vez con el significado de "audacia", ocurre sólo una vez en la breve historia de Dickens "Un árbol de Navidad".
- Slæpwerigne, "muerto-muerto", ocurre exactamente una vez en el viejo cuerpo inglés, en el Libro de Exeter. Hay un debate sobre si significa "fácil de dormir" o "fácil de dormir".
Ejemplos en alemán
- El nombre del poema del siglo IX Muspilli es un back-formation de "muspille", Old High German hapax legomenon de significado poco claro sólo se encuentra en este texto (ver Muspilli#Etymology para discusión).
Ejemplos griegos antiguos
Según el erudito clásico Clyde Pharr, "la Ilíada tiene 1097 hapax legomena, mientras que la Odisea tiene 868". Sin embargo, otros han definido el término de manera diferente y cuentan tan solo 303 en la Ilíada y 191 en la Odisea.
- panaōrios ()παναיριος), griego antiguo para "muy poco tiempo", es una de muchas palabras que ocurren sólo una vez en el Iliad.
- El Nuevo Testamento griego contiene 686 locales hapax legomena, que a veces se llaman "hapaxes del Nuevo Testamento". 62 de estos ocurren en 1 Pedro y 54 ocurren en 2 Pedro.
- Epiousios, traducido al inglés como "daily" en la oración del Señor en Mateo 6:11 y Lucas 11:3, no ocurre otra cosa en toda la literatura griega antigua conocida.
- La palabra aphedrōn "latrina" en el Nuevo Testamento griego se produce sólo dos veces, en Mateo 15:17 y Marcos 7:19, pero como se considera ampliamente que el escritor del Evangelio de Mateo utilizó el Evangelio de Marcos como fuente, puede ser considerado como una fuente, hapax legomenon. Fue traducida erróneamente como "bowel", hasta una inscripción de la Lex de astynomis Pergamenorum ("Law of the town clerks of Pergamon") confirmó que significaba "latrine".
Ejemplos de hebreo
El número de distintas hapax legomena en la Biblia hebrea es 1.480 (de un total de 8.679 palabras distintas utilizadas). Sin embargo, debido a las raíces, los sufijos y los prefijos hebreos, solo 400 son "verdaderos" hapax legomena. Se puede ver una lista completa en la entrada de la Enciclopedia Judía para "Hapax Legomena".
Algunos ejemplos incluyen:
- Akut Sólo aparece una vez en la Biblia hebrea, en el Salmo 95:10.
- Atzei Gopher Se menciona una vez en la Biblia, en Génesis 6:14, en la instrucción de hacer que el arca de Noé "de la madera de gopher". Debido a su apariencia única, su significado literal se pierde. Gopher es simplemente una transliteración, aunque los eruditos sugieren tentativamente que la madera destinada es cipres.
- Gvina Es un hapax legomenon del hebreo bíblico, encontrado sólo en Job 10:10. La palabra se ha vuelto extremadamente común en el hebreo moderno.
- Zechuchith () hapax legomenon del hebreo bíblico, encontrado sólo en Job 28:17. La palabra deriva de la raíz z-ch- h, que significa claro/transparente y se refiere al cristal o cristal. En Hebreo Moderno, se utiliza para el "glass".
- Lilith (RISA) ocurre una vez en la Biblia Hebrea, en Isaías 34:14, que describe la desolación de Edom. Se traduce de varias maneras.
Ejemplo irlandés
- chomneibi, un adjetivo de significado desconocido que describe una latiga, sólo aparece en Triads of Ireland #169.
Ejemplos italianos
- Ramogna se menciona sólo una vez en la literatura italiana, específicamente en Dante Divina Commedia ()Purgatorio XI, 25).
- El verbo attuia aparece una vez Commedia ()Purgatorio XXXIII, 48). El significado es impugnado pero generalmente interpretado como "darkens" o "impedes". Algunos manuscritos dan la hapax alternativa accuia en su lugar.
- Trasumanar es otro hapax legomenon mencionado en Commedia ()Paradiso I, 70, traducido como "Pasando más allá del ser humano" por Mandelbaum).
- Ultrafilosofia, lo que significa "más allá de la filosofía" aparece en Leopardi Zibaldone (Zibaldone 114–115 – junio, 7th 1820).
Ejemplos latinos
- Deproeliantis, un participio de la palabra deproelior, lo que significa "luchar ferozmente" o "luchar violentamente", aparece sólo en la línea 11 de la línea de Horace Ode 1.9.
- Mactatu, singular ablativo de mactatusSignifica "por causa del asesinato". Sólo ocurre en De rerum natura por Lucretius.
- Mnemosynus, presumiblemente significa un guardián o aide-memoire, aparece sólo en Poema 12 de Catullus Carmina.
- Scortillum, una forma diminutiva que significa "pequeña prostituta", se produce sólo en Poema 10 de la Carmina de Catullus, línea 3.
- Terricrepo, un adjetivo aparentemente refiriéndose a un método oratorio trueno, se produce sólo en el Libro 8 de Agustín Confesiones.
- Romanitas, un sustantivo que significa "romanismo" o "el camino romano" o "la manera romana", aparece sólo en Tertuliano de Pallio.
- Arepo es un nombre propio potencial sólo encontrado en la plaza Sator. Puede derivarse por ortografía ópera Al revés.
- Eoigena, un adjetivo referido al sol y signifiyng "uno nacido en el este", aparece sólo en un epígrafe encontrado en Castellammare di Stabia (la antigua Stabiae).
Ejemplos eslavos
- Vytol (вытол) es un hapax legomenon del cuerpo conocido de los manuscritos de corteza de abedul medieval ruso. La palabra ocurre en la inscripción no 600 de Novgorod, fechada ca. 1220-1240, en el contexto "[la] vytol ha sido atrapado" (вытоло изловили). Según Andrey Zaliznyak, la palabra no ocurre en ningún otro lugar, y su significado no se conoce. Se han propuesto diversas interpretaciones, como un nombre personal o la condición social de una persona.
Ejemplos en español
- Atafea es un hapax legomenon apareciendo en un proverbio reportado por Blasco de Garay en el siglo XVI ("uno muere de atafea y otro la desea"). El significado de la palabra no era conocido, y fue interpretado inicialmente para significar saciedad. Los etimólogos modernos lo vinculan con el arab del norte-africano tafaya/attatfíha, que se refiere a un guiso de cebolla y cilantro.
- Esi, creído derivar de la conjunción latina etsi "aunque", aparece sólo una vez en el de Álvaro de Luna Virtuosas e claras mugeres (1446).
En la cultura popular
- El cineasta de vanguardia Hollis Frampton realizó una serie de siete películas de 1971 a 1972 tituladas Hapax Legomena I: Nostalgia a Hapax Legomena VII: Efectos especiales.
- Hapax legomenon como un término se hizo brevemente prominente en Gran Bretaña después de la final 2014–15 University Challenge Final, después de que los vídeos fueron virales del estudiante de Gonville y Caius Ted Loveday rápidamente dándole como una respuesta correcta cuando el presentador Jeremy Paxman sólo había logrado preguntar "que significa 'salir una sola vez', qué término griego de dos palabras denota una palabra...".
- La palabra curiosa fue citado por el anfitrión de Vsauce Michael Stevens en 2015 como un ejemplo de un hapax legomenon, con Google sólo devolver un resultado de búsqueda de la palabra en el momento a pesar de ser incluido en el Diccionario Inglés de Oxford. El término se convirtió brevemente en un meme de Internet y ahora devuelve miles de resultados de búsqueda de Google.
- En el videojuego NetHack, "HAPAX LEGOMENON" es uno de los posibles textos aleatorizados de un tipo de pergamino mágico todavía no identificado. Una vez leído, el pergamino arroja su efecto mágico y luego desaparece ("una cosa dijo una vez") pero posiblemente se identificó en adelante (por ejemplo, pergamino de armadura encantada, pergamino de teleportación, etc.) para ese juego.
- "Hapax Legomenon"es el nombre de un mago amigo de Heden en la novela "Thief" de Matt Colville, el segundo libro de su serie Ratcatchers.
Contenido relacionado
Lenición
Deixis
Ambigüedad