Palabra clave en contexto
Palabra clave en contexto (KWIC) es el formato más común para las líneas de concordancia. El término KWIC fue acuñado por primera vez por Hans Peter Luhn. El sistema se basaba en un concepto llamado palabra clave en títulos que fue propuesto por primera vez para las bibliotecas de Manchester en 1864 por Andrea Crestadoro.
Un índice KWIC se forma clasificando y alineando las palabras dentro del título de un artículo para permitir que cada palabra (excepto las palabras vacías) en los títulos se pueda buscar alfabéticamente en el índice. Era un método de indexación útil para manuales técnicos antes de que la búsqueda computarizada de texto completo se volviera común.
Por ejemplo, una consulta de búsqueda que incluye todas las palabras en una definición de ejemplo ("KWIC es un acrónimo de Key Word In Context, el formato más común para las líneas de concordancia") y el eslogan de Wikipedia en inglés ("la enciclopedia libre"), buscado en una página de Wikipedia, podría generar un índice KWIC de la siguiente manera. Un índice KWIC generalmente usa un diseño amplio para permitir la visualización del máximo 'en contexto'. información (no se muestra en el siguiente ejemplo).
KWIC es un | acrónimo para Key Word En Context,... | página 1 |
... Palabra clave en el contexto, la más | común formato para líneas de concordancia. | página 1 |
... el formato más común para | concordancia líneas. | página 1 |
... es un acrónimo para la palabra clave en | Contexto, el formato más común... | página 1 |
Wikipedia, El libre | Enciclopedia | página 0 |
... En Contexto, el más común | formato para líneas de concordancia. | página 1 |
Wikipedia, El | Gratis Enciclopedia | página 0 |
KWIC es un acrónimo para | Clave Palabra en Contexto, la más... | página 1 |
KWIC es un acrónimo para Key Word... | página 1 | |
... formato común para la concordancia | líneas. | página 1 |
... para la palabra clave en el contexto, | más formato común para la concordancia... | página 1 |
Wikipedia, La enciclopedia libre | página 0 | |
KWIC es un acrónimo para Key | Palabra En Contexto, el más común... | página 1 |
Un índice KWIC es un caso especial de un índice permutado. Este término se refiere al hecho de que indexa todas las permutaciones cíclicas de los encabezados. Los libros compuestos de muchas secciones cortas con sus propios encabezados descriptivos, sobre todo colecciones de páginas de manual, a menudo terminaban con una sección de índice permutado, lo que permitía al lector encontrar fácilmente una sección por cualquier palabra de su encabezado. Esta práctica, también conocida como palabra clave fuera de contexto (KWOC), ya no es común.
Referencias en la literatura
Nota: La primera referencia no muestra el índice KWIC a menos que pague para ver el documento. La segunda referencia ni siquiera menciona el artículo en absoluto.
- David L. Parnas utiliza un índice KWIC como ejemplo sobre cómo realizar el diseño modular en su papel Sobre los criterios que se utilizan en sistemas de descomposición en módulos, disponibles como un documento clásico ACM
- Christopher D. Manning e Hinrich Schütze describen un índice KWIC y una concordancia de ordenadores en la sección 1.4.5 de su libro Foundations of Statistical Natural Language Processing. Cambridge, Mass: MIT Press, 1999. ISBN 9780262133609. Citan un artículo de H.P. Luhn de 1960, "Indice clave de palabra en contexto para la literatura técnica (índice kwic)".
- Según el Rev. Gerard O'Connor Concordantia et Indices Missalium Romanorum, "La mayoría de las concordancias producidas en los últimos tiempos y con la ayuda del software informático utilizan los formatos KWIC (palabra clave en contexto) y KWICn (palabra clave en el centro), que enumera la palabra clave, generalmente resaltada en texto en negrita en una posición consistente, dentro de una cantidad limitada de texto contextual, es decir tres [o] cuatro palabras del texto antes de la palabra clave y la misma cantidad de texto siguiente. Este formato es extremadamente útil en que la palabra clave se identifica fácilmente junto con su contexto.... El libro del Misal Romano se produce tanto en los formatos KWIC como en KWICn y es notable en que cada forma de palabra se enumera como aparece en el texto, es decir, no está escrito".
Contenido relacionado
Volición (lingüística)
Idiomas khoisan
Ladín (lengua)