Análisis de citas

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Examen de la frecuencia, patrones y gráficos de citaciones en documentos

Análisis de citas es el examen de la frecuencia, los patrones y los gráficos de las citas en los documentos. Utiliza el gráfico dirigido de citas (enlaces de un documento a otro) para revelar las propiedades de los documentos. Un objetivo típico sería identificar los documentos más importantes de una colección. Un ejemplo clásico es el de las citas entre artículos y libros académicos. Para poner otro ejemplo, los jueces de derecho respaldan sus sentencias haciendo referencia a sentencias dictadas en casos anteriores (ver análisis de citas en un contexto legal). Un ejemplo adicional lo proporcionan las patentes que contienen el estado de la técnica, citando patentes anteriores relevantes para la presente reivindicación. La digitalización de los datos de patentes y el aumento de la potencia informática han dado lugar a una comunidad de práctica que utiliza estos datos de citas para medir atributos de innovación, rastrear flujos de conocimiento y mapear redes de innovación.

Los documentos se pueden asociar con muchas otras características además de las citas, como autores, editores, revistas y sus textos reales. El análisis general de colecciones de documentos se conoce como bibliometría y el análisis de citas es una parte clave de ese campo. Por ejemplo, el acoplamiento bibliográfico y la co-citación son medidas de asociación basadas en el análisis de citas (citas compartidas o referencias compartidas). Las citas en una colección de documentos también se pueden representar en formas como un gráfico de citas, como señaló Derek J. de Solla Price en su artículo de 1965 "Networks of Scientific Papers". Esto significa que el análisis de citas se basa en aspectos del análisis de redes sociales y la ciencia de redes.

Un ejemplo temprano de la indexación automatizada de citas fue CiteSeer, que se utilizó para citaciones entre documentos académicos, mientras que Web of Science es un ejemplo de un sistema moderno que incluye más que libros académicos y artículos que reflejan una amplia gama de fuentes de información. Hoy, la indexación automatizada de citas ha cambiado la naturaleza de la investigación de análisis de citas, permitiendo que millones de citas sean analizadas para patrones a gran escala y descubrimiento de conocimiento. Se pueden utilizar herramientas de análisis de citas para calcular diversas medidas de impacto para los eruditos basadas en datos de índices de citación. These have various applications, from the identification of expert referees to review papers and grant proposals, to providing transparent data in support of academic merit review, tenure, and promotion decisions. Esta competencia por recursos limitados puede llevar a un comportamiento éticamente cuestionable para aumentar las citas.

Se ha criticado mucho la práctica de utilizar ingenuamente análisis de citas para comparar el impacto de diferentes artículos académicos sin tener en cuenta otros factores que pueden afectar los patrones de citas. Entre estas críticas, una recurrente se centra en los "factores dependientes del campo", que se refiere al hecho de que las prácticas de citación varían de un área de la ciencia a otra, e incluso entre campos de investigación dentro de una disciplina.

Descripción general

Si bien los índices de citas se diseñaron originalmente para la recuperación de información, se utilizan cada vez más para bibliometría y otros estudios que implican la evaluación de investigaciones. Los datos de citas también son la base del popular factor de impacto de una revista.

Existe una gran cantidad de literatura sobre análisis de citas, a veces llamada cienciometría, un término inventado por Vasily Nalimov, o más específicamente bibliometría. El campo floreció con la llegada del Science Citation Index, que ahora cubre la literatura fuente desde 1900 en adelante. Las principales revistas en este campo son Scientometrics Informetrics y el Journal of the Association for Information Science and Technology. ASIST también alberga una lista de correo electrónico llamada SIGMETRICS en ASIST. Este método está resurgiendo gracias a la amplia difusión de las bases de datos de suscripción Web of Science y Scopus en muchas universidades, y a las herramientas de citación gratuitas y universalmente disponibles, como CiteBase, CiteSeerX, Google Scholar y el antiguo Windows Live Academic (ahora disponible con características adicionales como Microsoft Academic). Los métodos de investigación de análisis de citas incluyen enfoques cualitativos, cuantitativos y computacionales. Los principales focos de dichos estudios cienciométricos han incluido comparaciones de productividad, clasificaciones de investigación institucional, clasificaciones de revistas que establecen la productividad del profesorado y los estándares de permanencia, la evaluación de la influencia de los principales artículos académicos, el seguimiento de la trayectoria de desarrollo de un campo de ciencia o tecnología y el desarrollo de perfiles de los principales autores. e instituciones en términos de desempeño en investigación.

El análisis de citas legales es una técnica de análisis de citas para analizar documentos legales para facilitar la comprensión de los documentos de cumplimiento normativo interrelacionados mediante la exploración de las citas que conectan disposiciones con otras disposiciones dentro del mismo documento o entre diferentes documentos. El análisis de citas legales utiliza un gráfico de citas extraído de un documento regulatorio, que podría complementar el descubrimiento electrónico, un proceso que aprovecha las innovaciones tecnológicas en el análisis de big data.

Historia

En un artículo de 1965, Derek J. de Solla Price describió la característica de vinculación inherente del SCI como "Redes de artículos científicos". Los vínculos entre las citas y los artículos citados se volvieron dinámicos cuando el SCI comenzó a publicarse en línea. El Social Sciences Citation Index se convirtió en una de las primeras bases de datos montadas en el sistema Dialog en 1972. Con la llegada de la edición en CD-ROM, la vinculación se hizo aún más fácil y permitió el uso del acoplamiento bibliográfico para encontrar registros relacionados. En 1973, Henry Small publicó su obra clásica sobre el análisis de cocitación, que se convirtió en un sistema de clasificación autoorganizado que condujo a experimentos de agrupación de documentos y, finalmente, a un "Atlas de la ciencia" más tarde llamado "Reseñas de investigaciones".

La naturaleza topológica y gráfica inherente de la red mundial de citas, que es una propiedad inherente de la literatura científica, fue descrita por Ralph Garner (Universidad de Drexel) en 1965.

El uso de recuentos de citas para clasificar las revistas fue una técnica utilizada a principios del siglo XIX, pero la medición sistemática y continua de estos recuentos para las revistas científicas fue iniciada por Eugene Garfield en el Instituto de Información Científica, quien también fue pionero en el uso. de estos recuentos para clasificar autores y artículos. En un artículo histórico de 1965, él e Irving Sher mostraron la correlación entre la frecuencia de las citas y la eminencia al demostrar que los ganadores del Premio Nobel publicaban cinco veces el promedio de artículos mientras que su trabajo era citado entre 30 y 50 veces el promedio. En una larga serie de ensayos sobre el Nobel y otros premios, Garfield informó de este fenómeno. La medida de resumen habitual se conoce como factor de impacto, el número de citas de una revista durante los dos años anteriores, dividido por el número de artículos publicados en esos años. Se utiliza ampliamente, tanto para fines apropiados como inapropiados; en particular, el uso de esta medida por sí sola para clasificar autores y artículos es, por lo tanto, bastante controvertido.

En un estudio inicial realizado en 1964 sobre el uso del análisis de citas para escribir la historia del ADN, Garfield y Sher demostraron el potencial para generar historiografías, mapas topológicos de los pasos más importantes en la historia de los temas científicos. Este trabajo fue posteriormente automatizado por E. Garfield, A. I. Pudovkin del Instituto de Biología Marina de la Academia de Ciencias de Rusia y V. S. Istomin del Centro de Enseñanza, Aprendizaje y Tecnología de la Universidad Estatal de Washington y condujo a la creación del software HistCite alrededor de 2002..

La indexación automática de citas fue introducida en 1998 por Lee Giles, Steve Lawrence y Kurt Bollacker y permitió la extracción algorítmica automática y la agrupación de citas para cualquier documento académico y científico digital. Donde antes la extracción de citas era un proceso manual, las medidas de citas ahora se pueden ampliar y calcular para cualquier campo académico y científico y lugar de documentación, no solo aquellos seleccionados por organizaciones como ISI. Esto llevó a la creación de nuevos sistemas para la indexación de citas pública y automatizada, siendo el primero CiteSeer (ahora CiteSeerX, seguido pronto por Cora, que se centró principalmente en el campo de la informática y las ciencias de la información. A estos les siguió más tarde el dominio académico a gran escala). sistemas de citas como Google Scholar y Microsoft Academic. Esta indexación autónoma de citas aún no es perfecta en la extracción o agrupación de citas, con una tasa de error estimada por algunos en 10%, aunque aún no se ha realizado un muestreo estadístico cuidadoso. Esto ha resultado en A autores como Ann Arbor, Milton Keynes y Walton Hall se les atribuye una extensa producción académica. SCI afirma crear una indexación automática de citas mediante métodos puramente programáticos. Incluso los registros más antiguos tienen una magnitud de error similar.

Impacto de las citas

El impacto de la citación o tasa de citación es una medida de cuántas veces un artículo o libro de revistas académicas o autor es citado por otros artículos, libros o autores. Los recuentos de la citación se interpretan como medidas de impacto o influencia del trabajo académico y han dado lugar al campo de la bibliometría o la ciencimetría, especializada en el estudio de patrones de impacto académico a través del análisis de citas. La importancia de las revistas se puede medir por la tasa media de citación,

la relación del número de citas al número de artículos publicados dentro de un período determinado y en un índice dado, como el factor de impacto de la revista o el citescore. Es utilizado por instituciones académicas en decisiones sobre tenencia académica, promoción y contratación, y por lo tanto también utilizado por autores para decidir qué revista publicar. Las medidas similares a la Citación también se utilizan en otros campos que hacen ranking, como el algoritmo PageRank de Google, métricas de software, rankings universitarios y universitarios, e indicadores de rendimiento empresarial.

Análisis de citas para documentos legales

El análisis de citas para documentos legales es un enfoque para facilitar la comprensión y el análisis de documentos de cumplimiento normativo interrelacionados mediante la exploración de las citas que conectan disposiciones con otras disposiciones dentro del mismo documento o entre diferentes documentos. El análisis de citas utiliza un gráfico de citas extraído de un documento regulatorio, que podría complementar el descubrimiento electrónico, un proceso que aprovecha las innovaciones tecnológicas en el análisis de big data.

Análisis de citas para la detección de plagio

La detección del plagio basado en la citación (CbPD) se basa en el análisis de citas, y es el único enfoque de la detección del plagio que no depende de la similitud textual. CbPD examina la información de citación y referencia en textos para identificar patrones similares en las secuencias de citación. Como tal, este enfoque es adecuado para textos científicos, u otros documentos académicos que contienen citas. El análisis de la citación para detectar el plagio es un concepto relativamente joven. No ha sido adoptado por software comercial, pero existe un primer prototipo de un sistema de detección de plagio basado en citas. Orden similar y proximidad de citas en los documentos examinados son los principales criterios utilizados para calcular similitudes del patrón de citación. Los patrones de citación representan subsecuencias que contienen citas compartidas por los documentos en comparación. Factores, incluyendo el número absoluto o fracción relativa de citas compartidas en el patrón, así como la probabilidad de que las citas co-ocur en un documento también se consideran para cuantificar el grado de similitud de los patrones.

Controversias

  • E-publishing: debido al crecimiento sin precedentes de la disponibilidad de recursos electrónicos (recurso electrónico), una de las preguntas que se están explorando es, "¿cómo a menudo se citan recursos electrónicos en mi campo?" Por ejemplo, hay afirmaciones de que el acceso a la literatura informática en línea conduce a tasas de citación más altas, sin embargo, los artículos de humanidad pueden sufrir si no están impresos.
  • Autocitaciones: se ha criticado que los autores jueguen el sistema acumulando citas citandose excesivamente. Por ejemplo, se ha encontrado que los hombres tienden a citarse más a menudo que las mujeres.
  • Contaminación porcentual: la infiltración de investigación retraída, o investigación falsa, citada en investigación legítima, pero que impacta negativamente en la validez de la investigación. It is due to various factors, including the publication race and the concerning rise in unscrupulous business practices related to so-called predatory or deceptive publishers, research quality, in general, is facing different types of threats.
  • Justicia de citas y Sesgo de citación: Debido a que tener otros citas una publicación ayuda a las perspectivas de carrera del autor original, y porque las obras clave en algunos campos fueron publicadas por hombres, por eruditos mayores, y por personas blancas, se han llamado a promover la justicia social citando deliberadamente publicaciones de personas de orígenes marginados, o comprobando citas para prejuicios antes de la publicación.

Contenido relacionado

Edad de oro

Una edad de oro es un período en un campo de esfuerzo en el que se lograron grandes tareas. El término se originó en los primeros poetas griegos y romanos...

Homero Simpson

Homer Jay Simpson es uno de los personajes principales de la comedia animada estadounidense Los Simpson . Tiene la voz de Dan Castellaneta y apareció por...

Alta cultura

La alta cultura es una subcultura que enfatiza y abarca los objetos culturales de valor estético, que una sociedad estima colectivamente como arte ejemplar...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save