Análisis de citas
Análisis de citas es el examen de la frecuencia, los patrones y los gráficos de las citas en los documentos. Utiliza el gráfico dirigido de citas (enlaces de un documento a otro) para revelar las propiedades de los documentos. Un objetivo típico sería identificar los documentos más importantes de una colección. Un ejemplo clásico es el de las citas entre artículos y libros académicos. Para poner otro ejemplo, los jueces de derecho respaldan sus sentencias haciendo referencia a sentencias dictadas en casos anteriores (ver análisis de citas en un contexto legal). Un ejemplo adicional lo proporcionan las patentes que contienen el estado de la técnica, citando patentes anteriores relevantes para la presente reivindicación. La digitalización de los datos de patentes y el aumento de la potencia informática han dado lugar a una comunidad de práctica que utiliza estos datos de citas para medir atributos de innovación, rastrear flujos de conocimiento y mapear redes de innovación.
Los documentos se pueden asociar con muchas otras características además de las citas, como autores, editores, revistas y sus textos reales. El análisis general de colecciones de documentos se conoce como bibliometría y el análisis de citas es una parte clave de ese campo. Por ejemplo, el acoplamiento bibliográfico y la co-citación son medidas de asociación basadas en el análisis de citas (citas compartidas o referencias compartidas). Las citas en una colección de documentos también se pueden representar en formas como un gráfico de citas, como señaló Derek J. de Solla Price en su artículo de 1965 "Networks of Scientific Papers". Esto significa que el análisis de citas se basa en aspectos del análisis de redes sociales y la ciencia de redes.
Un ejemplo temprano de la indexación automatizada de citas fue CiteSeer, que se utilizó para citaciones entre documentos académicos, mientras que Web of Science es un ejemplo de un sistema moderno que incluye más que libros académicos y artículos que reflejan una amplia gama de fuentes de información. Hoy, la indexación automatizada de citas ha cambiado la naturaleza de la investigación de análisis de citas, permitiendo que millones de citas sean analizadas para patrones a gran escala y descubrimiento de conocimiento. Se pueden utilizar herramientas de análisis de citas para calcular diversas medidas de impacto para los eruditos basadas en datos de índices de citación. These have various applications, from the identification of expert referees to review papers and grant proposals, to providing transparent data in support of academic merit review, tenure, and promotion decisions. Esta competencia por recursos limitados puede llevar a un comportamiento éticamente cuestionable para aumentar las citas.
Se ha criticado mucho la práctica de utilizar ingenuamente análisis de citas para comparar el impacto de diferentes artículos académicos sin tener en cuenta otros factores que pueden afectar los patrones de citas. Entre estas críticas, una recurrente se centra en los "factores dependientes del campo", que se refiere al hecho de que las prácticas de citación varían de un área de la ciencia a otra, e incluso entre campos de investigación dentro de una disciplina.
Descripción general
Si bien los índices de citas se diseñaron originalmente para la recuperación de información, se utilizan cada vez más para bibliometría y otros estudios que implican la evaluación de investigaciones. Los datos de citas también son la base del popular factor de impacto de una revista.
Existe una gran cantidad de literatura sobre análisis de citas, a veces llamada cienciometría, un término inventado por Vasily Nalimov, o más específicamente bibliometría. El campo floreció con la llegada del Science Citation Index, que ahora cubre la literatura fuente desde 1900 en adelante. Las principales revistas en este campo son Scientometrics Informetrics y el Journal of the Association for Information Science and Technology. ASIST también alberga una lista de correo electrónico llamada SIGMETRICS en ASIST. Este método está resurgiendo gracias a la amplia difusión de las bases de datos de suscripción Web of Science y Scopus en muchas universidades, y a las herramientas de citación gratuitas y universalmente disponibles, como CiteBase, CiteSeerX, Google Scholar y el antiguo Windows Live Academic (ahora disponible con características adicionales como Microsoft Academic). Los métodos de investigación de análisis de citas incluyen enfoques cualitativos, cuantitativos y computacionales. Los principales focos de dichos estudios cienciométricos han incluido comparaciones de productividad, clasificaciones de investigación institucional, clasificaciones de revistas que establecen la productividad del profesorado y los estándares de permanencia, la evaluación de la influencia de los principales artículos académicos, el seguimiento de la trayectoria de desarrollo de un campo de ciencia o tecnología y el desarrollo de perfiles de los principales autores. e instituciones en términos de desempeño en investigación.
El análisis de citas legales es una técnica de análisis de citas para analizar documentos legales para facilitar la comprensión de los documentos de cumplimiento normativo interrelacionados mediante la exploración de las citas que conectan disposiciones con otras disposiciones dentro del mismo documento o entre diferentes documentos. El análisis de citas legales utiliza un gráfico de citas extraído de un documento regulatorio, que podría complementar el descubrimiento electrónico, un proceso que aprovecha las innovaciones tecnológicas en el análisis de big data.
Historia
En un artículo de 1965, Derek J. de Solla Price describió la característica de vinculación inherente del SCI como "Redes de artículos científicos". Los vínculos entre las citas y los artículos citados se volvieron dinámicos cuando el SCI comenzó a publicarse en línea. El Social Sciences Citation Index se convirtió en una de las primeras bases de datos montadas en el sistema Dialog en 1972. Con la llegada de la edición en CD-ROM, la vinculación se hizo aún más fácil y permitió el uso del acoplamiento bibliográfico para encontrar registros relacionados. En 1973, Henry Small publicó su obra clásica sobre el análisis de cocitación, que se convirtió en un sistema de clasificación autoorganizado que condujo a experimentos de agrupación de documentos y, finalmente, a un "Atlas de la ciencia" más tarde llamado "Reseñas de investigaciones".
La naturaleza topológica y gráfica inherente de la red mundial de citas, que es una propiedad inherente de la literatura científica, fue descrita por Ralph Garner (Universidad de Drexel) en 1965.
El uso de recuentos de citas para clasificar las revistas fue una técnica utilizada a principios del siglo XIX, pero la medición sistemática y continua de estos recuentos para las revistas científicas fue iniciada por Eugene Garfield en el Instituto de Información Científica, quien también fue pionero en el uso. de estos recuentos para clasificar autores y artículos. En un artículo histórico de 1965, él e Irving Sher mostraron la correlación entre la frecuencia de las citas y la eminencia al demostrar que los ganadores del Premio Nobel publicaban cinco veces el promedio de artículos mientras que su trabajo era citado entre 30 y 50 veces el promedio. En una larga serie de ensayos sobre el Nobel y otros premios, Garfield informó de este fenómeno. La medida de resumen habitual se conoce como factor de impacto, el número de citas de una revista durante los dos años anteriores, dividido por el número de artículos publicados en esos años. Se utiliza ampliamente, tanto para fines apropiados como inapropiados; en particular, el uso de esta medida por sí sola para clasificar autores y artículos es, por lo tanto, bastante controvertido.
En un estudio inicial realizado en 1964 sobre el uso del análisis de citas para escribir la historia del ADN, Garfield y Sher demostraron el potencial para generar historiografías, mapas topológicos de los pasos más importantes en la historia de los temas científicos. Este trabajo fue posteriormente automatizado por E. Garfield, A. I. Pudovkin del Instituto de Biología Marina de la Academia de Ciencias de Rusia y V. S. Istomin del Centro de Enseñanza, Aprendizaje y Tecnología de la Universidad Estatal de Washington y condujo a la creación del software HistCite alrededor de 2002..
La indexación automática de citas fue introducida en 1998 por Lee Giles, Steve Lawrence y Kurt Bollacker y permitió la extracción algorítmica automática y la agrupación de citas para cualquier documento académico y científico digital. Donde antes la extracción de citas era un proceso manual, las medidas de citas ahora se pueden ampliar y calcular para cualquier campo académico y científico y lugar de documentación, no solo aquellos seleccionados por organizaciones como ISI. Esto llevó a la creación de nuevos sistemas para la indexación de citas pública y automatizada, siendo el primero CiteSeer (ahora CiteSeerX, seguido pronto por Cora, que se centró principalmente en el campo de la informática y las ciencias de la información. A estos les siguió más tarde el dominio académico a gran escala). sistemas de citas como Google Scholar y Microsoft Academic. Esta indexación autónoma de citas aún no es perfecta en la extracción o agrupación de citas, con una tasa de error estimada por algunos en 10%, aunque aún no se ha realizado un muestreo estadístico cuidadoso. Esto ha resultado en A autores como Ann Arbor, Milton Keynes y Walton Hall se les atribuye una extensa producción académica. SCI afirma crear una indexación automática de citas mediante métodos puramente programáticos. Incluso los registros más antiguos tienen una magnitud de error similar.
Impacto de las citas
El impacto de la citación o tasa de citación es una medida de cuántas veces un artículo o libro de revistas académicas o autor es citado por otros artículos, libros o autores. Los recuentos de la citación se interpretan como medidas de impacto o influencia del trabajo académico y han dado lugar al campo de la bibliometría o la ciencimetría, especializada en el estudio de patrones de impacto académico a través del análisis de citas. La importancia de las revistas se puede medir por la tasa media de citación,
la relación del número de citas al número de artículos publicados dentro de un período determinado y en un índice dado, como el factor de impacto de la revista o el citescore. Es utilizado por instituciones académicas en decisiones sobre tenencia académica, promoción y contratación, y por lo tanto también utilizado por autores para decidir qué revista publicar. Las medidas similares a la Citación también se utilizan en otros campos que hacen ranking, como el algoritmo PageRank de Google, métricas de software, rankings universitarios y universitarios, e indicadores de rendimiento empresarial.Análisis de citas para documentos legales
El análisis de citas para documentos legales es un enfoque para facilitar la comprensión y el análisis de documentos de cumplimiento normativo interrelacionados mediante la exploración de las citas que conectan disposiciones con otras disposiciones dentro del mismo documento o entre diferentes documentos. El análisis de citas utiliza un gráfico de citas extraído de un documento regulatorio, que podría complementar el descubrimiento electrónico, un proceso que aprovecha las innovaciones tecnológicas en el análisis de big data.
Análisis de citas para la detección de plagio
Controversias
- E-publishing: debido al crecimiento sin precedentes de la disponibilidad de recursos electrónicos (recurso electrónico), una de las preguntas que se están explorando es, "¿cómo a menudo se citan recursos electrónicos en mi campo?" Por ejemplo, hay afirmaciones de que el acceso a la literatura informática en línea conduce a tasas de citación más altas, sin embargo, los artículos de humanidad pueden sufrir si no están impresos.
- Autocitaciones: se ha criticado que los autores jueguen el sistema acumulando citas citandose excesivamente. Por ejemplo, se ha encontrado que los hombres tienden a citarse más a menudo que las mujeres.
- Contaminación porcentual: la infiltración de investigación retraída, o investigación falsa, citada en investigación legítima, pero que impacta negativamente en la validez de la investigación. It is due to various factors, including the publication race and the concerning rise in unscrupulous business practices related to so-called predatory or deceptive publishers, research quality, in general, is facing different types of threats.
- Justicia de citas y Sesgo de citación: Debido a que tener otros citas una publicación ayuda a las perspectivas de carrera del autor original, y porque las obras clave en algunos campos fueron publicadas por hombres, por eruditos mayores, y por personas blancas, se han llamado a promover la justicia social citando deliberadamente publicaciones de personas de orígenes marginados, o comprobando citas para prejuicios antes de la publicación.
Contenido relacionado
Edad de oro
Homero Simpson
Alta cultura