Índice H
El h-index es una métrica a nivel de autor que mide tanto la productividad como el impacto de las citas de las publicaciones, utilizada inicialmente para un científico o académico individual. El índice h se correlaciona con indicadores de éxito como ganar el Premio Nobel, ser aceptado para becas de investigación y ocupar puestos en las mejores universidades. El índice se basa en el conjunto de los artículos más citados del científico y el número de citas que han recibido en otras publicaciones. Más recientemente, el índice se ha aplicado a la productividad y el impacto de una revista académica, así como a un grupo de científicos, como un departamento, una universidad o un país. El índice fue sugerido en 2005 por Jorge E. Hirsch, físico de la UC San Diego, como una herramienta para determinar la capacidad de los físicos teóricos. calidad relativa y a veces se denomina índice de Hirsch o número de Hirsch.
Definición y finalidad

El índice h se define como el valor máximo de h tal que el autor/revista determinado haya publicado al menos h artículos que cada uno ha sido citado al menos h veces. El índice está diseñado para mejorar medidas más simples, como el número total de citas o publicaciones. El índice funciona mejor cuando se comparan académicos que trabajan en el mismo campo, ya que las convenciones de citación difieren ampliamente entre los diferentes campos.
Cálculo
El índice h es el mayor número h tal que los artículos h tengan al menos h citas cada uno . Por ejemplo, si un autor tiene cinco publicaciones, con 9, 7, 6, 2 y 1 citas (ordenadas de mayor a menor), entonces el índice h del autor es 3, porque el autor tiene tres publicaciones con 3 o más citas. Sin embargo, el autor no tiene cuatro publicaciones con 4 o más citas.
Claramente, el índice h de un autor sólo puede ser tan grande como su número de publicaciones. Por ejemplo, un autor con una sola publicación puede tener un índice h máximo de 1 (si su publicación tiene 1 o más citas). Por otro lado, un autor con muchas publicaciones, cada una con solo 1 cita, también tendría un índice h de 1.
Formalmente, si f es la función que corresponde al número de citas de cada publicación, calculamos el índice h de la siguiente manera: Primero ordenamos los valores de f del valor más grande al más bajo. Luego, buscamos la última posición en la que f sea mayor o igual a la posición (a esta posición la llamamos h). Por ejemplo, si tenemos un investigador con 5 publicaciones A, B, C, D y E con 10, 8, 5, 4 y 3 citas respectivamente, el índice h es igual a 4 porque la 4ª publicación tiene 4 citas y la 5ª tiene solo 3. En cambio, si las mismas publicaciones tienen 25, 8, 5, 3 y 3 citas, entonces el índice es 3 (es decir, la 3ª posición) porque el cuarto artículo tiene solo 3 citas.
- f(A)=10, f(B)=8, f(C)=5, f(D)=4, f(E)=3 → h-index=4
- f(A)=25, f(B)=8, f(C)=5, f(D)=3, f(E)=3 → h-index=3
Si tenemos la función f ordenada en orden decreciente desde la mayor valor al más bajo, podemos calcular el índice h de la siguiente manera:
- h- Índicef)
El índice de Hirsch es análogo al número de Eddington, una métrica anterior utilizada para evaluar a los ciclistas. El índice h también está relacionado con la integral de Sugeno y la métrica de Ky Fan. El índice h sirve como una alternativa a las métricas de factor de impacto de revistas más tradicionales en la evaluación del impacto del trabajo de un investigador en particular. Dado que sólo los artículos más citados contribuyen al índice h, su determinación es un proceso más sencillo. Hirsch ha demostrado que h tiene un alto valor predictivo sobre si un científico ha ganado honores como ser miembro de la Academia Nacional o el Premio Nobel. El índice h crece a medida que se acumulan las citas y, por tanto, depende de la "edad académica" de un investigador.
Datos de entrada
El índice h se puede determinar manualmente utilizando bases de datos de citas o herramientas automáticas. Las bases de datos basadas en suscripción, como Scopus y Web of Science, proporcionan calculadoras automatizadas. Desde julio de 2011, Google proporciona un índice h y un índice i10 calculados automáticamente dentro de su propio perfil de Google Scholar. Además, bases de datos específicas, como la base de datos INSPIRE-HEP, pueden calcular automáticamente el índice h para investigadores que trabajan en física de altas energías.
Es probable que cada base de datos produzca una h diferente para el mismo académico, debido a la diferente cobertura. Un estudio detallado mostró que Web of Science tiene una fuerte cobertura de publicaciones de revistas, pero una cobertura deficiente de conferencias de alto impacto. Scopus tiene mejor cobertura de conferencias, pero pobre cobertura de publicaciones anteriores a 1996; Google Scholar tiene la mejor cobertura de conferencias y la mayoría de las revistas (aunque no todas), pero al igual que Scopus tiene una cobertura limitada de publicaciones anteriores a 1990. La exclusión de los artículos de actas de congresos es un problema particular para los estudiosos de la informática, donde las actas de congresos se consideran una parte importante de la literatura. Google Scholar ha sido criticado por producir "citas fantasmas", incluyendo literatura gris en su recuento de citas, y por no seguir las reglas de la lógica booleana al combinar términos de búsqueda. Por ejemplo, el estudio de Meho y Yang encontró que Google Scholar identificó un 53% más de citas que Web of Science y Scopus combinados, pero señaló que debido a que la mayoría de las citas adicionales reportadas por Google Scholar provenían de revistas o actas de congresos de bajo impacto, no lo hicieron. no altera significativamente la clasificación relativa de los individuos. Se ha sugerido que para abordar la variación a veces amplia en h para un solo académico medido en las posibles bases de datos de citas, se debe asumir que los falsos negativos en las bases de datos son más problemáticos que los falsos positivos y tomar la h máxima medida para un académico.
Ejemplos
Se ha realizado poca investigación sistemática sobre cómo se comporta el índice h en diferentes instituciones, naciones, épocas y campos académicos. Hirsch sugirió que, para los físicos, un valor de h de aproximadamente 12 podría ser típico para ascender a titular (profesor asociado) en las principales universidades de investigación [de Estados Unidos]. Un valor de aproximadamente 18 podría significar una cátedra completa, 15 a 20 podría significar una beca en la Sociedad Estadounidense de Física y 45 o más podría significar membresía en la Academia Nacional de Ciencias de los Estados Unidos. Hirsch estimó que después de 20 años un "científico exitoso" tendría un índice h de 20, un "científico destacado" tendría un índice h de 40 y un valor "verdaderamente único" individuo tendría un índice h de 60.
Para los científicos más citados en el período 1983–2002, Hirsch identificó los 10 primeros en las ciencias de la vida (para disminuir) hSalomón H. Snyder, h = 191; David Baltimore, h = 160; Robert C. Gallo, h = 154; Pierre Chambon, h = 153; Bert Vogelstein, h = 151; Salvador Moncada, h = 143; Charles A. Dinarello, h = 138; Tadamitsu Kishimoto, h = 134; Ronald M. Evans, h = 127; y Ralph L. Brinster, h 126. Entre los 36 nuevos inductores de la Academia Nacional de Ciencias en ciencias biológicas y biomédicas en 2005, los medios de comunicación h- El índice era 57. Sin embargo, Hirsch señaló que los valores de h variará entre campos dispares.
Entre las 22 disciplinas científicas enumeradas en los umbrales de citación de los Indicadores Científicos Esenciales (excluyendo así a los académicos no científicos), la física tiene la segunda mayor cantidad de citas después de la ciencia espacial. Durante el período comprendido entre el 1 de enero de 2000 y el 28 de febrero de 2010, un físico tenía que recibir 2073 citas para estar entre el 1% de los físicos más citados del mundo. El umbral para la ciencia espacial es el más alto (2236 citas), y a la física le siguen la medicina clínica (1390) y la biología molecular. genética (1229). La mayoría de las disciplinas, como medio ambiente/ecología (390), tienen menos científicos, menos artículos y menos citas. Por lo tanto, estas disciplinas tienen umbrales de citación más bajos en los Indicadores científicos esenciales, observándose los umbrales de citación más bajos en ciencias sociales (154), ciencias de la computación (149) y ciencias multidisciplinarias (147).
Las cifras son muy diferentes en las disciplinas de las ciencias sociales: el equipo de Impacto de las Ciencias Sociales de la London School of Economics descubrió que los científicos sociales del Reino Unido tenían un h promedio más bajo. -índices. Los índices h para profesores ("titulares"), basados en datos de Google Scholar, oscilaron entre 2,8 (en derecho), 3,4 (en ciencias políticas) y 3,7 (en sociología). , 6,5 (en geografía) y 7,6 (en economía). En promedio en todas las disciplinas, un profesor de ciencias sociales tenía un índice h aproximadamente el doble que el de un profesor o un profesor titular, aunque la diferencia fue más pequeña en geografía.
Ventajas
Hirsch pretendía que el índice h abordara las principales desventajas de otros indicadores bibliométricos. La métrica del número total de artículos no representa la calidad de las publicaciones científicas. La métrica del número total de citas, por otro lado, puede verse muy afectada por la participación en una sola publicación de gran influencia (por ejemplo, artículos metodológicos que proponen nuevas técnicas, métodos o aproximaciones exitosas, que pueden generar una gran cantidad de citas). El índice h pretende medir simultáneamente la calidad y la cantidad de la producción científica. Hasta 2010, el índice h mostraba una correlación de Kendall de 0,3 a 0,4 con los premios científicos.
Crítica
Hay una serie de situaciones en las que h puede proporcionar información engañosa sobre la producción de un científico. La correlación entre el índice h y los premios científicos disminuyó significativamente desde 2010 después del uso generalizado del índice h, siguiendo la ley de Goodhart. La disminución de la correlación se atribuye en parte a la difusión de la hiperautoría con más de 100 coautores por artículo.
Algunas de las siguientes fallas no son exclusivas del índice h, sino que se comparten con otras métricas a nivel de autor:
- El h- El índice no explica el número de autores de un documento. En el papel original, Hirsch sugirió particiones entre coautores. Uno de esos índices fraccionados se conoce como h-frac, que cuenta con múltiples autores pero no está ampliamente disponible mediante el uso de herramientas automáticas.
- El h- El índice no representa el número típico de citas en diferentes campos, por ejemplo experimental sobre teórico. El comportamiento de la citación en general se ve afectado por factores dependientes del campo, que pueden invalidar las comparaciones no sólo a través de las disciplinas sino incluso dentro de diferentes campos de investigación de una disciplina.
- El h-index descarta la información contenida en la colocación del autor en la lista de autores, que en algunos campos científicos es significativa aunque en otros no lo es.
- El h- El índice es un entero, que reduce su poder discriminatorio. Ruane y Tol por lo tanto proponen un racional h- índice que interpola entre h y h + 1.
Propensa a la manipulación
(feminine)Las debilidades se aplican al cálculo puramente cuantitativo de la producción científica o académica. Al igual que otras métricas que cuentan las citas, el índice h puede manipularse mediante citas coercitivas, una práctica en la que un editor de una revista obliga a los autores a agregar citas falsas a sus propios artículos antes de que la revista acepte hacerlo. publícalo. El índice h se puede manipular mediante autocitas y, si se basa en los resultados de Google Scholar, incluso los documentos generados por computadora se pueden utilizar para ese propósito, p. utilizando SCIgen. El índice h también puede ser manipulado por hiperautoría. Investigaciones recientes muestran claramente que la correlación del índice h con premios que indican reconocimiento por parte de la comunidad científica ha disminuido sustancialmente.
Otras deficiencias
El h-El índice se ha encontrado en un estudio para tener una precisión y precisión ligeramente menos predictivas que la medida más simple de citas medias por papel. Sin embargo, este hallazgo fue contradicho por otro estudio de Hirsch. El h- El índice no proporciona una medida de impacto significativamente más precisa que el número total de citaciones para un erudito dado. En particular, modelando la distribución de citas entre papeles como una partición de entero aleatorio y la h-index como la plaza Durfee de la partición, Yong llegó a la fórmula , donde N es el número total de citas, que, para los miembros de matemáticas de la Academia Nacional de Ciencias, resulta proporcionar una exacta (con errores típicamente dentro del 10–20 por ciento) aproximación de h- índice en la mayoría de los casos.
Alternativas y modificaciones
Se han realizado varias propuestas para modificar el índice h con el fin de enfatizar diferentes características. Muchas de estas variantes, como el índice g, están altamente correlacionadas con el índice h original, lo que ha llevado a algunos investigadores a considerarlas redundantes. Una métrica que no está altamente correlacionada con el índice h y sí con los premios científicos es el h-frac.
Aplicaciones
Se han aplicado índices similares al índice h fuera de la evaluación del autor o de la revista.
El índice h se ha aplicado a los medios de Internet, como los canales de YouTube. Se define como el número de vídeos con ≥ h × 105 visualizaciones. En comparación con el recuento total de visualizaciones de un creador de vídeo, los índices h y g capturan mejor tanto la productividad como el impacto en una sola métrica.
También se ha ideado un índice sucesivo de tipo Hirsch para instituciones. Una institución científica tiene un índice sucesivo de tipo Hirsch de i cuando al menos i investigadores de esa institución tienen un índice h de al menos < i>i.