ArXiv

Compartir Imprimir Citar
Archivo digital en línea para preimpresión de documentos científicos

arXiv (pronunciado "archive"; la X representa la letra griega chi ⟨χ⟩) es un depósito de acceso abierto de preprints y postprints electrónicos (conocidos como e-prints) aprobado para su publicación después de la moderación, pero no de la revisión por pares. Consiste en artículos científicos en los campos de las matemáticas, la física, la astronomía, la ingeniería eléctrica, la informática, la biología cuantitativa, la estadística, las finanzas matemáticas y la economía, a los que se puede acceder en línea. En muchos campos de las matemáticas y la física, casi todos los artículos científicos se autoarchivan en el repositorio arXiv antes de su publicación en una revista revisada por pares. Algunos editores también otorgan permiso a los autores para archivar la publicación posterior revisada por pares. Iniciado el 14 de agosto de 1991, arXiv.org superó el hito del medio millón de artículos el 3 de octubre de 2008 y alcanzó el millón a finales de 2014. A partir de abril de 2021, la tasa de envío es de unos 16 000 artículos al mes.

Historia

Una captura de pantalla del arXiv tomada en 1994, utilizando el navegador NCSA Mosaic. En ese momento, las formas HTML eran una nueva tecnología.
El crecimiento anual de la tasa de sumisión de ArXiv a lo largo de 30 años desde su comienzo con temas etiquetados por las abreviaturas estándar utilizadas en arxiv.org

arXiv fue posible gracias al formato de archivo TeX compacto, que permitió que los artículos científicos se transmitieran fácilmente a través de Internet y se presentaran en el lado del cliente. Alrededor de 1990, Joanne Cohn comenzó a enviar por correo electrónico preprints de física a sus colegas como archivos TeX, pero la cantidad de artículos que se enviaban pronto llenó los buzones por completo. Paul Ginsparg reconoció la necesidad de un almacenamiento central y, en agosto de 1991, creó un buzón de depósito central almacenado en el Laboratorio Nacional de Los Álamos (LANL) al que se podía acceder desde cualquier computadora. Pronto se agregaron modos de acceso adicionales: FTP en 1991, Gopher en 1992 y la World Wide Web en 1993. El término e-print se adoptó rápidamente para describir los artículos.

Comenzó como un archivo de física, llamado archivo de preimpresión LANL, pero pronto se expandió para incluir astronomía, matemáticas, informática, biología cuantitativa y, más recientemente, estadística. Su nombre de dominio original era xxx.lanl.gov. Debido a la falta de interés de LANL en la tecnología de rápida expansión, en 2001 Ginsparg cambió las instituciones a la Universidad de Cornell y cambió el nombre del repositorio a arXiv.org. Ahora está alojado principalmente en Cornell, con cinco espejos en todo el mundo.

ArXiv fue uno de los primeros en adoptar y promover los preprints. Su éxito en el intercambio de preprints fue uno de los factores precipitantes que llevaron al movimiento posterior en la publicación científica conocido como acceso abierto. Los matemáticos y científicos cargan regularmente sus artículos en arXiv.org para acceso mundial y, a veces, para revisiones antes de que se publiquen en revistas revisadas por pares. Ginsparg recibió una beca MacArthur en 2002 por su establecimiento de arXiv. El presupuesto anual para arXiv fue de aproximadamente $ 826,000 para 2013 a 2017, financiado conjuntamente por la Biblioteca de la Universidad de Cornell, la Fundación Simons (tanto en forma de donación como de desafío) y los ingresos por tarifas anuales de las instituciones miembros. Este modelo surgió en 2010, cuando Cornell buscó ampliar la financiación financiera del proyecto solicitando a las instituciones que hicieran contribuciones voluntarias anuales en función de la cantidad de uso de descargas de cada institución. Cada institución miembro promete un compromiso de financiación de cinco años para apoyar a arXiv. Con base en la clasificación de uso institucional, las tarifas anuales se establecen en cuatro niveles, desde $1,000 hasta $4,400. El objetivo de Cornell es recaudar al menos $504 000 por año a través de las cuotas de membresía generadas por aproximadamente 220 instituciones.

En septiembre de 2011, la Biblioteca de la Universidad de Cornell asumió la responsabilidad administrativa y financiera general del funcionamiento y desarrollo de arXiv. Ginsparg fue citado en Chronicle of Higher Education diciendo que "se suponía que sería un recorrido de tres horas, no una cadena perpetua". Sin embargo, Ginsparg permanece en el Consejo Asesor Científico de arXiv y en su Comité Asesor de Física.

Proceso de moderación y aprobación

Aunque arXiv no es revisado por pares, una colección de moderadores para cada área revisa las presentaciones; pueden recategorizar cualquiera que se considere fuera de tema, o rechazar presentaciones que no sean artículos científicos, o algunas veces por razones no reveladas. Las listas de moderadores de muchas secciones de arXiv están disponibles públicamente, pero los moderadores de la mayoría de las secciones de física siguen sin aparecer en la lista.

Además, un "respaldo" El sistema se introdujo en 2004 como parte de un esfuerzo por garantizar que el contenido sea relevante y de interés para la investigación actual en las disciplinas especificadas. Según el sistema, para las categorías que lo utilizan, un autor debe estar respaldado por un autor arXiv establecido antes de que se le permita enviar artículos a esas categorías. No se les pide a los patrocinadores que revisen el documento en busca de errores, sino que verifiquen si el documento es apropiado para el área temática prevista. Los nuevos autores de instituciones académicas reconocidas generalmente reciben respaldo automático, lo que en la práctica significa que no necesitan lidiar con el sistema de respaldo en absoluto. Sin embargo, el sistema de respaldo ha atraído críticas por supuestamente restringir la investigación científica.

La mayoría de los documentos impresos electrónicos también se envían a revistas para su publicación, pero algunos trabajos, incluidos algunos artículos muy influyentes, se mantienen únicamente como documentos impresos electrónicos y nunca se publican en una revista revisada por pares. Un ejemplo bien conocido de esto último es un resumen de una prueba de la conjetura de geometrización de Thurston, incluida la conjetura de Poincaré como un caso particular, subido por Grigori Perelman en noviembre de 2002. Perelman parece contento de renunciar a la tradicional revisión por pares. diario, declarando: "Si alguien está interesado en mi forma de resolver el problema, está todo allí [en el arXiv] - déjelos ir y leer sobre esto". A pesar de este método de publicación no tradicional, otros matemáticos reconocieron este trabajo al ofrecer la Medalla Fields y los Premios Clay Mathematics Millennium a Perelman, los cuales rechazó.

Aunque arXiv contiene algunos e-prints dudosos, como los que afirman refutar teoremas famosos o probar conjeturas famosas como el último teorema de Fermat usando solo matemáticas de secundaria, un artículo de 2002 que apareció en Los avisos de la American Mathematical Society los describieron como "sorprendentemente raros". arXiv generalmente reclasifica estos trabajos, p. en "Matemáticas generales", en lugar de eliminarlos; sin embargo, algunos autores han expresado su preocupación por la falta de transparencia en el proceso de selección de arXiv.

Formatos de envío

Los trabajos se pueden enviar en cualquiera de varios formatos, incluido LaTeX, y PDF impreso desde un procesador de texto que no sea TeX o LaTeX. El software arXiv rechaza el envío si falla la generación del archivo PDF final, si algún archivo de imagen es demasiado grande o si el tamaño total del envío es demasiado grande. arXiv ahora permite almacenar y modificar un envío incompleto, y solo finalizar el envío cuando esté listo. La marca de tiempo en el artículo se establece cuando se finaliza el envío.

Acceso

Una imagen de ver el resumen de un papel en arxiv.org en 2021

La ruta de acceso estándar es a través del sitio web arXiv.org o uno de varios espejos. Otras interfaces y rutas de acceso también han sido creadas por otras organizaciones no asociadas.

Los metadatos para arXiv están disponibles a través de OAI-PMH, el estándar para repositorios de acceso abierto. Por lo tanto, el contenido se indexa en todos los principales consumidores de dichos datos, como BASE, CORE y Unpaywall. A partir de 2020, el volcado de Unpaywall vincula más de 500 000 URL de arxiv como la versión de acceso abierto de un trabajo que se encuentra en los datos de CrossRef de los editores, lo que convierte a arXiv en uno de los 10 principales anfitriones globales de acceso abierto verde.

Finalmente, los investigadores pueden seleccionar subcampos y recibir correos electrónicos diarios o fuentes RSS de todos los envíos en ellos.

Estado de los derechos de autor de los archivos

Los archivos en arXiv pueden tener diferentes estados de copyright:

  1. Algunos son dominio público, en cuyo caso tendrán una declaración que lo diga.
  2. Algunos están disponibles bajo la licencia Creative Commons 4.0 Attribution-ShareAlike o la licencia Creative Commons 4.0 Attribution-Noncommercial-ShareAlike.
  3. Algunos son derechos de autor para el editor, pero el autor tiene derecho a distribuirlos y ha dado arXiv una licencia irrevocable no exclusiva para distribuirlos.
  4. La mayoría son derechos de autor para el autor, y arXiv sólo tiene una licencia irrevocable no exclusiva para distribuirlos.

Fuentes generales y citadas

  • Butler, Declan (2003). "Los biólogos se unen a Physics Preprint Club". Naturaleza. 425 (6958): 548. Código:2003Natur.425..548B. doi:10.1038/425548b. PMID 14534551. S2CID 4374168.
  • Choi, Charles Q. (2003). "Biology's New Online Archive". El Científico. Archivado desde el original el 13 de marzo de 2005. Retrieved 21 de junio 2005.
  • Giles, Jim (2003). "Preprint Server Seeks Way to Halt Plagiarists". Naturaleza. 426 (6962): 7. Bibcode:2003Natur.426Q...7G. doi:10.1038/426007a. PMID 14603280. S2CID 29003994.
  • Ginsparg, Paul (1997). "Winners and Losers in the Global Research Village". El Bibliotecario de serie. 30 (3–4): 83–95. doi:10.1300/J123v30n03_13.
  • Halpern, Joseph Y. (1998). "Un repositorio de investigación de computación". D-Lib Magazine. 4 (11). doi:10.1045/noviembre98-halpern.
  • Halpern, Joseph Y. (2000). "CoRR: A Computing Research Repository". Journal of Computer Documentation. 24 (2): 41–48. arXiv:cs. DL/0005003. Bibcode:2000cs......5003H. doi:10.1145/337271.337274. S2CID 5453868.
  • Luce, Richard E. (2001). "E-Prints Intersecta la Biblioteca Digital: Dentro de los Álamos arXiv". Cuestiones de Libraria en Ciencia y Tecnología (29). doi:10.5062/F44B2Z95.
  • McKiernan, Gerry (2000). "ArXiv.org: The los Alamos National Laboratory e-print server" (PDF). International Journal on Grey Literature. 1 (3): 127–138. doi:10.1108/14666180010345564. Archivado desde el original (PDF) el 5 de mayo de 2005.
  • Pinfield, Stephen (2001). "¿Cómo usan los físicos un archivo E-Print? Implications for Institutional E-Print Services". D-Lib Magazine. 7 (12). doi:10.1045/diciembre2001-pinfield.
  • Quigley, Brian (2000). "Physics Databases and the Los Alamos e-Print Archive". EContent. 23 (5): 22–26.
  • Taubes, Gary (1993). "La publicación por correo electrónico toma física por tormenta". Ciencia. 259 (5099): 1246–1248. Código:1993...259.1246T. doi:10.1126/ciencia.259.5099.1246. PMID 17732237.
  • Warner, Simeon (2001). "Open Archives Initiative protocol development and implementation at arXiv". arXiv:cs/0101027.
  • "¿Qué es q-bio?". Acceso abierto ahora. 2004.