COBOL
COBOL (un acrónimo de "lenguaje común orientado a los negocios") es un lenguaje de programación de computadora similar al inglés diseñado para uso comercial. Es un lenguaje imperativo, procedimental y, desde 2002, orientado a objetos. COBOL se utiliza principalmente en sistemas comerciales, financieros y administrativos para empresas y gobiernos. COBOL todavía se usa ampliamente en aplicaciones implementadas en computadoras centrales, como trabajos de procesamiento de transacciones y lotes a gran escala. Sin embargo, debido a su popularidad decreciente y al retiro de los programadores COBOL experimentados, los programas se están migrando a nuevas plataformas, reescribiéndolos en lenguajes modernos o reemplazándolos con paquetes de software. La mayor parte de la programación en COBOL ahora es puramente para mantener las aplicaciones existentes; sin embargo, muchas instituciones financieras grandes todavía estaban desarrollando nuevos sistemas en COBOL hasta 2006.
COBOL fue diseñado en 1959 por CODASYL y se basó en parte en el lenguaje de programación FLOW-MATIC diseñado por Grace Hopper. Fue creado como parte de un esfuerzo del Departamento de Defensa de EE. UU. para crear un lenguaje de programación portátil para el procesamiento de datos. Originalmente fue visto como un recurso provisional, pero el Departamento de Defensa rápidamente obligó a los fabricantes de computadoras a proporcionarlo, lo que resultó en su adopción generalizada. Fue estandarizado en 1968 y desde entonces ha sido revisado cuatro veces. Las expansiones incluyen soporte para programación estructurada y orientada a objetos. El estándar actual es ISO/IEC 1989:2014.
Las declaraciones de COBOL tienen una sintaxis similar a la inglesa, que fue diseñada para ser autodocumentada y muy legible. Sin embargo, es detallado y utiliza más de 300 palabras reservadas. En contraste con la sintaxis moderna y sucinta como y = x;
, COBOL tiene una sintaxis más parecida a la inglesa (en este caso, < código class="mw-highlight mw-highlight-lang-cobolfree mw-content-ltr" id="" style="" dir="ltr">MOVER x TO y).
El código COBOL se divide en cuatro divisiones (identificación, entorno, datos y procedimiento) que contienen una jerarquía rígida de secciones, párrafos y oraciones. Al carecer de una gran biblioteca estándar, el estándar especifica 43 declaraciones, 87 funciones y solo una clase.
Los informáticos académicos generalmente no estaban interesados en las aplicaciones comerciales cuando se creó COBOL y no participaron en su diseño; fue (efectivamente) diseñado desde cero como un lenguaje informático para negocios, con énfasis en entradas y salidas, cuyos únicos tipos de datos eran números y cadenas de texto. COBOL ha sido criticado a lo largo de su vida por su verbosidad, proceso de diseño y soporte deficiente para la programación estructurada. Estas debilidades dan como resultado programas monolíticos y verbosos (que pretenden parecerse al inglés) que no son fácilmente comprensibles.
Durante años, COBOL se ha asumido como un lenguaje de programación para las operaciones comerciales en mainframes, aunque en los últimos años ha surgido un interés creciente por migrar las operaciones de COBOL a la computación en la nube.
Historia y especificaciones
Antecedentes
A fines de la década de 1950, los usuarios y fabricantes de computadoras comenzaron a preocuparse por el costo creciente de la programación. Una encuesta de 1959 encontró que en cualquier instalación de procesamiento de datos, la programación costaba en promedio US$800.000 y que traducir programas para ejecutarlos en nuevo hardware costaría US$600.000. En un momento en que los nuevos lenguajes de programación proliferaban a un ritmo cada vez mayor, la misma encuesta sugirió que si se utilizara un lenguaje común orientado a los negocios, la conversión sería mucho más barata y rápida.
El 8 de abril de 1959, Mary K. Hawes, científica informática de Burroughs Corporation, convocó una reunión de representantes académicos, usuarios de computadoras y fabricantes en la Universidad de Pensilvania para organizar una reunión formal sobre lenguajes comerciales comunes. Los representantes incluyeron a Grace Hopper (inventora del lenguaje de procesamiento de datos similar al inglés FLOW-MATIC), Jean Sammet y Saul Gorn.
En la reunión de abril, el grupo solicitó al Departamento de Defensa (DoD) que patrocinara un esfuerzo para crear un lenguaje comercial común. La delegación impresionó a Charles A. Phillips, director del personal de investigación de sistemas de datos del Departamento de Defensa, quien pensó que "comprendieron completamente" los problemas del Departamento de Defensa. El Departamento de Defensa operaba 225 computadoras, tenía 175 más ordenadas y había gastado más de $ 200 millones en la implementación de programas para ejecutarlas. Los programas portátiles ahorrarían tiempo, reducirían costos y facilitarían la modernización.
Charles Phillips aceptó patrocinar la reunión y encargó a la delegación que redactara la agenda.
COBOL 60
El 28 y 29 de mayo de 1959 (exactamente un año después de la reunión Zürich ALGOL 58), se llevó a cabo una reunión en el Pentágono para discutir la creación de un lenguaje de programación común para los negocios. Asistieron 41 personas y estuvo presidido por Phillips. Al Departamento de Defensa le preocupaba si podría ejecutar los mismos programas de procesamiento de datos en diferentes computadoras. FORTRAN, el único lenguaje convencional en ese momento, carecía de las características necesarias para escribir tales programas.
Los representantes describieron con entusiasmo un lenguaje que podría funcionar en una amplia variedad de entornos, desde banca y seguros hasta servicios públicos y control de inventario. Acordaron por unanimidad que más personas deberían poder programar y que el nuevo lenguaje no debería estar restringido por las limitaciones de la tecnología contemporánea. La mayoría estuvo de acuerdo en que el idioma debería aprovechar al máximo el inglés, ser capaz de cambiar, ser independiente de las máquinas y fácil de usar, incluso a expensas del poder.
La reunión resultó en la creación de un comité directivo y comités de corto, mediano y largo alcance. Se le dio al comité de corto plazo hasta septiembre (tres meses) para producir especificaciones para un lenguaje provisional, que luego sería mejorado por los otros comités. Sin embargo, su misión oficial era identificar las fortalezas y debilidades de los lenguajes de programación existentes y no les ordenaba explícitamente que crearan un nuevo lenguaje. La fecha límite fue cumplida con incredulidad por el comité de corto alcance. Una miembro, Betty Holberton, describió el plazo de tres meses como "gran optimismo" y dudaba que el lenguaje fuera realmente un recurso provisional.
El comité directivo se reunió el 4 de junio y acordó nombrar toda la actividad como Comité de Lenguajes de Sistemas de Datos, o CODASYL, y formar un comité ejecutivo.
El comité de corto plazo estaba compuesto por miembros que representaban a seis fabricantes de computadoras y tres agencias gubernamentales. Los seis fabricantes de computadoras fueron Burroughs Corporation, IBM, Minneapolis-Honeywell (Honeywell Labs), RCA, Sperry Rand y Sylvania Electric Products. Las tres agencias gubernamentales eran la Fuerza Aérea de EE. UU., la cuenca modelo David Taylor de la Armada y la Oficina Nacional de Normas (ahora el Instituto Nacional de Normas y Tecnología). El comité estuvo presidido por Joseph Wegstein de la Oficina Nacional de Normas de EE.UU. El trabajo comenzó investigando la descripción de los datos, las declaraciones, las aplicaciones existentes y las experiencias de los usuarios.
El comité examinó principalmente los lenguajes de programación FLOW-MATIC, AIMACO y COMTRAN. El lenguaje FLOW-MATIC fue particularmente influyente porque se había implementado y porque AIMACO era un derivado de este con solo cambios menores. La inventora de FLOW-MATIC, Grace Hopper, también se desempeñó como asesora técnica del comité. Las principales contribuciones de FLOW-MATIC a COBOL fueron nombres largos de variables, palabras en inglés para comandos y la separación de descripciones e instrucciones de datos. A veces se hace referencia a Hopper como "la madre de COBOL" o "la abuela de COBOL", aunque Jean Sammet, diseñador principal de COBOL, afirmó que Hopper "no fue la madre, creadora o desarrolladora de Cobol".
El lenguaje COMTRAN de IBM, inventado por Bob Bemer, fue considerado como un competidor de FLOW-MATIC por un comité de corto alcance formado por colegas de Grace Hopper.
Algunas de sus funciones no se incorporaron a COBOL para que no pareciera que IBM había dominado el proceso de diseño, y Jean Sammet dijo en 1981 que había habido un "fuerte sesgo anti-IBM" de algunos miembros del comité (incluida ella misma).
En un caso, después de que Roy Goldfinger, autor del manual COMTRAN y miembro del comité de rango intermedio, asistiera a una reunión del subcomité para apoyar su lenguaje y fomentar el uso de expresiones algebraicas, Grace Hopper envió un memorándum al comité de rango corto reiterando a Sperry Rand & #39;esfuerzos para crear un lenguaje basado en el inglés.
En 1980, Grace Hopper comentó que "COBOL 60 es 95% FLOW-MATIC" y que COMTRAN había tenido un "extremadamente pequeño" influencia. Además, dijo que afirmaría que el trabajo fue influenciado tanto por FLOW-MATIC como por COMTRAN solo para "mantener felices a otras personas [para que] no intenten noquearnos".
Las funciones de COMTRAN incorporadas en COBOL incluían fórmulas, la cláusula PICTURE, una instrucción IF
mejorada, que evitaba la necesidad de GO TO y un sistema de administración de archivos más sólido.
La utilidad del trabajo del comité fue tema de gran debate. Mientras que algunos miembros pensaron que el lenguaje tenía demasiados compromisos y fue el resultado del diseño de un comité, otros sintieron que era mejor que los tres lenguajes examinados. Algunos sintieron que el lenguaje era demasiado complejo; otros, demasiado simples. Las características controvertidas incluían aquellas que algunos consideraban inútiles o demasiado avanzadas para los usuarios de procesamiento de datos. Tales funciones incluían expresiones booleanas, fórmulas y tablas subíndices (índices). Otro punto de controversia fue si hacer que las palabras clave fueran sensibles al contexto y el efecto que tendría en la legibilidad. Aunque se rechazaron las palabras clave sensibles al contexto, el enfoque se utilizó más tarde en PL/I y parcialmente en COBOL a partir de 2002. Se prestó poca atención a la interactividad, la interacción con los sistemas operativos (pocos existían en ese momento) y las funciones (pensadas como puramente matemáticas). y de ninguna utilidad en el tratamiento de datos).
Las especificaciones se presentaron al comité ejecutivo el 4 de septiembre. No cumplieron con las expectativas: Joseph Wegstein señaló que 'contiene puntos ásperos y requiere algunas adiciones', y Bob Bemer los describió más tarde como una 'mezcolanza'. Al subcomité se le dio hasta diciembre para mejorarlo.
En una reunión de mediados de septiembre, el comité discutió el nombre del nuevo idioma. Las sugerencias incluyeron "OCUPADO" (Sistema de negocios), "INFOSYL" (Lenguaje del sistema de información) y "COCOSYL" (Lenguaje común de sistemas informáticos). No está claro quién acuñó el nombre 'COBOL', aunque Bob Bemer afirmó más tarde que había sido su sugerencia.
En octubre, el comité de rango intermedio recibió copias de la especificación del lenguaje FACT creada por Roy Nutt. Sus características impresionaron tanto al comité que aprobaron una resolución para basar COBOL en él. Este fue un golpe para el comité de corto alcance, que había hecho un buen progreso en la especificación. A pesar de ser técnicamente superior, FACT no se creó pensando en la portabilidad o mediante el consenso del fabricante y el usuario. También carecía de una implementación demostrable, lo que permitió a los partidarios de un COBOL basado en FLOW-MATIC anular la resolución. El representante de RCA, Howard Bromberg, también bloqueó FACT, para que el trabajo de RCA en una implementación de COBOL no se desperdiciara.
Pronto se hizo evidente que el comité era demasiado grande para avanzar rápidamente. Un frustrado Howard Bromberg compró una lápida de $15 con "COBOL" grabado en él y se lo envió a Charles Phillips para demostrar su disgusto. Se formó un subcomité para analizar los idiomas existentes y estuvo compuesto por seis personas:
- William Selden y Gertrude Tierney de IBM,
- Howard Bromberg y Howard Descuento de RCA,
- Vernon Reeves y Jean E. Sammet de Sylvania Electric Products.
El subcomité hizo la mayor parte del trabajo creando la especificación, dejando que el comité de corto plazo revisara y modificara su trabajo antes de producir la especificación final.
Las especificaciones fueron aprobadas por el comité ejecutivo el 8 de enero de 1960 y enviadas a la imprenta del gobierno, que las imprimió como COBOL 60. Los objetivos declarados del lenguaje eran permitir que los programas portátiles y eficientes se escribieran fácilmente, permitir a los usuarios pasar a nuevos sistemas con un esfuerzo y costo mínimos, y ser adecuado para programadores sin experiencia. Posteriormente, el Comité Ejecutivo de CODASYL creó el Comité de Mantenimiento de COBOL para responder a las preguntas de los usuarios y proveedores y para mejorar y ampliar las especificaciones.
Durante 1960, creció la lista de fabricantes que planeaban construir compiladores COBOL. Para septiembre, cinco fabricantes más se habían unido a CODASYL (Bendix, Control Data Corporation, General Electric (GE), National Cash Register y Philco), y todos los fabricantes representados habían anunciado compiladores COBOL. GE e IBM planearon integrar COBOL en sus propios lenguajes, GECOM y COMTRAN, respectivamente. En contraste, International Computers and Tabulators planeó reemplazar su lenguaje, CODEL, con COBOL.
Mientras tanto, RCA y Sperry Rand trabajaron en la creación de compiladores COBOL. El primer programa COBOL se ejecutó el 17 de agosto en un RCA 501. Los días 6 y 7 de diciembre, el mismo programa COBOL (aunque con cambios menores) se ejecutó en una computadora RCA y una computadora Remington-Rand Univac, lo que demostró que se podía lograr la compatibilidad.
Las influencias relativas de qué lenguajes se usaron continúan hasta el día de hoy en el aviso recomendado impreso en todos los manuales de referencia de COBOL:
COBOL es un lenguaje industrial y no es propiedad de ninguna empresa o grupo de empresas, o de cualquier organización o grupo de organizaciones.
Ninguna garantía, expresada o implícita, es hecha por cualquier contribuyente o por el Comité COBOL CODASYL en cuanto a la exactitud y funcionamiento del sistema de programación y lenguaje. Además, ninguna responsabilidad es asumida por cualquier contribuyente, o por el comité, en relación con ello. Los autores y titulares de derechos de autor del material de copyright utilizado aquí son los siguientes:
- FLOW-MATIC (trademark of Unisys Corporation), Programming for the UNIVAC (R) I and II, Data Automation Systems, copyrighted 1958, 1959, by Unisys Corporation; IBM Commercial Translator Form No. F28-8013, copyrighted 1959 by IBM; FACT, DSI 27A5260-2760, copyrighted 1960 by Minneapolis-Honeywell.
Han autorizado específicamente el uso de este material, total o parcialmente, en las especificaciones de COBOL. Dicha autorización se extiende a la reproducción y utilización de especificaciones de COBOL en manuales de programación o publicaciones similares.
COBOL-61 a COBOL-65
Es bastante poco probable que Cobol esté cerca para finales de la década.
Anónimo, junio de 1960
Se encontraron muchas fallas lógicas en COBOL 60, lo que llevó a Charles Katz de General Electric a advertir que no podía interpretarse sin ambigüedades. Un comité reacio a corto plazo promulgó una limpieza total y, en marzo de 1963, se informó que la sintaxis de COBOL era tan definible como la de ALGOL, aunque persistían las ambigüedades semánticas.
Los primeros compiladores de COBOL eran primitivos y lentos. Una evaluación de la Marina de los EE. UU. de 1962 encontró velocidades de compilación de 3 a 11 declaraciones por minuto. A mediados de 1964, habían aumentado de 11 a 1000 declaraciones por minuto. Se observó que aumentar la memoria aumentaría drásticamente la velocidad y que los costos de compilación variaban enormemente: los costos por extracto oscilaban entre $0,23 y $18,91.
A fines de 1962, IBM anunció que COBOL sería su principal lenguaje de desarrollo y que cesaría el desarrollo de COMTRAN.
La especificación COBOL se revisó tres veces en los cinco años posteriores a su publicación. COBOL-60 fue reemplazado en 1961 por COBOL-61. Luego, esto fue reemplazado por las especificaciones COBOL-61 Extended en 1963, que introdujeron las funciones de clasificación y redacción de informes. Las instalaciones adicionales corrigieron fallas identificadas por Honeywell a fines de 1959 en una carta al comité de corto alcance. COBOL Edition 1965 aportó más aclaraciones a las especificaciones e introdujo funciones para el manejo de tablas y archivos de almacenamiento masivo.
COBOL-68
Comenzaron los esfuerzos para estandarizar COBOL para superar las incompatibilidades entre versiones. A finales de 1962, tanto ISO como el Instituto de Normas de los Estados Unidos de América (ahora ANSI) formaron grupos para crear normas. ANSI produjo el USA Standard COBOL X3.23 en agosto de 1968, que se convirtió en la piedra angular de las versiones posteriores. Esta versión se conocía como American National Standard (ANS) COBOL y fue adoptada por ISO en 1972.
COBOL-74
Para 1970, COBOL se había convertido en el lenguaje de programación más utilizado en el mundo.
Independientemente del comité de ANSI, el Comité de lenguaje de programación de CODASYL estaba trabajando para mejorar el lenguaje. Describieron nuevas versiones en 1968, 1969, 1970 y 1973, incluidos cambios como nuevas funciones de comunicación entre programas, depuración y fusión de archivos, así como funciones mejoradas de manejo de cadenas e inclusión de bibliotecas. Aunque CODASYL era independiente del comité de ANSI, ANSI utilizó el CODASYL Journal of Development para identificar características que eran lo suficientemente populares como para justificar su implementación. El Comité de Lenguajes de Programación también se puso en contacto con ECMA y el comité japonés de estándares COBOL.
Sin embargo, el Comité de Lenguajes de Programación no era muy conocido. El vicepresidente, William Rinehuls, se quejó de que dos tercios de la comunidad COBOL no sabían de la existencia del comité. También era pobre, carecía de los fondos para hacer que los documentos públicos, como las actas de las reuniones y las propuestas de cambio, estuvieran disponibles de forma gratuita.
En 1974, ANSI publicó una versión revisada de (ANS) COBOL, que contenía nuevas funciones, como organizaciones de archivos, DELETE
y el módulo de segmentación.
Las funciones eliminadas incluían la declaración NOTE
, la declaración EXAMINE
declaración (que fue reemplazada por INSPECT
) y el módulo de acceso aleatorio definido por el implementador (que fue reemplazado por el nuevo secuencial y módulos de E/S relativos). Estos conformaron 44 cambios, que hicieron que las declaraciones existentes fueran incompatibles con el nuevo estándar.
El redactor de informes estaba programado para ser eliminado de COBOL, pero se restableció antes de que se publicara el estándar. Posteriormente, ISO adoptó la norma actualizada en 1978.
COBOL-85
En junio de 1978, se comenzó a trabajar en la revisión de COBOL-74. El estándar propuesto (comúnmente llamado COBOL-80) difería significativamente del anterior, lo que generó preocupaciones sobre la incompatibilidad y los costos de conversión. En enero de 1981, Joseph T. Brophy, vicepresidente sénior de Travelers Insurance, amenazó con demandar al comité estándar porque no era compatible con versiones posteriores de COBOL-74. El Sr. Brophy describió las conversiones anteriores de su base de código de 40 millones de líneas como "no productivas" y un "desperdicio total de nuestros recursos de programador". Más tarde ese año, la Asociación de Gestión de Procesamiento de Datos (DPMA) dijo que se oponía "firmemente" al nuevo estándar, citando "prohibitivo" costos de conversión y mejoras que fueron "impuestas al usuario".
Durante el primer período de revisión pública, el comité recibió 2200 respuestas, de las cuales 1700 fueron cartas de formato negativo. Otras respuestas fueron análisis detallados del efecto que tendría COBOL-80 en sus sistemas; se predijo que los costos de conversión serían de al menos 50 centavos por línea de código. Menos de una docena de las respuestas estaban a favor de la norma propuesta.
ISO TC97-SC5 instaló en 1979 el grupo internacional de expertos COBOL, por iniciativa de Wim Ebbinkhuijsen. El grupo estaba formado por expertos en COBOL de muchos países, incluido Estados Unidos. Su objetivo era lograr la comprensión y el respeto mutuos entre ANSI y el resto del mundo con respecto a la necesidad de nuevas características de COBOL. Después de tres años, ISO cambió el estado del grupo a un grupo de trabajo formal: WG 4 COBOL. El grupo asumió la propiedad principal y el desarrollo del estándar COBOL, donde ANSI realizó la mayoría de las propuestas.
En 1983, la DPMA retiró su oposición a la norma, citando la capacidad de respuesta del comité a las preocupaciones del público. En el mismo año, un estudio de la Oficina Nacional de Normas concluyó que la norma propuesta presentaría pocos problemas. Un año después, DEC lanzó un VAX/VMS COBOL-80, quien señaló que la conversión de programas COBOL-74 presentaba pocos problemas. La nueva instrucción EVALUATE
y PERFORM
en línea fueron particularmente bien recibidos y mejoraron la productividad, gracias al flujo de control simplificado y la depuración.
La segunda revisión pública obtuvo otras 1000 respuestas (principalmente negativas), mientras que la última solo obtuvo 25, momento en el que se habían abordado muchas inquietudes.
En 1985, el Grupo de trabajo 4 de ISO aceptó la versión entonces del estándar propuesto por ANSI, realizó varios cambios y lo estableció como el nuevo estándar ISO COBOL 85. Se publicó a fines de 1985.
Se cambiaron o quedaron obsoletas sesenta funciones y se agregaron 115, como:
- Terminadores de aplicación ()
END-IF
,END-PERFORM
,END-READ
, etc.) - Subprogramas anidados
CONTINUE
, una declaración de no cooperaciónEVALUATE
, una declaración de conmutaciónINITIALIZE
, una declaración que puede establecer grupos de datos a sus valores predeterminados- Inline
PERFORM
cuerpos de bucle – antes, los cuerpos de bucle tenían que ser especificados en un procedimiento separado - Modificación de referencia, que permite el acceso a subestrings
- Códigos de estado I/O.
El nuevo estándar fue adoptado por todos los organismos nacionales de normalización, incluido ANSI.
Dos enmiendas siguieron en 1989 y 1993, la primera introduciendo funciones intrínsecas y la otra brindando correcciones.
COBOL 2002 y COBOL orientada a objetos
(feminine)En 1997, Gartner Group estimó que había un total de 200 000 millones de líneas de COBOL en existencia, que ejecutaban el 80 % de todos los programas comerciales.
A principios de la década de 1990, se comenzó a trabajar para agregar la orientación a objetos en la próxima revisión completa de COBOL. Las funciones orientadas a objetos se tomaron de C++ y Smalltalk. La estimación inicial fue completar esta revisión en 1997, y un Borrador del Comité (CD) de ISO estaba disponible para 1997. Algunos proveedores (incluidos Micro Focus, Fujitsu e IBM) introdujeron una sintaxis orientada a objetos basada en borradores de la revisión completa. La norma ISO aprobada final fue aprobada y publicada a finales de 2002.
Fujitsu/GTSoftware, Micro Focus y RainCode introdujeron compiladores COBOL orientados a objetos dirigidos a.NET Framework.
Hubo muchas otras características nuevas, muchas de las cuales habían estado en el CODASYL COBOL Journal of Development desde 1978 y habían perdido la oportunidad de ser incluidas en COBOL-85. Estas otras características incluyen:
- Código de forma gratuita
- Funciones definidas por el usuario
- Recursión
- Procesamiento local
- Soporte para conjuntos de caracteres extendidos como Unicode
- Tipos de datos de punto flotante y binarios (hasta entonces, elementos binarios fueron truncados basados en la especificación base-10 de su declaración)
- Resultados aritméticos portátiles
- Tipos de datos bit y booleano
- Puntos y sintaxis para obtener y liberar almacenamiento
- El
SCREEN SECTION
para interfaces de usuario basadas en texto - El
VALIDATE
instalaciones - Mejora de la interoperabilidad con otros idiomas de programación y entornos marco tales como. NET y Java.
Se publicaron tres correcciones para la norma: dos en 2006 y una en 2009.
COBOL 2014
Entre 2003 y 2009, se produjeron tres informes técnicos que describen la finalización de objetos, el procesamiento XML y las clases de colección para COBOL.
COBOL 2002 sufría de soporte deficiente: ningún compilador admitía completamente el estándar. Micro Focus descubrió que se debía a la falta de demanda de los usuarios por las nuevas funciones y a la abolición del conjunto de pruebas NIST, que se había utilizado para probar la conformidad del compilador. También se encontró que el proceso de estandarización era lento y carecía de recursos.
COBOL 2014 incluye los siguientes cambios:
- Los resultados aritméticos portátiles han sido reemplazados por IEEE 754 tipos de datos
- Las principales características se han hecho opcionales, como las
VALIDATE
instalaciones, el escritor de informes y la instalación de control de pantalla - Método sobrecarga
- Tablas dinámicas de capacidad (una característica baja del proyecto de COBOL 2002)
Legado
Los programas COBOL se utilizan globalmente en gobiernos y empresas y se ejecutan en diversos sistemas operativos como z/OS, z/VSE, VME, Unix, OpenVMS y Windows. En 1997, Gartner Group informó que el 80 % de los negocios del mundo se ejecutaban en COBOL con más de 200 000 millones de líneas de código y 5 000 millones de líneas más escritas anualmente.
Cerca de finales del siglo XX, el problema del año 2000 (Y2K) fue el centro de un importante esfuerzo de programación COBOL, a veces por parte de los mismos programadores que habían diseñado los sistemas décadas antes. El nivel particular de esfuerzo requerido para corregir el código COBOL se ha atribuido a la gran cantidad de COBOL orientado a los negocios, ya que las aplicaciones comerciales usan mucho las fechas y los campos de datos de longitud fija. Algunos estudios atribuyen hasta el "24% de los costos de reparación de software Y2K a Cobol". Después del esfuerzo de limpieza puesto en estos programas para Y2K, una encuesta de 2003 encontró que muchos seguían en uso. Los autores dijeron que los datos de la encuesta sugieren "una disminución gradual en la importancia de COBOL en el desarrollo de aplicaciones durante los [siguientes] 10 años a menos que... se pueda adoptar la integración con otros lenguajes y tecnologías".
En 2006 y 2012, las encuestas de Computerworld (de 352 lectores) encontraron que más del 60% de las organizaciones usaban COBOL (más que C++ y Visual Basic.NET) y que para la mitad de ellas, COBOL era utilizado para la mayoría de su software interno. El 36 % de los gerentes dijo que planeaba migrar desde COBOL y el 25 % dijo que le gustaría hacerlo si fuera más barato. En cambio, algunas empresas han migrado sus sistemas de mainframes costosos a sistemas más modernos y económicos, mientras mantienen sus programas COBOL.
Testimonio ante la Cámara de Representantes en 2016 indicó que COBOL todavía está en uso por muchas agencias federales. Reuters informó en 2017 que el 43 % de los sistemas bancarios todavía usaban COBOL con más de 220 000 millones de líneas de código COBOL en uso.
Para 2019, la cantidad de programadores de COBOL se estaba reduciendo rápidamente debido a las jubilaciones, lo que provocó una brecha de habilidades inminente en las organizaciones comerciales y gubernamentales que todavía usan sistemas mainframe para el procesamiento de transacciones de gran volumen. Los esfuerzos para reescribir los sistemas en lenguajes más nuevos han resultado costosos y problemáticos, al igual que la subcontratación del mantenimiento del código, por lo que se recomiendan propuestas para capacitar a más personas en COBOL.
Durante la pandemia de COVID-19 y el consiguiente aumento del desempleo, varios estados de EE. UU. informaron de la escasez de programadores COBOL cualificados para respaldar los sistemas heredados que se utilizan para la gestión de prestaciones por desempleo. Muchos de estos sistemas habían estado en proceso de conversión a lenguajes de programación más modernos antes de la pandemia, pero el proceso tuvo que suspenderse. De manera similar, el Servicio de Impuestos Internos de EE. UU. se apresuró a parchear su archivo maestro individual basado en COBOL para desembolsar las decenas de millones de pagos exigidos por la Ley de Ayuda, Alivio y Seguridad Económica del Coronavirus.
Características
Sintaxis
COBOL tiene una sintaxis similar al inglés, que se usa para describir casi todo en un programa. Por ejemplo, una condición se puede expresar como x ES MAYOR QUE y
o más concisamente como x MAYOR y
o x > y. Las condiciones más complejas se pueden "abreviar" mediante la eliminación de condiciones y variables repetidas. Por ejemplo,
a > b span> Y a intervalo> > c< /span> O a< /span> = d< /span>
se puede acortar a a > b Y c O = d< /span>. Para admitir esta sintaxis similar al inglés, COBOL tiene más de 300 palabras clave. Algunas de las palabras clave son ortografías simples alternativas o pluralizadas de la misma palabra, lo que proporciona declaraciones y cláusulas más parecidas al inglés; por ejemplo,
IN
y OF
Las palabras clave se pueden usar indistintamente, al igual que HORA
y TIMES
, y VALOR
y VALORES.
Cada programa COBOL se compone de cuatro elementos léxicos básicos: palabras, literales, cadenas de caracteres de imágenes (consulte la cláusula § PICTURE) y separadores. Las palabras incluyen palabras reservadas e identificadores definidos por el usuario. Tienen hasta 31 caracteres y pueden incluir letras, dígitos, guiones y guiones bajos. Los literales incluyen números (por ejemplo, 12
) y cadenas (por ejemplo, '¡Hola!'
). Los separadores incluyen el carácter de espacio y comas y puntos y comas seguidos de un espacio.
Un programa COBOL se divide en cuatro divisiones: la división de identificación, la división de entorno, la división de datos y la división de procedimientos. La división de identificación especifica el nombre y el tipo del elemento fuente y es donde se especifican las clases y las interfaces. La división de entorno especifica cualquier característica del programa que dependa del sistema que lo ejecuta, como archivos y juegos de caracteres. La división de datos se utiliza para declarar variables y parámetros. La división de procedimiento contiene las declaraciones del programa. Cada división se subdivide en secciones, que se componen de párrafos.
Metalenguaje
La sintaxis de COBOL generalmente se describe con un metalenguaje único que utiliza llaves, corchetes, barras y subrayado. El metalenguaje fue desarrollado para las especificaciones COBOL originales. Aunque la forma Backus-Naur existía en ese momento, el comité no había oído hablar de ella.
Elemento | Apariencia | Función |
---|---|---|
Todas las capitales | EXAMPLE | Palabra reservada |
Subrayando | EXAMPLE | La palabra reservada es obligatoria |
Brazos | {} | Sólo se puede seleccionar una opción |
Brackets | [] | Se pueden seleccionar opciones cero o una |
Elipsis | ... | El elemento anterior puede repetirse |
Bares | {fnMicrosoft Sans Serif} | Se puede seleccionar una o más opciones. Cualquier opción solo se puede seleccionar una vez. |
[sobrevivir] | Se pueden seleccionar opciones cero o más. Cualquier opción solo se puede seleccionar una vez. |
Como ejemplo, considere la siguiente descripción de una instrucción ADD
:
Esta descripción permite las siguientes variantes:
ADD 1 TO xADD 1, a, b TO x ROUNDED, Sí., z ROUNDEDADD a, b TO c ON TAMAÑO ERROR DISPLAY "Error"END-ADDADD a TO b NO TAMAÑO ERROR DISPLAY "No hay error" ON TAMAÑO ERROR DISPLAY "Error"
Formato de código
El apogeo de la popularidad de COBOL coincidió con la era de las máquinas perforadoras y las tarjetas perforadas. El programa en sí se escribió en tarjetas perforadas, luego se leyó y compiló, y los datos introducidos en el programa a veces también estaban en tarjetas.
COBOL se puede escribir en dos formatos: fijo (el predeterminado) o gratuito. En formato fijo, el código debe alinearse para que quepa en ciertas áreas (un vestigio del uso de tarjetas perforadas). Hasta COBOL 2002, estos eran:
Nombre | Columna(s) | Usage |
---|---|---|
Zona número de secuencia | 1–6 | Originalmente utilizado para números de tarjeta/línea (facilitando la clasificación mecánica de tarjetas perforadas para asegurar la secuencia de código del programa deseado después de la edición manual / manipulación), esta área es ignorada por el compilador |
Esfera indicadora | 7 | Aquí se permiten los siguientes caracteres:
|
Zona A | 8 a 11 | Esto contiene: DIVISION , SECTION y cabeceras de procedimiento; números de nivel 01 y 77 y descriptores de archivo/report
|
Zona B | 12 a 72 | Cualquier otro código no permitido en la Zona A |
Área de nombre del programa | 73 – | Históricamente hasta la columna 80 para tarjetas perforadas, se utiliza para identificar el programa o secuencia de la tarjeta pertenece a |
En COBOL 2002, las áreas A y B se fusionaron para formar el área de texto del programa, que ahora termina en una columna definida por el implementador.
COBOL 2002 también introdujo código de formato libre. El código de formato libre se puede colocar en cualquier columna del archivo, como en los lenguajes de programación más nuevos. Los comentarios se especifican usando *>
, que se pueden colocar en cualquier lugar y también se pueden usar en código fuente de formato fijo. Las líneas de continuación no están presentes y la directiva >>PAGE
reemplaza el indicador /
.
División de identificación
La división de identificación identifica la siguiente entidad de código y contiene la definición de una clase o interfaz.
Programación orientada a objetos
Las clases y las interfaces han estado en COBOL desde 2002. Las clases tienen objetos de fábrica, que contienen métodos y variables de clase, y objetos de instancia, que contienen métodos y variables de instancia. La herencia y las interfaces proporcionan polimorfismo. El soporte para la programación genérica se proporciona a través de clases parametrizadas, que se pueden instanciar para usar cualquier clase o interfaz. Los objetos se almacenan como referencias que pueden estar restringidas a un cierto tipo. Hay dos formas de llamar a un método: INVOKE
declaración, que actúa de manera similar a CALL
, o a través de invocación de métodos, que es análoga al uso de funciones.
* Son equivalentes.INVOKE mi clase "foo" RETURNING VarMOVE mi clase::"foo" TO Var * Invocación del método Inline
COBOL no proporciona una forma de ocultar métodos. Sin embargo, los datos de clase se pueden ocultar declarándolos sin una cláusula de PROPIEDAD, lo que deja al usuario sin forma de acceder a ellos. La sobrecarga de métodos se agregó en COBOL 2014.
División de Medio Ambiente
La división de entorno contiene la sección de configuración y la sección de entrada-salida. La sección de configuración se utiliza para especificar funciones variables como como signos de moneda, locales y juegos de caracteres. La sección de entrada y salida contiene información relacionada con el archivo.
Archivos
COBOL admite tres formatos de archivo u organizaciones: secuencial, indexado y relativo. En los archivos secuenciales, los registros son contiguos y deben recorrerse secuencialmente, de forma similar a una lista enlazada. Los archivos indexados tienen uno o más índices que permiten acceder aleatoriamente a los registros y que se pueden ordenar en ellos. Cada registro debe tener una clave única, pero otras claves de registro alternativas no necesitan ser únicas. Las implementaciones de archivos indexados varían entre proveedores, aunque las implementaciones comunes, como C-ISAM y VSAM, se basan en ISAM de IBM. Los archivos relativos, como los archivos indexados, tienen una clave de registro única, pero no tienen claves alternativas. La clave de un registro relativo es su posición ordinal; por ejemplo, el décimo registro tiene una clave de 10. Esto significa que crear un registro con una clave de 5 puede requerir la creación de registros precedentes (vacíos). Los archivos relativos también permiten el acceso secuencial y aleatorio.
Una extensión no estándar común es la organización línea secuencial, utilizada para procesar archivos de texto. Los registros en un archivo terminan con una nueva línea y pueden tener una longitud variable.
División de datos
La división de datos se divide en seis secciones que declaran diferentes elementos: la sección de archivo, para registros de archivo; la sección de trabajo-almacenamiento, para variables estáticas; la sección de almacenamiento local, para variables automáticas; la sección de enlace, para parámetros y el valor de retorno; la sección de informe y la sección de pantalla, para interfaces de usuario basadas en texto.
Datos agregados
Los elementos de datos en COBOL se declaran jerárquicamente mediante el uso de números de nivel que indican si un elemento de datos es parte de otro. Un artículo con un número de nivel más alto está subordinado a un artículo con uno más bajo. Los elementos de datos de nivel superior, con un número de nivel de 1, se denominan registros. Los elementos que tienen datos agregados subordinados se denominan elementos de grupo; los que no lo son se denominan artículos elementales. Los números de nivel utilizados para describir elementos de datos estándar están entre 1 y 49.
01 algo-record. * Tema del registro del grupo 05 num PIC 9(10). * Tema elemental 05 la fecha. * Aggregate (sub)group record item 10 el año PIC 9(4). * Tema elemental 10 el mes PIC 99. * Tema elemental 10 el día PIC 99. * Tema elemental
En el ejemplo anterior, elemento elemental num
y el elemento de grupo the-date
están subordinados al registro algún registro
, mientras que los elementos elementales el-año
, el-mes
, y the-day
forman parte del elemento del grupo la-fecha
.
Los elementos subordinados se pueden desambiguar con IN
(o OF
) palabra clave. Por ejemplo, considere el código de ejemplo anterior junto con el siguiente ejemplo:
01 fecha de venta. 05 el año PIC 9(4). 05 el mes PIC 99. 05 el día PIC 99.
Los nombres el-año
, el-mes
, y the-day
son ambiguos en sí mismos, ya que más de un elemento de datos se define con esos nombres. Para especificar un elemento de datos en particular, por ejemplo, uno de los elementos contenidos en el sale-date
, el programador usaría el -year IN sale-date
(o el equivalente el -año DE venta-fecha
). (Esta sintaxis es similar a la "notación de puntos" admitida por la mayoría de los lenguajes contemporáneos).
Otros niveles de datos
Se utiliza un número de nivel de 66 para declarar una reagrupación de elementos previamente definidos, independientemente de cómo estén estructurados esos elementos. Este nivel de datos, también denominado por el RENAMES< La cláusula /code>
rara vez se usa y, alrededor de 1988, generalmente se encontraba en programas antiguos. Su capacidad para ignorar los datos de la estructura jerárquica y lógica hizo que su uso no fuera recomendado y muchas instalaciones prohibieran su uso.
01 cliente-record. 05 cust-key PIC X(10). 05 cust-name. 10 cust-first-name PIC X(30). 10 Cust-last-name PIC X(30). 05 cust-dob PIC 9(8). 05 cust-balance PIC 9(7)V99. 66 cust-personal-details RENAMES cust-name THRU cust-dob. 66 cust-all-details RENAMES cust-name THRU cust-balance.
Un número de nivel 77 indica que el elemento es independiente y, en tales situaciones, es equivalente al número de nivel 01. Por ejemplo, el siguiente código declara dos elementos de datos de nivel 77, nombre-propiedad
y sales-region
, que son elementos de datos no grupales que son independientes de (no subordinados a) ningún otro elemento de datos:
77 nombre de propiedad PIC X(80). 77 ventas-región PIC 9(5).
Un número de nivel 88 declara un nombre de condición (el llamado nivel 88) que es verdadero cuando su elemento de datos principal contiene uno de los valores especificados en su cláusula VALUE
. Por ejemplo, el siguiente código define dos elementos de nombre de condición de 88 niveles que son verdaderos o falsos según el valor de datos de carácter actual del tipo de salario
. Cuando el elemento de datos contiene un valor de 'H'
, el nombre de la condición el salario es por hora
es verdadero, mientras que cuando contiene un valor de & #39;S'
o 'Y'
, el nombre de la condición salario -is-anual
es verdadero. Si el elemento de datos contiene algún otro valor, ambos nombres de condición son falsos.
01 tipo salarial PIC X. 88 salario es hora VALOR "H". 88 salario anual VALOR "S", "Y".
Tipos de datos
COBOL estándar proporciona los siguientes tipos de datos:
Tipo de datos | Declaración de muestras | Notas |
---|---|---|
alfabético | PIC A(30) | Puede contener sólo letras o espacios. |
Alphanumeric | PIC X(30) | Puede contener cualquier personaje. |
Boolean | PIC 1 USAGE BIT | Datos almacenados en forma de 0s y 1s, como número binario. |
Índice | USAGE INDEX | Se utiliza para elementos de tabla de referencia. |
Nacional | PIC N(30) | Similar a alfanumérico, pero usando un conjunto de caracteres extendido, por ejemplo UTF-8. |
Numeric | PIC 9(5)V9(2) | Contiene exactamente 7 dígitos (7=5+2). 'V' localiza el decimal implícito en un número de punto fijo. |
Objeto | USAGE OBJECT REFERENCE | Puede referirse a un objeto o NULL .
|
Pointer | USAGE POINTER |
La seguridad de tipo es variable en COBOL. Los datos numéricos se convierten entre diferentes representaciones y tamaños de forma silenciosa y los datos alfanuméricos se pueden colocar en cualquier elemento de datos que se pueda almacenar como una cadena, incluidos los datos numéricos y de grupo. Por el contrario, las referencias a objetos y los punteros solo pueden asignarse desde elementos del mismo tipo y sus valores pueden estar restringidos a un determinado tipo.
Cláusula IMAGEN
Una IMAGEN
(o PIC
) es una cadena de caracteres, cada uno de los cuales representa una porción del elemento de datos y lo que puede contener. Algunos caracteres de imagen especifican el tipo de elemento y cuántos caracteres o dígitos ocupa en la memoria. Por ejemplo, 9
indica un dígito decimal y una S
indica que el elemento está firmado. Otros caracteres de imagen (llamados caracteres de inserción y edición) especifican cómo debe formatearse un elemento. Por ejemplo, una serie de caracteres +
definen las posiciones de los caracteres así como también cómo se va a colocar un carácter de signo inicial dentro de los datos de caracteres finales; el carácter no numérico más a la derecha contendrá el signo del elemento, mientras que otras posiciones de carácter corresponden a un +
a la izquierda de esta posición contendrá un espacio. Los caracteres repetidos se pueden especificar de forma más concisa especificando un número entre paréntesis después de un carácter de imagen; por ejemplo, 9(7)
es equivalente a < code class="mw-highlight mw-highlight-lang-text mw-content-ltr" id="" style="" dir="ltr">9999999. Especificaciones de imagen que contienen solo dígitos (9
) y signo (Los caracteres S
) definen puramente elementos de datos numéricos, mientras que las especificaciones de imágenes contienen elementos alfabéticos (A
) o alfanumérico (X código>) los caracteres definen elementos de datos alfanuméricos. La presencia de otros caracteres de formato define elementos de datos numérico editado o alfanumérico editado.
PICTURE cláusula
| Valor en | Valor fuera |
---|---|---|
PIC 9(5) | 100 | 00100 |
"Hello" | "Hello" (esto es legal, pero resulta en comportamiento indefinido)
| |
PIC +++++ | -10 | " -10" (puntos principales)
|
PIC 99/99/9(4) | 30042003 | "30/04/2003" |
PIC *(4)9.99 | 100.50 | "**100.50" |
0 | "****0.00" | |
PIC X(3)BX(3)BX(3) | "ABCDEFGHI" | "ABC DEF GHI" |
Cláusula USO
La cláusula USAGE
declara que los datos de formato son almacenado. Según el tipo de datos, puede complementar o usarse en lugar de un PICTURE
. Si bien se puede usar para declarar punteros y referencias a objetos, está orientado principalmente a especificar tipos numéricos. Estos formatos numéricos son:
- binario, donde el tamaño mínimo es especificado por el
PICTURE
o por una cláusulaUSAGE
cláusulas tales comoBINARY-LONG
. USAGE COMPUTATIONAL
, donde los datos pueden ser almacenados en cualquier formato que proporcione la implementación; a menudo equivalente aUSAGE BINARY
USAGE DISPLAY
, el formato predeterminado, donde los datos se almacenan como una cadena- Punto de inundación, ya sea en un formato dependiente de la implementación o según IEEE 754.
USAGE NATIONAL
, donde los datos se almacenan como una cadena usando un conjunto de caracteres extendidoUSAGE PACKED-DECIMAL
, donde los datos se almacenan en el formato decimal más pequeño posible (decimal codificado binariamente)
Redactor de informes
El redactor de informes es una función declarativa para crear informes. El programador solo necesita especificar el diseño del informe y los datos necesarios para producirlo, lo que lo libera de tener que escribir código para manejar cosas como saltos de página, formato de datos y encabezados y pies de página.
Los informes están asociados con archivos de informes, que son archivos en los que solo se pueden escribir a través de sentencias del autor de informes.
FD report-out INFORME ventas-report.
Cada informe se define en la sección de informes de la división de datos. Un informe se divide en grupos de informes que definen los encabezados, los pies y los detalles del informe. Los informes funcionan en torno a las interrupciones de control jerárquicas. Las rupturas de control ocurren cuando una variable clave cambia su valor; por ejemplo, al crear un informe que detalla los clientes' pedidos, podría ocurrir una ruptura de control cuando el programa llega a los pedidos de un cliente diferente. Aquí hay una descripción de informe de ejemplo para un informe que proporciona las ventas de un vendedor y que advierte sobre cualquier registro no válido:
RD ventas-report PÁGINA LIMITS 60 LÍNEAS PRIMERA DETAIL 3 CONTROL Nombre del vendedor. 01 TYPE PÁGINA HEADING. 03 COL 1 VALOR "Informe de ventas". 03 COL 74 VALOR "Page". 03 COL 79 PIC Z9 SOURCE PAGE-COUNTER. 01 ventas al día TYPE DETAIL, LINE + 1. 03 COL 3 VALOR "Ventas en". 03 COL 12 PIC 99/99/9999 SOURCE fecha de venta. 03 COL 21 VALOR "fueron". 03 COL 26 PIC $$$9.99 SOURCE importe de las ventas. 01 invalid-sales TYPE DETAIL, LINE + 1. 03 COL 3 VALOR "RECORD INVALID:". 03 COL 19 PIC X(34) SOURCE sales-record. 01 TYPE CONTROL HEADING Nombre del vendedor, LINE + 2. 03 COL 1 VALOR "Seller:". 03 COL 9 PIC X(30) SOURCE Nombre del vendedor.
La descripción del informe anterior describe el siguiente diseño:
Informe de ventas Página 1 Vendedor: Howard Bromberg Las ventas del 10/12/2008 fueron de $1000.00 Las ventas del 12/12/2008 fueron de $0.00 Las ventas del 13/12/2008 fueron de 31,47 dólares RECORD INVALID: Howard Bromberg XXXXYYY Vendedor: Descuento Howard ... Página 12 Las ventas del 08/05/2014 fueron de $543.98 RECORD INVALID: William Selden 12O52014FOOFOO Las ventas del 30/05/2014 fueron de $0.00
Cuatro declaraciones controlan al escritor del informe: INICIAR
, que prepara el redactor de informes para la impresión; GENERAR
, que imprime un grupo de informes; SUPPRESS
, que suprime la impresión de un grupo de informes; y TERMINATE
, que finaliza el procesamiento del informe. Para el ejemplo del informe de ventas anterior, la división de procedimientos podría verse así:
OPEN INPUT ventas, OUTPUT report-out INITIATE ventas-report PERFORMA UNTIL 1 ■ 1 READ ventas AT FIN EXIT PERFORMA END-READ VALIDATE sales-record IF valido-record GENERADO ventas al día ELSE GENERADO invalid-sales END-IF END-PERFORM TERMINATE ventas-report CLOSE ventas, report-out .
El uso de la función Report Writer tendía a variar considerablemente; algunas organizaciones lo usaron extensamente y otras no lo usaron en absoluto. Además, las implementaciones de Report Writer variaban en calidad, y las del extremo inferior a veces usaban cantidades excesivas de memoria en tiempo de ejecución.
División de procedimientos
Procedimientos
Las secciones y párrafos de la división de procedimientos (denominados colectivamente procedimientos) se pueden utilizar como etiquetas y como subrutinas simples. A diferencia de otras divisiones, los párrafos no necesitan estar en secciones.
La ejecución pasa por los procedimientos de un programa hasta que se termina.
Para usar procedimientos como subrutinas, se usa el verbo PERFORM
.
Una declaración PERFORM
se parece un poco a una llamada de procedimiento en un lenguaje moderno en el sentido de que la ejecución vuelve al código que sigue al sentencia PERFORM
al final del código llamado; sin embargo, no proporciona ningún mecanismo para pasar parámetros o devolver un valor de resultado. Si se invoca una subrutina usando una declaración simple como PERFORM subrutina
, luego el control regresa al final del procedimiento llamado. Sin embargo, PERFORM
es inusual porque puede usarse para llamar a un rango que abarca una secuencia de varios procedimientos adyacentes. Esto se hace con PERFORM< /span> sub-1 THRU sub-n
construcción:
PROCEDURE Así que.... PERFORMA ALPHA PERFORMA ALPHA THRU GAMMA STOP RUN.ALPHA. DISPLAY 'A '.BETA. DISPLAY B '.GAMMA. DISPLAY 'C'.
La salida de este programa será: "A A B C".
PERFORM
también difiere de las llamadas a procedimientos convencionales en que no existe, al menos tradicionalmente, la noción de una pila de llamadas. Como consecuencia, las invocaciones anidadas son posibles (una secuencia de código es PERFORM
'ed puede ejecutar un PERFORM code> misma), pero requieren un cuidado especial si ambas invocaciones ejecutan partes del mismo código. El problema surge cuando el código de la invocación interna alcanza el punto de salida de la invocación externa. Más formalmente, si el control pasa por el punto de salida de un
PERFORM código> invocación que se llamó anteriormente pero que aún no se ha completado, el estándar COBOL 2002 estipula oficialmente que el comportamiento no está definido.
La razón es que COBOL, en lugar de una "dirección de retorno", opera con lo que podría llamarse una dirección de continuación. Cuando el flujo de control llega al final de cualquier procedimiento, se busca la dirección de continuación y se transfiere el control a esa dirección. Antes de que se ejecute el programa, la dirección de continuación de cada procedimiento se inicializa en la dirección de inicio del procedimiento que viene a continuación en el texto del programa, de modo que, si no PERFORM
suceden, el control fluye de arriba a abajo a través del programa. Pero cuando se ejecuta una instrucción PERFORM
, modifica la continuación dirección del procedimiento llamado (o el último procedimiento del rango llamado, si PERFORM THRU
), de modo que el control volverá al sitio de la llamada al final. El valor original se guarda y se restaura después, pero solo hay una posición de almacenamiento. Si dos invocaciones anidadas operan en código superpuesto, pueden interferir en la gestión de la dirección de continuación de cada una de varias maneras.
El siguiente ejemplo (tomado de Veerman & Verhoeven 2006) ilustra el problema:
LABEL1. DISPLAY '1 ' PERFORMA LABEL2 THRU LABEL3 STOP RUN.LABEL2. DISPLAY '2 ' PERFORMA LABEL3 THRU LABEL4.LABEL3. DISPLAY '3 '.LABEL4. DISPLAY '4 '.
Uno podría esperar que la salida de este programa fuera "1 2 3 4 3": después de mostrar "2", el segundo PERFORM
hace que "3" y "4" que se mostrará, y luego la primera invocación continúa con "3". En las implementaciones tradicionales de COBOL, este no es el caso. Más bien, la primera instrucción PERFORM
establece la dirección de continuación en el final de LABEL3
para que vuelva a el sitio de llamada dentro de LABEL1
. La segunda instrucción PERFORM
establece el retorno al final de LABEL4
pero no modifica la dirección de continuación de LABEL3
, esperando que sea la continuación predeterminada. Por lo tanto, cuando la invocación interna llega al final de LABEL3
, vuelve a la declaración externa PERFORM
, y el programa deja de imprimir solo "1 2 3". Por otro lado, en algunas implementaciones COBOL como el compilador TinyCOBOL de código abierto, los dos PERFORM
no interfieren entre sí y el resultado es "1 2 3 4 3". Por lo tanto, el comportamiento en tales casos no solo es (quizás) sorprendente, sino que tampoco es portátil.
Una consecuencia especial de esta limitación es que PERFORM
no se puede usar para escribir código recursivo. Otro ejemplo simple para ilustrar esto (ligeramente simplificado de Veerman & Verhoeven 2006):
MOVE 1 TO A PERFORMA LABEL STOP RUN.LABEL. DISPLAY A IF A . 3 ADD 1 TO A PERFORMA LABEL END-IF DISPLAY FIN '.
Uno podría esperar que el resultado sea "1 2 3 END END END" y, de hecho, eso es lo que producirán algunos compiladores COBOL. Pero algunos compiladores, como IBM COBOL, producirán código que imprime "1 2 3 END END END END..." y así sucesivamente, imprimiendo "FIN" una y otra vez en un bucle sin fin. Dado que hay un espacio limitado para almacenar las direcciones de continuación de la copia de seguridad, las copias de seguridad se sobrescriben en el curso de las invocaciones recursivas, y todo lo que se puede restaurar es volver a DISPLAY 'END'
.
Declaraciones
COBOL 2014 tiene 47 declaraciones (también llamadas verbos), que se pueden agrupar en las siguientes categorías amplias: flujo de control, E/S, manipulación de datos e informe. escritor. Las declaraciones del autor del informe se tratan en la sección del autor del informe.
Flujo de control
Las sentencias condicionales de COBOL son IF
y EVALUAR
. EVALUATE
es una declaración similar a un interruptor con la capacidad adicional de evaluar múltiples valores y condiciones. Esto se puede utilizar para implementar tablas de decisión. Por ejemplo, lo siguiente podría usarse para controlar un torno CNC:
EVALUACIÓN TRUE ALSO velocidad deseada ALSO velocidad actual CUANDO tapada ALSO min-velocidad THRU Velocidad máxima ALSO ME Gracias. velocidad deseada PERFORMA velocidad-up-machine CUANDO tapada ALSO min-velocidad THRU Velocidad máxima ALSO GREATER Gracias. velocidad deseada PERFORMA desaceleración de la máquina CUANDO lid-open ALSO CUALQUIER ALSO NO ZERO PERFORMA de emergencia CUANDO Otros CONTINUACIÓNEND-EVALUATE
La instrucción PERFORM
se usa para definir bucles que se ejecutan hasta que una condición sea verdadera (no mientras sea verdadera, que es más común en otros lenguajes). También se utiliza para llamar a procedimientos o rangos de procedimientos (ver la sección de procedimientos para más detalles). LLAME
y INVOKE
llamar a subprogramas y métodos, respectivamente. El nombre del subprograma/método está contenido en una cadena que puede ser un literal o un elemento de datos. Los parámetros se pueden pasar por referencia, por contenido (cuando se pasa una copia por referencia) o por valor (pero solo si hay un prototipo disponible).
CANCEL
descarga los subprogramas de la memoria. IR A
hace que el programa salte a un procedimiento específico.
La declaración GOBACK
es una declaración de retorno y la instrucción STOP
detiene el programa. La instrucción EXIT
tiene seis formatos diferentes: puede ser se utiliza como una declaración de retorno, una declaración de ruptura, una declaración de continuación, un marcador final o para salir de un procedimiento.
Las excepciones son provocadas por una declaración RAISE
y capturado con un controlador, o declarativo, definido en el DECLARATIVES
parte de la división del procedimiento. Los declarativos son secciones que comienzan con una instrucción USE
que especifica el errores a manejar. Las excepciones pueden ser nombres u objetos. RESUME
se usa en un declarativo para saltar a la declaración después del que generó la excepción o a un procedimiento fuera de DECLARATIVES< /código>. A diferencia de otros lenguajes, las excepciones no detectadas pueden no terminar el programa y el programa puede continuar sin verse afectado.
E/S
La entrada/salida de archivos es manejada por el autodescriptivo OPEN
, CERRAR
, LEER
, y WRITE
declaraciones junto con otras tres: REWRITE
, que actualiza un registro; START
, que selecciona registros subsiguientes para acceder al encontrar un grabar con una clave determinada; y UNLOCK
, que libera un bloqueo en el último registro accedido
La interacción del usuario se realiza usando ACCEPT
y < code class="mw-highlight mw-highlight-lang-text mw-content-ltr" id="" style="" dir="ltr">DISPLAY.
Manipulación de datos
Los siguientes verbos manipulan datos:
INITIALIZE
, que establece los elementos de datos a sus valores predeterminados.MOVE
, que asigna valores a los datos; MOVE CORRESPONDING asigna campos similares correspondientes.SET
, que tiene 15 formatos: puede modificar índices, asignar referencias de objetos y alterar las capacidades de tabla, entre otras funciones.ADD
,SUBTRACT
,MULTIPLY
,DIVIDE
, yCOMPUTE
, que maneja aritmética (conCOMPUTE
asignando el resultado de una fórmula a una variable).ALLOCATE
yFREE
, que maneja la memoria dinámica.VALIDATE
, que valida y distribuye datos según se especifica en la descripción de un elemento en la división de datos.STRING
yUNSTRING
, que concatena y divide cadenas, respectivamente.INSPECT
, que eleva o reemplaza las instancias de subestrings especificados dentro de una cadena.SEARCH
, que busca una tabla para la primera entrada satisfacer una condición.
Los archivos y las tablas se ordenan usando SORT
y el verbo MERGE
fusiona y clasifica archivos. El verbo RELEASE
proporciona registros para ordenar y RETURN
recupera registros ordenados en orden.
Terminación del alcance
Algunas declaraciones, como IF
y < code class="mw-highlight mw-highlight-lang-text mw-content-ltr" id="" style="" dir="ltr">READ, pueden contener declaraciones. Dichas declaraciones pueden terminarse de dos maneras: por un punto (terminación implícita), que termina con todas las declaraciones contenidas sin terminar, o por un terminador de alcance, que termina la declaración abierta coincidente más cercana.
* Período de terminación ("despido implícito")IF no válido-record IF no-más-records NEXT SENTENCE ELSE READ record-file AT FIN SET no-más-records TO TRUE.* Terminadores de alcance ("despido explícito")IF no válido-record IF no-más-records CONTINUACIÓN ELSE READ record-file AT FIN SET no-más-records TO TRUE END-READ END-IFEND-IF
Las declaraciones anidadas que terminan con un punto son una fuente común de errores. Por ejemplo, examine el siguiente código:
IF x DISPLAY Sí.. DISPLAY z.
Aquí, la intención es mostrar y
y z
si la condición x
es verdadera. Sin embargo, z
se mostrará cualquiera que sea el valor de x
porque la sentencia IF
finaliza con un punto erróneo después de DISPLAY < /span>y.
Otro error es el resultado del problema de else pendiente, cuando dos sentencias IF
pueden asociarse con un ELSE
.
IF x IF Sí. DISPLAY aELSE DISPLAY b.
En el fragmento anterior, ELSE
se asocia con el directorio IF y
declaración en lugar de el IF< span class="w"> x
declaración, causando un error. Antes de la introducción de terminadores de alcance explícitos, para evitarlo se requería ELSE NEXT SENTENCE
para colocar después del interno SI.
Código auto modificable
La especificación COBOL original (1959) admitía el infame ALTERAR X PARA PROCEDER TO Y
declaración, para la cual muchos compiladores generaron auto-modificación código. X
y Y
son etiquetas de procedimiento y el estilo único IR PARA instrucción en el procedimiento
X
ejecutado después de tal ALTER
significa IR HACIA Y
en su lugar. Muchos compiladores aún lo admiten,
pero se consideró obsoleto en el estándar COBOL 1985 y se eliminó en 2002.
La declaración ALTER
fue mal considerada porque socavado "localidad de contexto" e hizo que la lógica general de un programa fuera difícil de comprender. Como escribió el autor de libros de texto Daniel D. McCracken en 1976, cuando 'alguien que nunca antes había visto el programa debe familiarizarse con él lo más rápido posible, a veces bajo una presión de tiempo crítica porque el programa ha fallado... la vista de una declaración GO TO en un párrafo por sí misma, que señala la existencia de un número desconocido de declaraciones ALTER en ubicaciones desconocidas a lo largo del programa, infunde miedo en el corazón del programador más valiente."
Hola mundo
A "Hola, mundo" programa en COBOL:
IDENTIFICACIÓN DIVISIÓN. PROGRAMA-ID. Hola.. PROCEDURE DIVISIÓN. DISPLAY "¡Hola, mundo!" .
Cuando el, ahora famoso, "¡Hola, mundo!" El ejemplo de programa en El lenguaje de programación C se publicó por primera vez en 1978. Se habría enviado una muestra de programa COBOL de mainframe similar a través de JCL, muy probablemente utilizando un lector de tarjetas perforadas y tarjetas perforadas de 80 columnas. La siguiente lista, con una DIVISIÓN DE DATOS vacía, se probó con Linux y el emulador System/370 Hercules con MVS 3.8J. El JCL, escrito en julio de 2015, se deriva de los tutoriales y ejemplos de Hercules organizados por Jay Moseley. De acuerdo con la programación COBOL de esa época, HELLO, WORLD se muestra en mayúsculas.
//COBUCLG JOB ()001),COBOL BASE TEST ', 00010000// CLASE=A,MSGCLASS=A,MSGLEVEL=()1,1) 000 000//BASETEST EXEC COBUCLG 000 000 000//COB.SYSIN DD * 000 00000* VALIDACIÓN OF BASE COBOL INSTALL 000 01000 IDENTIFICACIÓN DIVISIÓN. 000 000 01100 PROGRAMA-ID. Hola. '. 000 000 000 02000 MEDIO AMBIENTE DIVISIÓN. 000 02100 CONFIGURACIÓN SECCIÓN. 000 000 02110 SOURCE-COMPUTER. GNULINUX. 00100000 02120 OBJECT-COMPUTER. HERCULOS. 00110000 02200 SPECIAL-NAMES. 00120000 02210 CONSOLE ES CONSL. 00130000 03000 DATOS DIVISIÓN. 00140000 04000 PROCEDURE DIVISIÓN. 00150000 04100 00-MAIN. 00160000 04110 DISPLAY 'Hola, mundo ' Arriba CONSL. 00170000 04900 STOP RUN. 00180000//LKED.SYSLIB DD DSNAME=SYS1.COBLIB,DISP=SHR 00190000// DD DSNAME=SYS1.LINKLIB,DISP=SHR 00200000//Vamos..SYSPRINT DD SYSOUT=A 00210000// 00220000
Después de enviar el JCL, la consola de MVS mostró:
19.52.48 JOB 3 $HASP100 COBUCLG ON READER1 COBOL BASE TEST
19.52.48 JOB 3 IEF677I WARNING MESSAGE(S) FOR JOB COBUCLG ISSUED
19.52.48 JOB 3 $HASP373 COBUCLG STARTED - INIT 1 - CLASE A - SYS BSP1
19.52.48 JOB 3 IEC130I SYSPUNCH DD STATEMENT MISSING
19.52.48 JOB 3 IEC130I SYSLIB DD STATEMENT MISSING
19.52.48 JOB 3 IEC130I SYSPUNCH DD STATEMENT MISSING
19.52.48 JOB 3 IEFACTRT - Programa de paso Retcode
19.52.48 JOB 3 COBUCLG BASETEST COB IKFCBL00 RC= 0000
19.52.48 JOB 3 COBUCLG BASETEST LKED IEWL RC= 0000
19.52.48 JOB 3 +HELLO, WORLD
19.52.48 JOB 3 COBUCLG BASETEST GO PGM=*.DD RC= 0000
19.52.48 JOB 3 $HASP395 COBUCLG ENDED
La línea 10 de la lista anterior de la consola está resaltada para efecto, el resaltado no es parte de la salida real de la consola.
La lista del compilador asociado generó más de cuatro páginas de detalles técnicos e información sobre la ejecución del trabajo, para la única línea de salida de las 14 líneas de COBOL.
Recepción
Falta de estructura
En la década de 1970, la adopción del paradigma de programación estructurada se generalizaba cada vez más. Edsger Dijkstra, un destacado científico informático, escribió una carta al editor de Comunicaciones de la ACM, publicada en 1975, titulada "¿Cómo decimos verdades que podrían doler?", en la que criticaba COBOL y varios otras lenguas contemporáneas; remarcando que "el uso de COBOL paraliza la mente". En una disidencia publicada a los comentarios de Dijkstra, el científico informático Howard E. Tompkins afirmó que COBOL no estructurado tendía a ser 'escrito por programadores que nunca habían tenido el beneficio de que COBOL estructurado se enseñara bien', argumentando que la cuestión era principalmente de formación.
Una de las causas del código spaghetti fue IR A
declaración. Sin embargo, se intenta eliminar GO TO
del código COBOL, resultó en programas intrincados y calidad de código reducida. IR A
fueron reemplazadas en gran parte por PERFORM
declaración y procedimientos, que promovieron la programación modular y dieron fácil acceso a poderosas instalaciones de bucle. Sin embargo, PERFORM
solo se puede usar con procedimientos, por lo que se repite los cuerpos no estaban ubicados donde se usaron, lo que dificultaba la comprensión de los programas.
Los programas COBOL eran famosos por ser monolíticos y carecer de modularización.
El código COBOL solo podía modularizarse a través de procedimientos, que resultaron ser inadecuados para sistemas grandes. Era imposible restringir el acceso a los datos, lo que significaba que un procedimiento podía acceder y modificar cualquier elemento de datos. Además, no había manera de pasar parámetros a un procedimiento, una omisión que Jean Sammet consideró como el mayor error del comité.
Otra complicación surgió de la capacidad de PERFORM THRU
un especificado secuencia de procedimientos. Esto significaba que el control podía saltar y regresar de cualquier procedimiento, creando un flujo de control intrincado y permitiendo que un programador rompiera la regla de entrada única y salida única.
Esta situación mejoró a medida que COBOL adoptó más características. COBOL-74 agregó subprogramas, brindando a los programadores la capacidad de controlar los datos a los que podía acceder cada parte del programa. COBOL-85 luego agregó subprogramas anidados, lo que permitió a los programadores ocultar subprogramas. Un mayor control sobre los datos y el código llegó en 2002 cuando se incluyeron la programación orientada a objetos, las funciones definidas por el usuario y los tipos de datos definidos por el usuario.
Sin embargo, mucho software COBOL heredado importante utiliza código no estructurado, que se ha vuelto imposible de mantener. Puede ser demasiado arriesgado y costoso modificar incluso una simple sección de código, ya que puede usarse desde lugares desconocidos de formas desconocidas.
Problemas de compatibilidad
COBOL estaba destinado a ser un programa "común" idioma. Sin embargo, para 2001, se habían creado alrededor de 300 dialectos. Una fuente de dialectos era el propio estándar: el estándar de 1974 estaba compuesto por un núcleo obligatorio y once módulos funcionales, cada uno con dos o tres niveles de soporte. Esto permitió 104.976 variantes oficiales.
COBOL-85 no era totalmente compatible con versiones anteriores y su desarrollo fue controvertido. Joseph T. Brophy, el CIO de Travelers Insurance, encabezó un esfuerzo para informar a los usuarios de COBOL sobre los altos costos de reprogramación de implementar el nuevo estándar. Como resultado, el comité ANSI COBOL recibió más de 2200 cartas del público, en su mayoría negativas, que solicitaban al comité que hiciera cambios. Por otro lado, se pensaba que la conversión a COBOL-85 aumentaría la productividad en años futuros, justificando así los costos de conversión.
Sintaxis detallada
Un lenguaje débil, verbose y flabby utilizado por los molinillos de código para hacer cosas aburridas sin sentido en los mainframes de dinosaurios. [...] Su nombre es raramente pronunciado sin expresiones rituales de repugnancia o horror.
El archivo Jargon 4.4.8.
La sintaxis de COBOL a menudo ha sido criticada por su verbosidad. Los defensores dicen que esto tenía la intención de hacer que el código se autodocumentara, facilitando el mantenimiento del programa. COBOL también estaba destinado a ser fácil de aprender y usar para los programadores, sin dejar de ser legible para el personal no técnico, como los gerentes. El deseo de legibilidad condujo al uso de elementos estructurales y sintácticos similares al inglés, como sustantivos, verbos, cláusulas, oraciones, secciones y divisiones. Sin embargo, en 1984, los mantenedores de los programas COBOL luchaban por lidiar con los problemas "incomprensibles" El código y los principales cambios en COBOL-85 estaban allí para ayudar a facilitar el mantenimiento.
Jean Sammet, un miembro del comité de corto alcance, señaló que "se hizo poco intento por atender al programador profesional, de hecho, las personas cuyo principal interés es la programación tienden a estar muy descontentas con COBOL" que ella atribuyó a la sintaxis detallada de COBOL.
Aislamiento de la comunidad informática
La comunidad COBOL siempre ha estado aislada de la comunidad informática. Ningún informático académico participó en el diseño de COBOL: todos los miembros del comité procedían del comercio o el gobierno. Los informáticos de la época estaban más interesados en campos como el análisis numérico, la física y la programación de sistemas que en los problemas comerciales de procesamiento de archivos que abordaba el desarrollo de COBOL. Jean Sammet atribuyó la impopularidad de COBOL a una "reacción snob" inicial; debido a su falta de elegancia, la falta de influyentes informáticos que participen en el proceso de diseño y el desdén por el procesamiento de datos comerciales. La especificación COBOL utilizó una 'notación' única, o metalenguaje, para definir su sintaxis en lugar de la nueva forma Backus-Naur que el comité no conocía. Esto resultó en "grave" crítica.
El mundo académico tiende a considerar al COBOL como verbose, torpe e inelegante, y trata de ignorarlo, aunque probablemente hay más programas y programadores de COBOL en el mundo que los que hay para FORTRAN, ALGOL y PL/I combinados. En su mayoría, sólo las escuelas con un objetivo profesional inmediato imparten instrucción en COBOL.
Richard Conway y David Gries, 1973
Más tarde, COBOL sufrió una escasez de material que lo cubriera; los libros introductorios tardaron hasta 1963 en aparecer (con Richard D. Irwin publicando un libro de texto universitario sobre COBOL en 1966). Para 1985, había el doble de libros sobre FORTRAN y cuatro veces más sobre BASIC que sobre COBOL en la Biblioteca del Congreso. Los profesores universitarios enseñaban lenguajes y técnicas más modernos y de última generación en lugar de COBOL, que se decía que tenía una "escuela de oficios" naturaleza. Donald Nelson, presidente del comité CODASYL COBOL, dijo en 1984 que "los académicos... odian COBOL" y que los graduados en informática "habían 'odiado COBOL' perforado en ellos".
A mediados de la década de 1980, también hubo una condescendencia significativa hacia COBOL en la comunidad empresarial por parte de los usuarios de otros lenguajes, por ejemplo, FORTRAN o ensamblador, lo que implicaba que COBOL solo podía usarse para problemas que no fueran desafiantes.
En 2003, COBOL figuraba en el 80 % de los planes de estudio de sistemas de información en los Estados Unidos, la misma proporción que C++ y Java. Diez años después, una encuesta realizada por Micro Focus encontró que el 20 % de los académicos universitarios pensaban que COBOL estaba desactualizado o muerto y que el 55 % creía que sus estudiantes pensaban que COBOL estaba desactualizado o muerto. La misma encuesta también encontró que solo el 25 % de los académicos tenían programación COBOL en su plan de estudios, aunque el 60 % pensó que deberían enseñarla.
Preocupaciones sobre el proceso de diseño
Se han planteado dudas sobre la competencia del comité de normas. El miembro del comité a corto plazo, Howard Bromberg, dijo que había "poco control" sobre el proceso de desarrollo y que estuvo "plagado por la discontinuidad del personal y... la falta de talento". Jean Sammet y Jerome Garfunkel también señalaron que los cambios introducidos en una revisión del estándar se revertirían en la siguiente, debido tanto a los cambios en quién estaba en el comité del estándar como a la evidencia objetiva.
Los estándares COBOL han sufrido repetidamente retrasos: COBOL-85 llegó cinco años más tarde de lo esperado, COBOL 2002 se retrasó cinco años, y COBOL 2014 se retrasó seis años. Para combatir los retrasos, el comité de estándares permitió la creación de apéndices opcionales que agregarían características más rápidamente que esperando la próxima revisión del estándar. Sin embargo, algunos miembros del comité expresaron su preocupación por las incompatibilidades entre las implementaciones y las frecuentes modificaciones del estándar.
Influencias en otros idiomas
Las estructuras de datos de COBOL influyeron en los lenguajes de programación posteriores. Su estructura de registros y archivos influyó en PL/I y Pascal, y la cláusula REDEFINES
fue un predecesor de los registros variantes de Pascal. Las definiciones explícitas de estructuras de archivos precedieron al desarrollo de los sistemas de administración de bases de datos y los datos agregados fueron un avance significativo con respecto a las matrices de Fortran.
Las declaraciones de datos PICTURE
se incorporaron a PL/I, con cambios menores.
La función COPY
de
COBOL, aunque se considera "primitivo", influyó en el desarrollo de directivas include.
El enfoque en la portabilidad y la estandarización significó que los programas escritos en COBOL pudieran ser portátiles y facilitó la difusión del lenguaje a una amplia variedad de plataformas de hardware y sistemas operativos. Además, la estructura de división bien definida restringe la definición de referencias externas a la División de Medio Ambiente, lo que simplifica los cambios de plataforma en particular.
Contenido relacionado
AppleTalk
Árbol de sintaxis abstracta
IA-32