Sysplex paralelo de IBM

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

En informática, un Parallel Sysplex es un grupo de mainframes IBM que actúan juntos como una única imagen de sistema con z/OS. Utilizado para la recuperación ante desastres, Parallel Sysplex combina el intercambio de datos y la computación paralela para permitir que un clúster de hasta 32 sistemas comparta una carga de trabajo para lograr un alto rendimiento y alta disponibilidad.

Sysplex

En 1990, las computadoras mainframe de IBM introdujeron el concepto de un Complejo de Sistemas, comúnmente llamado Sysplex, con MVS/ESA SPV4.1. Esto permite que los componentes autorizados en hasta ocho particiones lógicas (LPAR) se comuniquen y cooperen entre sí mediante el protocolo XCF.

Los componentes de un Sysplex incluyen:

  • Una fuente de tiempo común para sincronizar los relojes de todos los sistemas miembros. Esto puede implicar un temporizador Sysplex (Model 9037), o el protocolo de tiempo del servidor (STP)
  • Global Resource Serialization (GRS), que permite a múltiples sistemas acceder simultáneamente a los mismos recursos, serializando cuando sea necesario para garantizar un acceso exclusivo
  • Cross System Coupling Facility (XCF), que permite a los sistemas comunicarse entre pares
  • Conjuntos de datos de pareja (CDS)

Los usuarios de un Sysplex (base) incluyen:

  • Servicios de consola – permitiendo fusionar varias consolas MCS de los diferentes miembros del Sysplex, proporcionando una imagen de sistema único para Operaciones
  • Administrador automático de reinicio (ARM) – Política para dirigir el reinicio automático de trabajos fallidos o iniciar tareas en el mismo sistema si está disponible o en otro LPAR en el Sysplex
  • Sysplex Failure Manager (SFM) – Política que especifica acciones automatizadas para tomar cuando se producen ciertos fallos como la pérdida de un miembro de un Sysplex o cuando se reconfiguran sistemas
  • Workload Manager (WLM) – Gestión del desempeño basada en políticas de cargas de trabajo heterogéneas en una o más imágenes z/OS o incluso en AIX
  • Global Resource Serialization (GRS) - Communication – permite el uso de enlaces XCF en lugar de canales dedicados para GRS, y RNL dinámico
  • Tivoli OPC – Soporte de reserva caliente para el controlador
  • RACF (producto de software de seguridad mainframe de IBM) – comandos RVARY y SETROPTS de todo Sysplex
  • PDSE compartir archivos
  • Multisistema VLFNOTE, SDUMP, SLIP, DAE
  • Mecanismo de medición de recursos (RMF) – Presentación de información a nivel de todo el complejo
  • CICS – utiliza XCF para proporcionar un mejor rendimiento y tiempo de respuesta que utilizar VTAM para el enrutamiento de transacciones y el envío de funciones.
  • zFS – Utilizar la comunicación XCF para acceder a datos en varios LPAR

Sysplex paralelo

Representación esquemática de un Sysplex paralelo

IBM presentó Parallel Sysplex con la incorporación del 9674 Coupling Facility (CF), nuevos modelos S/390, actualizaciones de los modelos existentes, enlaces de acoplamiento para comunicación de alta velocidad y compatibilidad con el sistema operativo MVS/ESA SP V5.1, en Abril de 1994.

La instalación de acoplamiento (CF) puede residir en un servidor independiente dedicado configurado con procesadores que pueden ejecutar el código de control de la instalación de acoplamiento (CFCC), como procesadores integrales en los propios mainframes configurados como ICF (instalaciones de acoplamiento interno), o menos. comunes, como LPAR normales. El CF contiene estructuras de bloqueo, lista y caché para ayudar con la serialización, el paso de mensajes y la coherencia del búfer entre varias LPAR.

El objetivo principal de Parallel Sysplex es proporcionar capacidades para compartir datos, permitiendo múltiples bases de datos para lecturas y escrituras directas en datos compartidos. Esto puede proporcionar beneficios de

  • Ayuda a eliminar puntos únicos de fallo dentro del servidor, LPAR o subsistemas
  • Disponibilidad
  • Imagen del sistema único
  • Balance de sesión dinámica
  • Transacción dinámica Routing
  • Capacidad escalable

Las bases de datos que se ejecutan en el servidor System z que pueden aprovechar esto incluyen:

  • IBM Db2
  • IBM Information Management System (IMS).
  • VSAM (VSARM/RLS)
  • IDMS
  • Adabas
  • DataCom
  • Oracle

Otros componentes pueden utilizar Coupling Facility para ayudar con la administración del sistema, el rendimiento o la reducción de los requisitos de hardware. Los usos denominados "Compartir recursos" incluyen:

  • Catálogo – catálogos compartidos para mejorar el rendimiento reduciendo I/O a un catálogo de datos en disco
  • CICS – Usando el CF para proporcionar capacidades de intercambio y recuperación para contadores, tablas de datos o datos transitorios
  • DFSMShsm – Equilibración de carga de trabajo para la carga de trabajo de la migración de datos
  • GRS Star – Reducir la CPU y el tiempo de respuesta para la asignación de conjuntos de datos.

Tape Switching utiliza la estructura GRS para compartir unidades de cinta entre imágenes de z/OS.

  • Gestión dinámica de CHPID (DCM), y gestión prioritaria I/O
  • JES2 Checkpoint – Proporciona un mejor acceso a un puesto de control multisistema
  • Operlog / Logrec – Registros multisistema fusionados para la gestión del sistema
  • RACF – conjunto de datos compartidos para simplificar la gestión de seguridad en el paralelo
  • WebSphere MQ – Las colas de mensajes compartidos para la disponibilidad y flexibilidad
  • WLM - proporciona soporte para el Director de Recursos Inteligente (IRD) para ampliar el gestor de carga de trabajo z/OS para ayudar a gestionar los recursos de CPU e I/O en múltiples LPARs dentro del Sysplex Parallel. Las funciones incluyen la gestión de CPU LPAR, IRD.

Gestión de enclaves multisistema para mejorar el rendimiento

  • XCF Star – Requisitos de hardware reducidos y gestión simplificada de las vías de comunicación XCF

Los componentes principales de un Parallel Sysplex incluyen:

  • Herrajes del Servicio de Coupling (CF o ICF), permitiendo a múltiples procesadores compartir, caché, actualización y acceso a datos de balance;
  • Sysplex Timers (más recientemente, Server Time Protocol) para sincronizar los relojes de todos los sistemas miembros;
  • Alta velocidad, alta calidad, cableado redundante;
  • Software (operating system services and, usually, middleware such as IBM Db2).

La instalación de acoplamiento puede ser un sistema externo dedicado (una computadora central pequeña, como System z9 BC, especialmente configurada solo con procesadores de instalación de acoplamiento) o procesadores integrales en las propias computadoras centrales configurados como ICF (instalaciones de acoplamiento interno). Se recomienda utilizar al menos un CF externo en un sysplex paralelo. Se recomienda que un Parallel Sysplex tenga al menos dos CF y/o ICF para redundancia, especialmente en un entorno de intercambio de datos de producción. El protocolo de hora del servidor (STP) reemplazó a los temporizadores Sysplex a partir de 2005 para los modelos de mainframe System z z990 y posteriores. Un Sysplex Timer es una pieza de hardware físicamente separada del mainframe, mientras que STP es una instalación integral dentro del microcódigo del mainframe. Con STP e ICF es posible construir una instalación Parallel Sysplex completa con dos mainframes conectados. Además, un único mainframe puede contener el equivalente interno de un Parallel Sysplex físico completo, útil para pruebas de aplicaciones y fines de desarrollo.

El IBM Systems Journal dedicó un número completo a todos los componentes tecnológicos.

Protocolo de hora del servidor

Mantener la hora exacta es importante en los sistemas informáticos. Por ejemplo, en un sistema de procesamiento de transacciones, el proceso de recuperación reconstruye los datos de la transacción a partir de archivos de registro. Si se utilizan marcas de tiempo para el registro de datos de transacciones y las marcas de tiempo de dos transacciones relacionadas se transponen de la secuencia real, es posible que la reconstrucción de la base de datos de transacciones no coincida con el estado antes del proceso de recuperación. El protocolo de hora del servidor (STP) se puede utilizar para proporcionar una única fuente de hora entre varios servidores. Según los conceptos del protocolo de hora de red, la HMC designa uno de los servidores System z como fuente de hora principal (estrato 1). Luego envía señales de sincronización a los servidores Stratum 2 mediante el uso de enlaces de acoplamiento. Los servidores Stratum 2 a su vez envían señales de sincronización a los servidores Stratum 3. Para proporcionar disponibilidad, uno de los servidores puede designarse como fuente de tiempo de respaldo y un tercer servidor puede designarse como árbitro para ayudar al servidor de tiempo de respaldo a determinar si debe asumir el rol de primario durante condiciones de excepción.

STP ha estado disponible en los servidores System z desde 2005.

Hay más información disponible sobre STP en la “Guía de planificación del protocolo de tiempo del servidor”.

Sysplex paralelo geográficamente disperso

Parallel Sysplex Geográficamente Disperso (GDPS) es una extensión de Parallel Sysplex de mainframes ubicados, potencialmente, en diferentes ciudades. GDPS incluye configuraciones para un solo sitio o para múltiples sitios:

  • PIB HyperSwap Manager: Esto se basa en la tecnología Peer to Peer Remote Copy (PPRC) sincronizada para su uso dentro de un solo centro de datos. Los datos se copian del dispositivo de almacenamiento primario a un dispositivo de almacenamiento secundario. En caso de fallo en el dispositivo de almacenamiento primario, el sistema hace automáticamente que el dispositivo de almacenamiento secundario sea el primario, generalmente sin interrumpir las aplicaciones de funcionamiento.
  • PIB Metro: Esto se basa en la tecnología de retrovisores de datos sincronizados (PPRC) que se puede utilizar en mainframes 200 kilómetros (120 mi) separados. En un modelo de dos sistemas, ambos sitios se pueden administrar como si fueran un sistema. En caso de fallo de un sistema o dispositivo de almacenamiento, la recuperación puede ocurrir automáticamente, con pérdida limitada o sin datos.
  • GDPS Global - XRC: Esto se basa en la tecnología Asincrónica Extended Remote Copy (XRC) sin restricciones a la distancia. XRC copia datos sobre dispositivos de almacenamiento entre dos sitios de tal manera que sólo unos segundos de datos pueden perderse en caso de fallo. Si ocurre un fallo, el usuario debe iniciar el proceso de recuperación. Una vez iniciado, el proceso es automático en la recuperación de dispositivos de almacenamiento secundario y sistemas de reconfiguración.
  • GDPS Global - GM: This is based on asynchronous IBM Global Mirror technology with no restrictions on distance. Está diseñado para la recuperación de un fallo total en un sitio. Activará dispositivos de almacenamiento secundario y sistemas de respaldo.
  • PIB Metro Global - GM: Esta es una configuración para sistemas con más de dos sistemas/sites, para fines de recuperación de desastres. Se basa en el metro del GDPS junto con el GDPS Global - GM.
  • PIB Metro Global - XRC: Esta es una configuración para sistemas con más de dos sistemas/sites para fines de recuperación de desastres. Se basa en el metro del GDPS junto con el GDPS Global - XRC.
  • GDPS Disponibilidad continua: Esta es una solución de recuperación de desastres / disponibilidad continua, basada en dos o más sitios, separados por distancias ilimitadas, ejecutando las mismas aplicaciones y teniendo los mismos datos para equilibrar la carga de trabajo in situ. IBM Multisite Workload Lifeline, a través de su monitoreo y enrutamiento de carga de trabajo, desempeña un papel integral en la solución de disponibilidad continua del GDPS.
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save