Computadoras en tándem

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Fabricante de computadoras tolerantes a la falla

Tandem Computers, Inc. era el principal fabricante de sistemas informáticos tolerantes a fallas para redes de cajeros automáticos, bancos, bolsas de valores, centros de conmutación telefónica, sistemas 911 y otras aplicaciones de procesamiento de transacciones comerciales similares que requieren el máximo tiempo de actividad y cero pérdida de datos. La empresa fue fundada por Jimmy Treybig en 1974 en Cupertino, California. Permaneció independiente hasta 1997, cuando se convirtió en una división de servidores dentro de Compaq. Ahora es una división de servidores dentro de Hewlett Packard Enterprise, luego de la adquisición de Compaq por parte de Hewlett-Packard y la división de Hewlett-Packard en HP Inc. y Hewlett-Packard Enterprise.

Los sistemas NonStop de Tandem utilizan una serie de procesadores idénticos independientes y dispositivos y controladores de almacenamiento redundantes para proporcionar una 'conmutación por error' automática de alta velocidad. en el caso de una falla de hardware o software. Para contener el alcance de las fallas y de los datos corruptos, estos sistemas de múltiples computadoras no tienen componentes centrales compartidos, ni siquiera la memoria principal. Todos los sistemas convencionales de múltiples computadoras usan memorias compartidas y trabajan directamente en objetos de datos compartidos. En su lugar, los procesadores NonStop cooperan intercambiando mensajes a través de una estructura confiable, y el software toma instantáneas periódicas para una posible reversión del estado de la memoria del programa.

Además de manejar bien las fallas, este "shared-nothing" el diseño del sistema de mensajería también se adapta muy bien a las cargas de trabajo comerciales más grandes. Cada duplicación del número total de procesadores duplicaría el rendimiento del sistema, hasta la configuración máxima de 4000 procesadores. Por el contrario, el rendimiento de los sistemas multiprocesador convencionales está limitado por la velocidad de alguna memoria compartida, bus o conmutador. Agregar más de 4 a 8 procesadores de esa manera no aumenta la velocidad del sistema. Los sistemas NonStop se han comprado con mayor frecuencia para cumplir con los requisitos de escalabilidad que para una tolerancia extrema a fallas. Compiten bien con los mainframes más grandes de IBM, a pesar de estar construidos a partir de una tecnología de minicomputadora más simple.

Fundación

Tandem Computers fue fundada en 1974 por James Treybig. Treybig vio por primera vez la necesidad del mercado de tolerancia a fallas en los sistemas OLTP (procesamiento de transacciones en línea) mientras dirigía un equipo de marketing para la división de computadoras HP 3000 de Hewlett-Packard, pero HP no estaba interesada en desarrollar para este nicho. Luego se unió a la firma de capital de riesgo Kleiner & Perkins y desarrolló allí el plan de negocios de Tandem. Treybig reunió a un equipo central de ingeniería contratado fuera de la división HP 3000: Mike Green, Jim Katzman, Dave Mackie y Jack Loustaunou. Su plan de negocios requería sistemas ultra confiables que nunca tuvieran interrupciones y nunca perdieran o dañaran datos. Estos eran modulares en una nueva forma que estaba a salvo de todas las "fallas de un solo punto", pero solo serían marginalmente más costosos que los sistemas convencionales no tolerantes a fallas. Serían menos costosos y admitirían un mayor rendimiento que algunos sistemas reforzados ad-hoc existentes que usaban redundantes pero que generalmente requerían 'repuestos dinámicos'.

Cada ingeniero confiaba en poder realizar rápidamente su propia parte de este nuevo y complejo diseño, pero dudaba de que los demás no lo hicieran. Se podrían trabajar las áreas. Las partes del diseño de hardware y software que no tenían que ser diferentes se basaron en gran medida en mejoras incrementales de los diseños familiares de hardware y software de la HP 3000. Muchos ingenieros y programadores posteriores también procedían de HP. La sede de Tandem en Cupertino, California, estaba a un cuarto de milla de las oficinas de HP. La inversión inicial de capital de riesgo en Tandem Computers provino de Tom Perkins, quien anteriormente fue gerente general de la división HP 3000.

El plan de negocios incluía ideas detalladas para construir una cultura corporativa única que reflejara los valores de Treybig.

El diseño del hardware Tandem/16 inicial se completó en 1975 y el primer sistema se envió a Citibank en mayo de 1976.

La empresa disfrutó de un crecimiento exponencial ininterrumpido hasta 1983. La revista Inc. clasificó a Tandem como la empresa pública de más rápido crecimiento en Estados Unidos. En 1996, Tandem era una empresa de 2300 millones de dólares que empleaba a unas 8000 personas en todo el mundo.

Máquinas apiladoras tándem NonStop (TNS)

Durante 40 años, la principal línea de productos NonStop de Tandem creció y evolucionó de manera compatible hacia arriba desde el sistema tolerante a fallas T/16 inicial, con tres cambios importantes hasta la fecha en su arquitectura modular de nivel superior o su arquitectura de conjunto de instrucciones de nivel de programación. Dentro de cada serie, ha habido varias reimplementaciones importantes a medida que avanzaba la tecnología de chips.

Mientras que los sistemas convencionales de la época, incluidos los mainframes grandes, tenían un tiempo medio entre fallas (MTBF) del orden de unos pocos días, el sistema NonStop se diseñó para intervalos de falla 100 veces más largos, con tiempos de actividad medidos en años.. Sin embargo, NonStop fue diseñado para ser competitivo en precio con los sistemas convencionales, con un sistema simple de 2 CPU con un precio de poco más del doble que el de un mainframe de un solo procesador de la competencia, a diferencia de cuatro o más veces de otras soluciones tolerantes a fallas.

I sin escalas

El primer sistema fue el Tandem/16 o T/16, más tarde renombrado como NonStop I. La máquina constaba de entre dos y 16 CPU, organizadas como un grupo de computadoras tolerantes a fallas empaquetadas en un solo bastidor. Cada CPU tenía su propia memoria privada no compartida, su propio procesador de E/S, su propio bus de E/S privado para conectarse a los controladores de E/S y conexiones duales a todas las demás CPU a través de un bus de backplane inter-CPU personalizado llamado Dinabus. Cada controlador de disco o controlador de red estaba duplicado y tenía conexiones duales tanto para CPU como para dispositivos. Cada disco estaba reflejado, con conexiones separadas a dos controladores de disco independientes. Si un disco fallaba, sus datos aún estaban disponibles en su copia reflejada. Si fallaba una CPU, un controlador o un bus, aún se podía acceder al disco a través de una CPU, un controlador o un bus alternativos. Cada disco o controlador de red estaba conectado a dos CPU independientes. Cada una de las fuentes de alimentación estaba cableada a un solo lado de algún par de CPU, controladores o buses, de modo que el sistema siguiera funcionando bien sin pérdida de conexiones si fallaba una fuente de alimentación. La cuidadosa y compleja disposición de piezas y conexiones en los clientes' las configuraciones más grandes se documentaron en un diagrama de Mackie, llamado así por el vendedor principal David Mackie, quien inventó la notación. Ninguna de estas piezas duplicadas se desperdició "repuestos dinámicos"; todo lo agregado al rendimiento del sistema durante las operaciones normales.

Además de recuperarse bien de piezas defectuosas, el T/16 también fue diseñado para detectar tantos tipos de fallas intermitentes como sea posible, tan pronto como sea posible. Esta detección rápida se denomina "fallo rápido". El objetivo era encontrar y aislar los datos dañados antes de que se escribieran permanentemente en bases de datos y otros archivos de disco. En el T/16, la detección de errores se realizó mediante circuitos personalizados agregados que agregaron poco costo al diseño total; no se duplicaron partes importantes solo para detectar errores.

TANDEM T/16 tarjeta de memoria

La CPU T/16 era un diseño patentado. Fue muy influenciado por la minicomputadora HP 3000. Ambos eran máquinas microprogramadas, de 16 bits, basadas en pilas con direccionamiento virtual segmentado de 16 bits. Ambos estaban destinados a ser programados exclusivamente en lenguajes de alto nivel, sin uso de ensamblador. Ambos se implementaron inicialmente a través de chips TTL estándar de baja densidad, cada uno con una porción de 4 bits de la ALU de 16 bits. Ambos tenían una pequeña cantidad de registros de datos de 16 bits en la parte superior de la pila más algunos registros de direcciones adicionales para acceder a la pila de memoria. Ambos utilizaron la codificación Huffman de las compensaciones de dirección de operandos, para adaptarse a una gran variedad de modos de dirección y tamaños de compensación en el formato de instrucción de 16 bits con muy buena densidad de código. Ambos dependían en gran medida de grupos de direcciones indirectas para superar el formato de instrucción breve. Ambos admitían operandos más grandes de 32 y 64 bits a través de múltiples ciclos de ALU y operaciones de cadena de memoria a memoria. Ambos usaban "big-endian" direccionamiento de operandos de memoria largos versus cortos. Todas estas características se inspiraron en las máquinas apiladoras de mainframe Burroughs B5500-B6800.

El conjunto de instrucciones T/16 cambió varias características del diseño de HP 3000. El T/16 admitió memoria virtual paginada desde el principio. La serie HP 3000 no agregó paginación hasta la generación PA-RISC, 10 años después (aunque MPE V tenía una forma de paginación a través del firmware APL, en 1978). Tandem agregó soporte para direccionamiento de 32 bits en su segunda máquina; HP 3000 carecía de esto hasta su generación PA-RISC. La paginación y las direcciones largas eran críticas para admitir software de sistemas complejos y aplicaciones grandes. El T/16 trató sus registros top-of-stack de una manera novedosa; el compilador, no el microcódigo, era responsable de decidir cuándo se derramaban los registros completos en la pila de memoria y cuándo se rellenaban los registros vacíos desde la pila de memoria. En el HP 3000, esta decisión tomó ciclos de microcódigo adicionales en cada instrucción. El HP 3000 admitía COBOL con varias instrucciones para calcular directamente en cadenas de dígitos BCD (decimales codificados en binario) de longitud arbitraria. El T/16 simplificó esto a instrucciones simples para convertir entre cadenas BCD y enteros binarios de 64 bits.

En el T/16, cada CPU constaba de dos placas de lógica TTL y SRAM, y funcionaba a aproximadamente 0,7 MIPS. En cualquier momento, solo podía acceder a cuatro segmentos de memoria virtual (datos del sistema, código del sistema, datos del usuario, código del usuario), cada uno con un tamaño limitado a 128 KB. Los espacios de direcciones de 16 bits ya eran pequeños para las principales aplicaciones cuando se envió.

La primera versión de T/16 tenía un solo lenguaje de programación, Lenguaje de aplicación de transacciones (TAL). Este era un lenguaje de programación de sistemas dependiente de la máquina eficiente (para sistemas operativos, compiladores, etc.) pero también podía usarse para aplicaciones no portátiles. Se derivó del lenguaje de programación del sistema (SPL) de HP 3000. Ambos tenían una semántica similar a C pero una sintaxis basada en Burroughs' ALGOL. Las versiones posteriores agregaron soporte para Cobol74, Basic, Fortran, Java, C, C++ y MUMPS.

La serie Tandem NonStop ejecutaba un sistema operativo personalizado que era significativamente diferente de Unix o MPE de HP 3000. Inicialmente se llamó T/TOS (Sistema operativo transaccional en tándem), pero pronto se llamó Guardián por su capacidad para proteger todos los datos de fallas de la máquina y el software. fallas A diferencia de todos los demás sistemas operativos comerciales, Guardian se basaba en el paso de mensajes como la forma básica de interacción de todos los procesos, sin memoria compartida, independientemente de dónde se ejecutaran los procesos. Este enfoque se amplió fácilmente a clústeres de múltiples computadoras y ayudó a aislar los datos corruptos antes de que se propagaran.

Todos los procesos del sistema de archivos y todos los procesos de aplicaciones transaccionales se estructuraron como pares de procesos maestro/esclavo que se ejecutan en CPU separadas. El proceso esclavo periódicamente tomaba instantáneas del estado de la memoria del maestro y se hacía cargo de la carga de trabajo cuando el proceso maestro tenía problemas. Esto permitió que la aplicación sobreviviera fallas en cualquier CPU o sus dispositivos asociados, sin pérdida de datos. Además, permitió la recuperación de algunas fallas de software de estilo intermitente. Entre fallas, el monitoreo por parte del proceso esclavo agregó algo de sobrecarga de rendimiento, pero esto fue mucho menor que la duplicación del 100 % en otros diseños de sistemas. Algunas de las primeras aplicaciones principales se codificaron directamente en este estilo de punto de control, pero la mayoría usaba varias capas de software Tandem que ocultaban los detalles de esto de una manera semiportátil.

Tandem NonStop II System

Sin escalas II

En 1981, todas las CPU T/16 fueron reemplazadas por NonStop II. Su principal diferencia con el T/16 era la compatibilidad con el direccionamiento ocasional de 32 bits a través de un 'segmento de datos extendido' conmutable por el usuario. Esto apoyó los siguientes diez años de crecimiento en el software y fue una gran ventaja sobre el T/16 o el HP 3000. Desafortunadamente, los registros visibles seguían siendo de 16 bits, y esta adición no planificada al conjunto de instrucciones requería ejecutar muchas instrucciones por referencia de memoria en comparación con la mayoría de las minicomputadoras de 32 bits. Todas las computadoras TNS posteriores se vieron obstaculizadas por esta ineficiencia del conjunto de instrucciones. Además, NonStop II carecía de rutas de datos internas más amplias y, por lo tanto, requería pasos de microcódigo adicionales para direcciones de 32 bits. Una CPU NonStop II tenía tres placas, usaba chips y un diseño similar al T/16. NonStop II también reemplazó la memoria central con memoria DRAM respaldada por batería.

TXP sin escalas

En 1983, la CPU NonStop TXP fue la primera implementación completamente nueva de la arquitectura del conjunto de instrucciones TNS. Fue construido a partir de chips TTL estándar y chips lógicos de matriz programada, con cuatro placas por módulo de CPU. Tuvo el primer uso de memoria caché de Tandem. Tenía una implementación más directa de direccionamiento de 32 bits, pero aún los enviaba a través de sumadores de 16 bits. Un almacén de microcódigos más amplio permitió una reducción importante en los ciclos ejecutados por instrucción; la velocidad aumentó a 2.0 MIPS. Usó el mismo paquete de rack, controladores, backplane y buses que antes. Los buses Dynabus y I/O se habían sobrediseñado en el T/16 para que funcionaran durante varias generaciones de actualizaciones.

ZORRO

Ahora se pueden combinar hasta 14 sistemas TXP y NonStop II a través de FOX, un bus de fibra óptica tolerante a fallas de larga distancia para conectar clústeres TNS en un campus empresarial; un clúster de clústeres con un total de 224 CPU. Esto permitió una mayor ampliación para asumir las aplicaciones de mainframe más grandes. Al igual que los módulos de CPU dentro de las computadoras, Guardian podría conmutar por error conjuntos de tareas completos a otras máquinas en la red. También se podrían crear clústeres de 4000 CPU en todo el mundo a través de enlaces de red convencionales de larga distancia.

VLX sin escalas

En 1986, Tandem introdujo una CPU de tercera generación, la NonStop VLX. Tenía rutas de datos de 32 bits, un microcódigo más amplio, un tiempo de ciclo de 12 MHz y una velocidad máxima de una instrucción por microciclo. Fue construido a partir de tres placas de chips de matriz de compuertas ECL (con pinout TTL). Tenía un Dynabus revisado con velocidad elevada a 20 Mbytes/seg por enlace, 40 Mbytes/seg en total. Posteriormente, FOX II aumentó el diámetro físico de los cúmulos TNS a 4 kilómetros.

El soporte de base de datos inicial de Tandem era solo para bases de datos jerárquicas no relacionales a través del sistema de archivos ENSCRIBE. Esto se extendió a una base de datos relacional llamada ENCOMPASS. En 1986, Tandem presentó la primera base de datos SQL tolerante a fallas, NonStop SQL. Desarrollado totalmente internamente, NonStop SQL incluye una serie de funciones basadas en Guardian para garantizar la validez de los datos en todos los nodos. NonStop SQL es famoso por escalar linealmente en rendimiento con la cantidad de nodos agregados al sistema, mientras que la mayoría de las bases de datos tenían un rendimiento que se estancaba bastante rápido, a menudo después de solo dos CPU. Una versión posterior lanzada en 1989 agregó transacciones que podían distribuirse entre nodos, una característica que siguió siendo única durante algún tiempo. NonStop SQL siguió evolucionando, primero como NonStop SQL/MP y luego como NonStop SQL/MX, que pasó de Tandem a Compaq y luego a HP. El código sigue en uso en los proyectos NonStop SQL/MP, NonStop SQL/MX y Apache Trafodion de HP.

CLX sin escalas

En 1987, Tandem presentó el NonStop CLX, un sistema de miniordenador de bajo coste y menos ampliable. Su función era hacer crecer el extremo inferior del mercado tolerante a fallas y para implementar en los bordes remotos de grandes redes tándem. Su desempeño inicial fue más o menos similar al TXP; las versiones posteriores mejoraron hasta un 20% más lento que un VLX. Su pequeño gabinete podría instalarse en cualquier "sala de fotocopiadoras" Ambiente de oficina. Una CPU CLX era una placa que contenía seis "silicio compilado" Chips CMOS ASIC. El chip del núcleo de la CPU se duplicó y se bloqueó para lograr la máxima detección de errores. Esto no agregó tolerancia a fallas adicional, pero aseguró la integridad de los datos ya que un chip comparador aseguró que los resultados de ambos chips de CPU tuvieran el mismo resultado. Otros procesadores proporcionarían tolerancia a fallas. Pinout fue una limitación principal de esta tecnología de chip. El microcódigo, la memoria caché y el TLB eran todos externos al núcleo de la CPU y compartían un solo bus y un solo banco de memoria SRAM. Como resultado, CLX requería al menos dos ciclos de máquina por instrucción.

Ciclón continuo

En 1989, Tandem presentó el NonStop Cyclone, un sistema rápido pero costoso para el extremo del mercado de mainframe. Cada CPU de autocomprobación tomó tres placas llenas de chips de matriz de compuertas ECL de funcionamiento en caliente, además de placas de memoria. A pesar de estar microprogramada, la CPU era superescalar y, a menudo, completaba dos instrucciones por ciclo de caché. Esto se logró al tener una rutina de microcódigo separada para cada par común de instrucciones. Ese par fusionado de instrucciones de pila generalmente realizaba el mismo trabajo que una sola instrucción de minicomputadoras normales de 32 bits. Los procesadores Cyclone se empaquetaron como secciones de cuatro CPU cada una, y las secciones se unieron mediante una versión de fibra óptica de Dynabus.

Al igual que las máquinas de gama alta anteriores de Tandem, los gabinetes Cyclone se diseñaron con mucho negro angular para sugerir fuerza y potencia. Los videos publicitarios compararon directamente a Cyclone con el avión espía Lockheed SR-71 Blackbird Mach 3. Se suponía que el nombre de Cyclone representaba su "velocidad imparable en el rugido de las cargas de trabajo de OLTP". El día del anuncio fue el 17 de octubre de 1989. Esa tarde, la región fue azotada por el terremoto de magnitud 6,9 de Loma Prieta, que provocó el colapso de autopistas en Oakland y grandes incendios en San Francisco. Las oficinas del tándem fueron sacudidas, pero nadie resultó gravemente herido en el lugar.

Otras líneas de productos

Arco iris

Entre 1980 y 1983, Tandem intentó rediseñar toda su pila de hardware y software para poner sus métodos NonStop sobre una base más sólida que sus características heredadas de HP 3000. El hardware de Rainbow era una máquina de archivos de registro de 32 bits que pretendía ser mejor que un VAX de Digital Equipment Corporation. Para una programación confiable, el lenguaje de programación principal era "TPL", un subconjunto de Ada. En ese momento, la gente apenas entendía cómo compilar Ada en un código no optimizado. No había una ruta de migración para el software del sistema NonStop existente codificado en TAL. El sistema operativo, la base de datos y los compiladores Cobol se rediseñaron por completo. Los clientes lo verían como una línea de productos totalmente inconexa que requiere de ellos un software completamente nuevo. El lado del software de este ambicioso proyecto tomó mucho más tiempo de lo planeado. El hardware ya estaba obsoleto y TXP lo superaba antes de que su software estuviera listo, por lo que se abandonó el proyecto Rainbow. Todos los esfuerzos posteriores enfatizaron la compatibilidad ascendente y las rutas de migración fáciles.

Desarrollo del marco avanzado de desarrollo de aplicaciones cliente/servidor de Rainbow llamado "Crystal" continuó un poco más y se escindió como 'Elipse'. producto de Cooperative Systems Inc.

PC dinamita

En 1985, Tandem intentó apoderarse de una parte del mercado de computadoras personales en rápido crecimiento con la introducción de la estación de trabajo/PC Dynamite basada en MS-DOS. Lamentablemente, numerosos compromisos de diseño (incluida una plataforma de hardware única basada en 8086 incompatible con las tarjetas de expansión de la época y una compatibilidad extremadamente limitada con las PC basadas en IBM) relegaron a Dynamite a servir principalmente como una terminal inteligente. Fue retirada silenciosa y rápidamente del mercado.

Integridad

El sistema operativo NonStop basado en mensajes de Tandem tenía ventajas en cuanto a escalabilidad, confiabilidad extrema y uso eficiente de costosos "repuestos" recursos. Pero muchos clientes potenciales querían una confiabilidad lo suficientemente buena en un sistema pequeño, utilizando un sistema operativo Unix familiar y programas estándar de la industria. Los diversos competidores tolerantes a fallas de Tandem adoptaron un diseño centrado en la memoria solo de hardware más simple donde toda la recuperación se realizaba cambiando entre repuestos dinámicos. El competidor más exitoso fue Stratus Technologies, cuyas máquinas fueron re-comercializadas por IBM como "IBM System/88".

En tales sistemas, los procesadores de repuesto no contribuyen al rendimiento del sistema entre fallas, sino que simplemente ejecutan de forma redundante exactamente el mismo hilo de datos que el procesador activo en el mismo instante, en "paso de bloqueo". Las fallas se detectan al ver cuándo los procesadores clonados' las salidas divergieron. Para detectar fallas, el sistema debe tener dos procesadores físicos para cada procesador lógico activo. Para implementar también la recuperación automática de conmutación por error, el sistema debe tener tres o cuatro procesadores físicos para cada procesador lógico. El costo triple o cuádruple de este ahorro es práctico cuando las partes duplicadas son microprocesadores de un solo chip de consumo.

Los productos de Tandem para este mercado comenzaron con la línea Integrity en 1989, utilizando procesadores MIPS y "NonStop UX" variante de Unix. Fue desarrollado en Austin, Texas. En 1991, Integrity S2 usó TMR, triple redundancia modular, donde cada CPU lógica usó tres microprocesadores MIPS R2000 para ejecutar el mismo hilo de datos, con votación para encontrar y bloquear una pieza fallida. Sus relojes rápidos no se podían sincronizar como en el paso de bloqueo estricto, por lo que la votación se producía en cada interrupción. Algunas otras versiones de Integrity usaban 4x "par y repuestos" redundancia. Los pares de procesadores se ejecutaron al unísono para verificarse entre sí. Cuando no estaban de acuerdo, ambos procesadores se marcaron como no confiables y su carga de trabajo fue asumida por un par de procesadores de repuesto dinámico cuyo estado ya era actual. En 1995, el Integrity S4000 fue el primero en usar ServerNet (una estructura de 'bus' en red) y pasó a compartir periféricos con la línea NonStop.

Manada de lobos

Entre 1995 y 1997, Tandem se asoció con Microsoft para implementar características de alta disponibilidad y configuraciones SQL avanzadas en grupos de máquinas Windows NT básicas. Este proyecto se llamó "Wolfpack" y se envió por primera vez como Microsoft Cluster Server en 1997. Microsoft se benefició enormemente de esta asociación; Tándem no lo hizo.

Migración continua de TNS/R a MIPS

Cuando se formó Tandem en 1974, todas las empresas informáticas tenían que diseñar y construir sus CPU a partir de circuitos básicos, usando su propio conjunto de instrucciones y compiladores propios, etc. Con cada año de progreso en semiconductores con la Ley de Moore, Más de los circuitos centrales de una CPU podrían caber en chips individuales y, como resultado, funcionar más rápido y mucho más barato. Pero se volvió cada vez más costoso para una empresa de computación diseñar esos chips personalizados avanzados o construir las plantas para fabricar los chips. Enfrentando los desafíos de este mercado y panorama de fabricación que cambia rápidamente, Tandem decidió asociarse con MIPS y adoptó su R3000 y conjuntos de chips sucesores y su compilador de optimización avanzada. Los programadores conocían las máquinas NonStop Guardian posteriores que usaban la arquitectura MIPS como máquinas TNS/R, pero tenían una variedad de nombres comerciales.

Ciclón/R

En 1991, Tandem lanzó el Cyclone/R, también conocido como CLX/R. Este era un sistema de rango medio de bajo costo basado en componentes CLX, pero usaba microprocesadores R3000 en lugar de la placa de máquina de pila CLX mucho más lenta. Para minimizar el tiempo de comercialización, esta máquina se envió inicialmente sin ningún software de modo nativo MIPS. Todo, incluido su sistema operativo NonStop Kernel (NSK) (una continuación de Guardian) y la base de datos NonStop SQL, se compiló en el código de máquina de pila TNS. Ese código objeto se tradujo luego a secuencias de instrucciones MIPS parcialmente optimizadas equivalentes en el momento de la instalación del kernel mediante una herramienta llamada Accelerator. Los programas menos importantes también podrían ejecutarse directamente sin traducción previa, a través de un intérprete de código TNS. Estas técnicas de migración tuvieron mucho éxito y todavía se utilizan en la actualidad. El software de todos se trajo sin trabajo adicional, el rendimiento fue lo suficientemente bueno para máquinas de gama media y los programadores podían ignorar las diferencias de instrucción, incluso cuando se depuraba a nivel de código de máquina. Estas máquinas Cyclone/R se actualizaron con un sistema operativo NSK de modo nativo más rápido en una versión de seguimiento.

El R3000 y los microprocesadores posteriores solo tenían una cantidad típica de verificación de errores internos, insuficiente para las necesidades de Tandem. Entonces, el Cyclone/R ejecutó pares de procesadores R3000 en paso de bloqueo, ejecutando el mismo hilo de datos. Esto fue para fines de integridad de los datos, y no de tolerancia a fallas: la tolerancia a fallas fue manejada por los otros mecanismos que aún estaban vigentes. Usó una curiosa variación de pasos de bloqueo. El procesador verificador corrió 1 ciclo detrás del procesador primario. Esto les permitió compartir una sola copia de código externo y cachés de datos sin poner una carga excesiva de pinout en el bus del sistema y reducir la frecuencia del reloj del sistema. Para ejecutar con éxito los microprocesadores en el paso de bloqueo, los chips deben diseñarse para ser completamente deterministas. Cualquier estado interno oculto debe ser eliminado por el mecanismo de reinicio del chip. De lo contrario, los chips emparejados a veces se desincronizarán sin razón aparente y sin fallas, mucho después de que se reinicien los chips. Todos los diseñadores de chips están de acuerdo en que estos son buenos principios porque les ayuda a probar los chips en el momento de la fabricación. Pero todos los chips de microprocesador nuevos parecían tener errores en esta área y requirieron meses de trabajo compartido entre MIPS (el fabricante externo utilizado por Tandem) y Tandem para eliminar o solucionar los errores sutiles finales.

Serie K de Himalaya sin escalas

En 1993, Tandem lanzó la serie NonStop Himalaya K con el MIPS R4400 más rápido, un sistema operativo NSK de modo nativo y componentes del sistema Cyclone totalmente expandibles. Estos todavía estaban conectados por Dynabus, Dynabus+ y el bus de E/S original, que ahora se estaban quedando sin margen de rendimiento.

Servicios de sistema abierto

En 1995, NonStop Kernel se amplió con un entorno POSIX similar a Unix llamado Open System Services. El caparazón Guardian original y ABI permanecieron disponibles.

Serie S de Himalaya sin escalas

En 1997, Tandem presentó NonStop Himalaya S-Series con una nueva arquitectura de sistema de alto nivel basada en conexiones ServerNet. ServerNet reemplazó los obsoletos buses Dynabus, FOX y I/O. Era mucho más rápido, más general y podía extenderse a algo más que redundancia bidireccional a través de un tejido arbitrario de conexiones punto a punto. Tandem diseñó ServerNet para sus propias necesidades, pero luego promovió su uso por parte de otros; evolucionó hasta convertirse en el estándar de la industria InfiniBand.

Todas las máquinas de la serie S usaban procesadores MIPS, incluidos R4400, R10000, R12000 y R14000.

El diseño de los núcleos MIPS posteriores y más rápidos fue financiado principalmente por Silicon Graphics Inc. Pero el Pentium Pro de Intel superó el rendimiento de los diseños RISC y también se redujo el negocio de gráficos de SGI. Después del R10000, no hubo ninguna inversión en diseños importantes de núcleos MIPS nuevos para servidores de gama alta. Por lo tanto, Tandem necesitaba trasladar su línea de productos NonStop una vez más a otra arquitectura de microprocesador con chips rápidos competitivos.

Adquisición por Compaq, intento de migración a Alpha

Logos utilizados entre 1996 y 1997

Jimmy Treybig permaneció como director ejecutivo de la empresa que fundó hasta una recesión en 1996. El siguiente director ejecutivo fue Roel Pieper, quien se incorporó a la empresa en 1996 como presidente y director ejecutivo. El cambio de marca para promocionarse como una verdadera plataforma Wintel (Windows/Intel) fue realizado por su marca interna y el equipo creativo dirigido por Ronald May, quien más tarde fue cofundador del Silicon Valley Brand Forum en 1999. El concepto funcionó, y poco después la empresa fue adquirida por Compaq.

La división de servidores basados en x86 de Compaq fue una de las primeras en adoptar la tecnología de interconexión ServerNet/Infiniband de Tandem. En 1997, Compaq adquirió la compañía Tandem Computers y la base de clientes de NonStop para equilibrar el gran enfoque de Compaq en las PC de gama baja. En 1998, Compaq también adquirió Digital Equipment Corporation, mucho más grande, y heredó sus servidores DEC Alpha RISC con bases de clientes OpenVMS y Tru64 Unix. En ese entonces, Tandem estaba a mitad de camino en la migración de su línea de productos NonStop de los microprocesadores MIPS R12000 a los nuevos microprocesadores Itanium Merced de Intel. Este proyecto se reinició con Alpha como el nuevo objetivo para alinear NonStop con otras líneas de servidores grandes de Compaq. Pero en 2001, Compaq canceló todas las inversiones en ingeniería Alpha a favor de los microprocesadores Itanium, antes de que se lanzaran nuevos productos NonStop en Alpha.

Adquisición por Hewlett-Packard, migración de TNS/E a Itanium

En 2001, Hewlett-Packard también tomó la decisión de renunciar a sus exitosas líneas de productos PA-RISC en favor de los microprocesadores Intel's Itanium que HP ayudó a diseñar. Poco tiempo después, Compaq y HP anunciaron su plan de fusionarse y consolidar sus líneas de productos similares. Esta polémica fusión se hizo oficial en mayo de 2002. Las consolidaciones fueron dolorosas y destruyeron el DEC y el "HP Way" culturas orientadas a la ingeniería, pero la compañía combinada sabía cómo vender sistemas complejos a las empresas y obtener ganancias, por lo que fue una mejora para la división NonStop sobreviviente y sus clientes.

En cierto modo, el viaje de Tandem desde la puesta en marcha inspirada en HP, a un competidor inspirado en HP, y luego a una división de HP fue "devolver a Tandem a sus raíces originales", pero definitivamente no era el mismo HP.

La migración de la línea de productos NonStop basada en NSK de procesadores MIPS a procesadores basados en Itanium finalmente se completó y se denominó "Servidores HP Integrity NonStop". (Este NSK Integrity NonStop no estaba relacionado con la serie 'Integrity' original de Tandem para Unix).

Debido a que no era posible ejecutar chips Itanium McKinley con pasos de bloqueo a nivel de reloj, las máquinas Integrity NonStop usaron comparaciones entre estados de chips en escalas de tiempo más largas, en puntos de interrupción y en varios puntos de sincronización de software entre interrupciones. Los puntos de sincronización intermedios se activaron automáticamente en cada instrucción de bifurcación enésima tomada, y también fueron insertados explícitamente en cuerpos de bucle largo por todos los compiladores NonStop. El diseño de la máquina admitía redundancia doble y triple, con dos o tres microprocesadores físicos por procesador lógico Itanium. La versión triple se vendió a clientes que necesitaban la máxima fiabilidad. Este nuevo enfoque de verificación se llama NSAA, Arquitectura avanzada sin escalas.

Al igual que en la migración anterior de máquinas apiladas a microprocesadores MIPS, todo el software del cliente se llevó adelante sin cambios de fuente. "Modo nativo" El código fuente compilado directamente en el código de máquina MIPS simplemente se volvió a compilar para Itanium. Algunos mayores "no nativos" el software todavía estaba en forma de máquina de pila TNS. Estos se transfirieron automáticamente a Itanium a través de técnicas de traducción de código de objeto.

Migración de Itanium a Intel X86

Servidor sin parar con panel lateral eliminado, 2018

La gente que trabaja para Tandem/HP tiene un largo historial de portar el kernel a nuevo hardware. El siguiente esfuerzo fue pasar de Itanium a la arquitectura Intel x86. Se completó en 2014 con los primeros sistemas disponibles comercialmente. La inclusión de los conmutadores de ancho doble InfiniBand 4X FDR (catorce datos) tolerantes a fallas proporcionó un aumento de más de 25 veces en la capacidad de interconexión del sistema para responder al crecimiento del negocio.

Perspectiva, otra

(feminine)

NSK Guardian también se convirtió en la base para HP Neoview OS, el sistema operativo utilizado en los sistemas HP Neoview que se adaptaron para su uso en Business Intelligence y Enterprise Data Warehouse. NonStop SQL/MX también fue el punto de partida para Neoview SQL, que se adaptó al uso de Business Intelligence. El código también fue portado a Linux y sirvió como base para el proyecto Apache Trafodion.

Cultura corporativa

El plan de negocios de Treybig incluía ideas detalladas para construir una cultura corporativa que reflejara los valores de Treybig, como sabáticos pagados de seis semanas cada cuatro años para todos los empleados, un regalo anual de 100 acciones de Tandem para todos empleados, una fiesta semanal para todos los empleados conocida como Beer Bust Fridays y una transmisión mensual de circuito cerrado mundial ("First Friday") para mantener informados a los empleados.

Grupos de usuarios

ITUG (International Tandem User Group) ahora parte de Connect (grupo de usuarios)
OzTUG The Australia and New Zealand Tandem Users Group here: OzTUG at Linked In
BITUG (British Isles NonStop (Tandem) User Group)
GTUG (German Tandem Users Group)

Contenido relacionado

Más resultados...