Tiempo medio entre fallos
Tiempo medio entre fallos (MTBF) es el tiempo transcurrido previsto entre fallos inherentes de un sistema mecánico o electrónico durante el funcionamiento normal del sistema. MTBF se puede calcular como la media aritmética (promedio) del tiempo entre fallas de un sistema. El término se utiliza para sistemas reparables, mientras que tiempo medio hasta el fallo (MTTF) indica el tiempo esperado hasta el fallo para un sistema no reparable.
La definición de MTBF depende de la definición de lo que se considera una falla. Para sistemas complejos reparables, se consideran fallas aquellas fuera de las condiciones de diseño que colocan al sistema fuera de servicio y en estado de reparación. Las fallas que ocurren que pueden dejarse o mantenerse en una condición sin reparar y que no ponen el sistema fuera de servicio, no se consideran fallas bajo esta definición. Además, las unidades que se retiran para mantenimiento programado de rutina o control de inventario no se consideran dentro de la definición de falla. Cuanto mayor sea el MTBF, mayor será la probabilidad de que un sistema funcione antes de fallar.
Resumen
El tiempo medio entre fallas (MTBF) describe el tiempo esperado entre dos fallas para un sistema reparable. Por ejemplo, tres sistemas idénticos que comienzan a funcionar correctamente en el tiempo 0 funcionan hasta que todos fallan. El primer sistema falla después de 100 horas, el segundo después de 120 horas y el tercero después de 130 horas. El MTBF de los sistemas es la media de los tres tiempos de fallo, que es de 116.667 horas. Si los sistemas no fueran reparables, su MTTF sería de 116,667 horas.
En general, MTBF es el "tiempo de actividad" entre dos estados de falla de un sistema reparable durante la operación como se describe aquí:
Para cada observación, el "tiempo de inactividad" es el tiempo instantáneo en que bajó, que es posterior (es decir, mayor que) al momento en que subió, el "tiempo de actividad". La diferencia ("tiempo de inactividad" menos "tiempo de actividad") es la cantidad de tiempo que estuvo funcionando entre estos dos eventos.
Refiriéndose a la figura anterior, el MTBF de un componente es la suma de la duración de los períodos operativos dividida por la cantidad de fallas observadas:
De manera similar, el tiempo de inactividad medio (MDT) se puede definir como
Cálculo
MTBF se define por el valor medio aritmético de la función de confiabilidad , que se puede expresar como el valor esperado de la función de densidad de tiempo hasta el fracaso:
Cualquier cálculo relevante en la práctica de MTBF o predicción probabilística de fallas basada en MTBF requiere que el sistema funcione dentro de su "período de vida útil", que se caracteriza por una tasa de fallas relativamente constante (la parte media de la "curva de la bañera") cuando solo ocurren fallas aleatorias.
Asumiendo una tasa de fracaso constante resultados en una función de densidad de falla como sigue: , que, a su vez, simplifica el cálculo mencionado del marco de mediano plazo a la tasa de fracaso del sistema
Las unidades utilizadas suelen ser horas o ciclos de vida. Esta relación crítica entre el MTBF de un sistema y su tasa de fallas permite una conversión/cálculo simple cuando se conoce una de las dos cantidades y se puede asumir una distribución exponencial (tasa de fallas constante, es decir, sin fallas sistemáticas). El MTBF es el valor esperado, promedio o media de la distribución exponencial.
Una vez que se conoce el MTBF de un sistema, se puede estimar la probabilidad de que cualquier sistema en particular esté operativo en un tiempo igual al MTBF. Bajo el supuesto de una tasa de falla constante, cualquier sistema en particular sobrevivirá a su MTBF calculado con una probabilidad del 36,8 % (es decir, fallará antes con una probabilidad del 63,2 %). Lo mismo se aplica al MTTF de un sistema que funciona dentro de este período de tiempo.
Solicitud
El valor MTBF se puede utilizar como parámetro de confiabilidad del sistema o para comparar diferentes sistemas o diseños. Este valor solo debe entenderse condicionalmente como la "vida útil media" (un valor promedio), y no como una identidad cuantitativa entre las unidades en funcionamiento y las que fallan.
Dado que el MTBF se puede expresar como "vida promedio (expectativa)", muchos ingenieros suponen que el 50 % de los elementos habrán fallado en el tiempo t = MTBF. Esta imprecisión puede conducir a malas decisiones de diseño. Además, la predicción probabilística de fallas basada en MTBF implica la ausencia total de fallas sistemáticas (es decir, una tasa de fallas constante con solo fallas intrínsecas y aleatorias), lo cual no es fácil de verificar. Asumiendo que no hay errores sistemáticos, la probabilidad de que el sistema sobreviva durante una duración, T, se calcula como exp^(-T/MTBF). Por lo tanto, la probabilidad de que un sistema falle durante una duración T viene dada por 1 - exp^(-T/MTBF).
La predicción del valor MTBF es un elemento importante en el desarrollo de productos. Los ingenieros de confiabilidad y los ingenieros de diseño a menudo usan software de confiabilidad para calcular el MTBF de un producto de acuerdo con varios métodos y estándares (MIL-HDBK-217F, Telcordia SR332, Siemens SN 29500, FIDES, UTE 80-810 (RDF2000), etc.). El manual de la calculadora de confiabilidad Mil-HDBK-217 en combinación con el software RelCalc (u otra herramienta comparable) permite predecir las tasas de confiabilidad MTBF en función del diseño.
Un concepto que está estrechamente relacionado con el MTBF y es importante en los cálculos relacionados con el MTBF es el tiempo medio de inactividad (MDT). MDT se puede definir como el tiempo medio que el sistema está inactivo después de la falla. Por lo general, MDT se considera diferente de MTTR (Mean Time To Repair); en particular, MDT generalmente incluye factores organizativos y logísticos (como días hábiles o espera a que lleguen los componentes), mientras que MTTR generalmente se entiende como más limitado y más técnico.
MTBF y MDT para redes de componentes
Dos componentes (por ejemplo discos duros, servidores, etc.) se pueden organizar en una red, en serie o en paralelo. La terminología se utiliza aquí por analogía cercana a los circuitos eléctricos, pero tiene un significado ligeramente diferente. Decimos que los dos componentes están en serie si el fracaso o causa el fracaso de la red, y que están en paralelo si sólo el fracaso ambos hace que la red falle. El MTBF de la red bicomponente resultante con componentes reparables se puede calcular de acuerdo con las siguientes fórmulas, asumiendo que el MTBF de ambos componentes individuales es conocido:
Donde es la red en la que se organizan los componentes en serie.
Para la red que contiene componentes reparables en paralelo, para conocer el MTBF de todo el sistema, además de los MTBF de los componentes, también es necesario conocer sus respectivos MDT. Entonces, suponiendo que los MDT son insignificantes en comparación con los MTBF (lo que generalmente ocurre en la práctica), el MTBF para el sistema paralelo que consta de dos componentes paralelos reparables se puede escribir de la siguiente manera:
Donde es la red en la que se organizan los componentes en paralelo, y es la probabilidad de fracaso del componente durante la "ventana de vulnerabilidad" .
Intuitivamente, ambas fórmulas se pueden explicar desde el punto de vista de las probabilidades de falla. En primer lugar, observemos que la probabilidad de que un sistema falle dentro de un cierto período de tiempo es la inversa de su MTBF. Entonces, al considerar una serie de componentes, la falla de cualquier componente conduce a la falla de todo el sistema, por lo que (asumiendo que las probabilidades de falla son pequeñas, lo que suele ser el caso) la probabilidad de falla de todo el sistema dentro de un intervalo dado puede ser aproximado como una suma de probabilidades de falla de los componentes. Con los componentes paralelos, la situación es un poco más complicada: todo el sistema fallará si, y solo si, después de que uno de los componentes falla, el otro falla mientras se repara el primero; aquí es donde entra en juego MDT: cuanto más rápido se repara el primer componente, menor es la "ventana de vulnerabilidad" que el otro componente falle.
Usando una lógica similar, la MDT para un sistema de dos componentes en serie se puede calcular como:
y para un sistema de dos componentes paralelos, MDT se puede calcular como:
Mediante la aplicación sucesiva de estas cuatro fórmulas, se puede calcular el MTBF y el MDT de cualquier red de componentes reparables, siempre que se conozca el MTBF y el MDT de cada componente. En un caso especial pero muy importante de varios componentes en serie, el cálculo de MTBF se puede generalizar fácilmente en
que se puede demostrar por inducción, y asimismo
ya que la fórmula para el mdt de dos componentes en paralelo es idéntica a la del mtbf para dos componentes en serie.
Variaciones de MTBF
Existen muchas variaciones de MTBF, como tiempo medio entre cancelaciones del sistema (MTBSA), tiempo medio entre fallos críticos (MTBCF) o tiempo medio entre retiro no programado (MTBUR). Esta nomenclatura se utiliza cuando se desea diferenciar entre tipos de fallas, como fallas críticas y no críticas. Por ejemplo, en un automóvil, la falla de la radio FM no impide la operación primaria del vehículo.
Se recomienda utilizar Mean time to fail (MTTF) en lugar de MTBF en los casos en que un sistema se reemplaza después de una falla ("sistema no reparable"), ya que MTBF denota el tiempo entre fallas en un sistema que puede repararse.
MTTFd es una extensión de MTTF y solo se preocupa por fallas que podrían resultar en una condición peligrosa. Se puede calcular de la siguiente manera:
donde B10 es el número de operaciones que un dispositivo operará antes de que el 10 % de una muestra de esos dispositivos falle y nop es el número de operaciones. B10d es el mismo cálculo, pero donde el 10% de la muestra fallaría al peligro. nop es el número de operaciones/ciclo en un año.
MTBF considerando censurar
De hecho, el MTBF que cuenta solo las fallas con al menos algunos sistemas aún en funcionamiento que aún no han fallado subestima el MTBF al no incluir en los cálculos la vida útil parcial de los sistemas que aún no han fallado. Con tales tiempos de vida, todo lo que sabemos es que el tiempo de falla excede el tiempo que han estado funcionando. Esto se llama censura. De hecho, con un modelo paramétrico de la vida, la probabilidad de la experiencia en un día determinado es la siguiente:
- ,
dónde
- es el tiempo de fracaso para los fracasos y el tiempo de censura para las unidades que aún no han fracasado,
- = 1 para fallas y 0 para censurar tiempos,
- = la probabilidad de que la vida exceda , llamada la función de supervivencia, y
- se llama la función de peligro, la fuerza instantánea de mortalidad (donde = la función de densidad de probabilidad de la distribución).
Para una distribución exponencial constante, el peligro, , es constante. En este caso, el MBTF es
- MTBF = ,
Donde es la estimación de probabilidad máxima de , maximizando la probabilidad dada arriba y es el número de observaciones sin censura.
Vemos que la diferencia entre el MTBF que considera solo fallas y el MTBF que incluye observaciones censuradas es que los tiempos de censura se suman al numerador pero no al denominador al calcular el MTBF.
Contenido relacionado
Puente estrecho de Tacoma
Emilio Gagnan
Brida