Mean Time Between Failures - Universidad San Francisco de Quito

Universidad San Francisco de Quito 

Procesos Estocásticos 

Mean Time Between Failures (MTBF) – Nota Explicativa preparada 

por René Játiva Espinoza 

Definiciones: 

Es importante notar que la definición del Tiempo medio entre fallas (MTBF del inglés 

Mean Time Between Failures) se torna en muchos casos ambiguo si no se ha definido 

previamente la noción de falla. A continuación citamos dos definiciones de falla: 

1) La terminación de la habilidad de un producto entendido como un todo, para 

desarrollar la función que se le requiere. 

2) La terminación de la habilidad de cualquier componente individual para desarrollar su 

función pero no la terminación de la habilidad de operación del producto entendido como 

un todo. 

Se entiende entonces que el MTBF impacta tanto a la confiabilidad como a la 

disponibilidad, así que citamos las definiciones de estos términos: 

La Confiabilidad es la habilidad de un sistema o componente para desarrollar sus 

funciones bajo condiciones pre-establecidas durante un período de tiempo especificado 

[IEEE 90]. 

En otras palabras, es la probabilidad de que los sistemas o componentes tengan éxito 

durante el tiempo de la misión identificada, sin fallas. Una misión aérea es el perfecto 

ejemplo para ilustrar este concepto. Cuando una aeronave despega para su misión, hay 

un objetivo en mente: completar el vuelo, como se ha programado, con seguridad (sin 

fallas catastróficas). 

La Disponibilidad, por otro lado, es el grado al cual un sistema o componente es 

operacional y accesible cuando se requiere su uso [IEEE 90]. 

La disponibilidad puede verse como la probabilidad de que el sistema o componente se 

encuentre en estado de desarrollar su función requerida bajo ciertas condiciones en un 

instante dado. La disponibilidad se determina por la confiabilidad del sistema, así como 

también por el tiempo de recuperación cuando una falla se produce. Cuando los sistemas 

tienen tiempos de operación continua muy largo, las fallas son inevitables y entonces lo 

importante es recuperar la operación del sistema lo más pronto posible. 

El valor del MTBF es una medida básica de la confiabilidad del sistema. Se la representa 

típicamente en horas. Mientras más alto es el valor del MTBF, mayor es la confiabilidad 

del producto. La siguiente expresión ilustra esta relación: 

tiempo 

Confiabilidad e − MTBF 

= (1.1)



Un malentendido común respecto del MTBF es que es equivalente al número esperado de 

horas de operación antes de que el sistema falle, es decir a la “vida de servicio”. 

Pongamos el siguiente ejemplo: 

En la muestra de nuestra población disponemos de 500.000 personas de 25 años de edad. 

En el trascurso de un año, se recoge información sobre fallas (muertes) de los miembros 

de esta población. La vida operacional de la población es de 500.00 x 1 año= 500.000 

años. Puesto que en el año 625 personas fallaron (murieron), la tasa de fallas es de 

625/500.000 años= 0,125%/año. El MTBF es el inverso de la tasa de fallas, es decir 

1/0,00125=800 años. Esto significa que aunque las personas de 25 años tienen valores 

altos de MTBF, su expectativa de vida (vida de servicio) es mucho más baja y no se 

correlacionan. Si lo que pretendemos es que el MTBF y la vida de servicio se relacionen, 

deberíamos esperar a que toda la población falle (muera) y entonces tendríamos un valor 

de MTBF de entre 75 y 80 años. Ambos valores son correctos, pero difieren en las 

asunciones realizadas. Lo cierto es que en general, se pretende disponer de un valor que 

sirva hoy, y no uno que se obtenga cuando el producto en cuestión haya sido ya superado 

tecnológicamente por otro. 

Por otra parte el Tiempo Medio de Recuperación o MTTR (siglas en inglés de Mean 

Time to Recover), es el tiempo esperado para recuperar un sistema de una falla y se 

representa también en horas. Como lo muestra la siguiente ecuación, MTTR impacta 

sobre la disponibilidad y no sobre la confiabilidad. Así también el MTBF afecta también 

a la disponibilidad. Mientras mayor es el MTBF mejor es la disponibilidad, y mientras 

mayor es el MTTR, peor es la disponibilidad del sistema. 

MTBF 

Disponibilidad = 

(1.2) 

MTBF + MTTR 

Las expresiones anteriores son válidas bajo el supuesto que el sistema exhibe una tasa de 

fallas constante. Esto es cierto en componentes electrónicos únicamente en lo que se 

conoce como el “período de operación normal” o el “período de vida útil” del sistema en 

cuestión, como se observa de la figura 1.



Métodos para predecir y estimar el MTBF 

En ocasiones los términos predicción y estimación aparecen como sinónimos, pero en 

realidad tienen significados diversos. Los métodos que predicen el MTBF calculan un 

valor en base al diseño del sistema, usualmente realizado en una etapa temprana dentro 

del ciclo de vida del producto. Los métodos de estimación por otro lado se consiguen de 

mediciones de fallas, y se calculan de la observación de muestras de sistemas similares, 

usualmente después de que una gran población ha sido implementada en el campo. Su 

uso por tanto es el más recomendado y el más difundido en la industria. 

Métodos de Predicción de la Confiabilidad: 

• MIL-HDBK 217.- Bajo este estándar, hay dos formas de predecir la 

confiabilidad: Predicción por cuenta de Partes y Predicción por Análisis de 

Esfuerzos en Partes. 

La Predicción por cuenta de Partes implica que la tasa de fallas se calcula 

literalmente contando los componentes similares de un producto y agruparlos en 

varios tipos de componentes. El número de componentes en cada grupo se multiplica 

entonces por una tasa de fallas genérica, encontrándose así el factor de calidad. 

Finalmente, las tasas de falla de todos los diferentes grupos de partes se suman para 

conseguir la tasa de fallas final. 

La Predicción por Análisis de Esfuerzos en Partes se utiliza mucho más tarde en el 

ciclo de desarrollo del producto, cuando el diseño de los circuitos actuales y el 

hardware están cerca de la producción. La tasa de falla para cada componente se 

calcula individualmente en base a los niveles de esfuerzo específicos a los cuales se 

sujeta al componente (por ejemplo humedad, temperatura, vibración, voltaje). Esta 

metodología generalmente conduce a una tasa de fallas menor que la anterior, y 

debido al nivel de análisis requerido, este método consume mucho más tiempo en 

comparación con otros. 

• Telcordia.- Este método originalmente basado en MIL 217, añadió 

posteriormente información de campo para posibilitar la estimación de la 

confiabilidad de equipos de telecomunicaciones. Ha sufrido varias 

actualizaciones. Su última revisión corresponde a SR-332 Publicación 1, lanzada 

en mayo de 2001. Esta metodología continúa aplicándose comu una herramienta 

de diseño de producto dentro de esta industria. 

• HRD5 (Handbook for Reliability Data for Electronic Components).- 

Desarrollada por British Telecom y usada exclusivamente en el Reino Unido, es 

similar a 217.



• RBD (Reliability Block Diagram).- Es un dibujo representativo y una 

herramienta de cálculo que se usa para modelar la disponibilidad y confiabilidad 

de un sistema. La estructura del diagrama de bloques define la interacción lógica 

de las fallas dentro de un sistema y no necesariamente sus conexiones lógicas o 

físicas en conjunto. Puede modelar un sistema, un subsistema o un componente. 

Muestra el funcionamiento de un sistema y como la falla en un componente puede 

afectar la operación de un sistema visto como un todo. 

• Modelos de Markov.- Proveen la habilidad para analizar los sistemas complejos 

tales como arquitecturas eléctricas. Se conocen también como diagramas de 

espacio de estados o grafos de estado. El espacio de estados se define como un 

conjunto de todos los estados en los cuales el sistema puede estar. A diferencia de 

los diagramas de bloques, los grafos de estado proveen una representación más 

exacta de un sistema. El uso de grafos de estado el útil para mostrar dependencias 

de fallas a componentes, y varios estados que el diagrama de bloques no puede 

representar. Además del MTBF, los modelos de Markov proveen varias medidas 

de un sistema que incluyen la disponibilidad, el MTTR, la probabilidad de estar 

en un estado dado en un tiempo especificado, etc. 

• FMEA/FMECA.- El FMEA (Failure Mode and Effect Analysis) es un proceso 

usado en el análisis de los modos de falla de un producto. El análisis puede ir un 

paso hacia delante asignando un nivel de severidad a cada un de los modos de 

falla, en cuyo caso toma el nombre de FMECA (Failure Mode, Effects and 

Criticality Analysis). FMEA usa una aproximación de abajo hacia arriba, es decir 

desde los componentes hasta el sistema completo. Además de usarse como una 

herramienta de diseño de producto, puede usarse para calcular la confiabilidad del 

sistema completo. Requiere de información de probabilidad que puede ser difícil 

de obtener para ciertas partes del equipamiento. 

• Árbol de Fallas.- Es una técnica que puede ayudar a detallar el trayecto de los 

eventos, tanto relacionados al funcionamiento normal como a eventos de falla, los 

cuales conducen hacia las fallas a nivel de componentes o hacia los eventos 

indeseados que se investigan (aproximación de arriba hacia abajo). La 

confiabilidad se calcula convirtiendo un árbol de fallas completo en un sistema de 

ecuaciones equivalente, usando el álgebra de Boole. La información de 

probabilidad requerida por esta metodología puede ser difícil de obtener. 

• HALT (Highly Accelerated Life Testing).- Se usa para establecer cuánto tiempo 

lleva alcanzar el punto de ruptura de un producto, sujetándolo a esfuerzos 

cuidadosamente medidos y controlados, tales como temperatura y vibración. 

Utiliza un modelo matemático para estimar el tiempo que habría tomado para que 

el producto fallara en el campo. Aunque HALT puede estimar el MTBF, su 

función principal es mejorar la confiabilidad del diseño del producto.



Métodos de Predicción de la Confiabilidad: 

• Método de Predicción de Artículos Similares.- Se basa en estimar la 

confiabilidad a partir de registros históricos de artículos similares. Su efectividad 

depende de cuán similar es el nuevo equipamiento con respecto al existente y 

cuya información se encuentra disponible. La similitud debe entenderse en 

términos de procesos de manufactura, funciones del producto y diseños. Las 

diferencias deben estudiarse cuidadosamente para la predicción final. 

• Método de Medición de Información en Campo.- Es posiblemente el método más 

utilizado por los fabricantes, y consiste en hacer seguimiento de una muestra de la 

población de nuevos productos. Una vez que se recoge la información, se 

calculan la tasa de fallas y el MTBF. La tasa de fallas es el porcentaje de la 

población de unidades que se espera que “fallen” en un año calendario. 

Adicionalmente al uso de esta información para el control de calidad, se provee 

también a los clientes y socios con información al respecto de la confiabilidad de 

sus productos y procesos de calidad. Dado que este método es tan ampliamente 

utilizado por los fabricantes, provee una referencia común para comparar valores 

del MTBF. Esta información puede ser utilizada por los usuarios para valorar 

diferencias de calidad en el equipamiento ofrecido por los diversos fabricantes y 

tomar decisiones en consecuencia. Para efectuar dichas comparaciones, las 

variables críticas consideradas deben ser las mismas para asegurar que el proceso 

de decisión sea el correcto. 

Conclusiones: 

La palabra MTBF se utiliza comúnmente en la industria como una “alarma”. Los 

números se lanzan sin un entendimiento de lo que verdaderamente representan. Mientras 

el MTBF es una indicación de la confiabilidad, no representa la vida media de servicio 

del producto. En último término, un valor de MTBF no tiene significado si la falla es 

indefinida y las asunciones son confusas o no son realistas. 

Referencias: 

Las ideas de este artículo se han extraído de: 

“Mean Time Between Failure: Explanation and Standards”; Wendy Torrel, Victor 

Abelar; White Paper #78; American Power Conversio, 2004; www.apc.com.

Mean Time Between Failures - Universidad San Francisco de Quito

Create successful ePaper yourself

Delete template?

Save as template?