Valores S.M.A.R.T (Self Monitoring Analysis and Reporting Technology)


En esta entrada del Blog comente la tecnología S.M.A.R.T (Self Monitoring Analysis and Reporting Technology) que nos ayuda a prevenir una posible pérdida de datos en los discos duros.

Tanto en Punto y Coma como en EmeZeta Blog puede encontrarse información sobre la técnología S.M.A.R.T:

  • Value: SMART no da valores específicos (giros, porcentajes, números…), sino que da valores en una escala del 1 al 253 en función de su correcto funcionamiento. Cuanto más alto sea el valor, mejor es el estado del disco respecto a ese atributo.
  • Threshold / Warning: Es el límite que puede alcanzar el atributo. Si el valor value es inferior, deberíamos plantearnos que el disco puede fallar. Si este valor es 0, significa que el atributo es sólo informativo. Si es 255, significa que el atributo esta fallando y no debería ser considerado.
  • Worst: Es el peor estado alcanzado por este atributo del disco.

Así como información sobre algunos parámetros S.M.A.R.T de los discos duros entre ellos:

  • ID 3/HEX 03 Spin up time: Tiempo necesario para girar.
  • ID4/HEX 04 Start/Stop count: Número de inicios y paradas del eje del disco.
  • ID 5/HEX 05 Reallocated sector count: Cantidad de sectores remapeados por defectos (Indica los sectores defectuosos que han sido recolocados).
  • ID 9/HEX 09 Power-on hours count: Número de horas transcurridas en funcionamiento.
  • ID 10/HEX 0A Spin retry count: Número de intentos de giro.
  • ID 12/HEX 0C Power cycle count: Número de eventos de encendido.
  • ID 192/HEX C0 Power-off retract count: Número de eventos de apagado.
  • ID 193/HEX C1 Load/Unload cycle count: Número de ciclos Load/Unload (Este parámetro indica el número de veces que el cabezal de lectura/escritura se “aparca” pasado un tiempo).
  • ID 194/HEX C2 HDA Temperatura (Es un valor informativo): Muestra la temperatura del disco (En teoría este parámetro no es muy importante salvo que el disco este funcionando a mayor temperatura de la que indica el fabricante, esto sobre todo puede ocurrir en ordenadores portátiles donde los componentes se ensamblan en un pequeño espacio físico).
  • ID197/HEX C5 Current pending sector count: Número de sectores inestables (Sectores que están esperando por remapeado).

Además de estos valores existen otros y por otra parte cada fabricante puede usar otros valores y/o nombrarlos de diferente forma.

Por otra parte en Caos de un Informático hay una información interesante relativa al valor:

  • ID 193/HEX C1 Load/Unload cycle count: Número de ciclos Load/Unload (Este parámetro indica el número de veces que el cabezal de lectura/escritura se “aparca” pasado un tiempo).

Según la cual muchos discos duros actuales aparcan las cabezas pasado un tiempo, esto se hace por varias razones:

  • Mayor duración del disco (El brazo sufre menos desgaste mecánico).
  • Menor consumo.
  • Mayor protección contra golpes.

Sin embargo esta tecnología puede generar un aumento excesivo del valor Load/Unload cycle count (LLC) que en algunos discos duros se cifra en unos 300.000 ciclos, para solucionar este problema algunos fabricantes como Western Digital han desarrollado una utilidad denominada RE2GP Idle Mode Update Utility (WDIdle3) para sus discos WD1000FYPS-01ZKB0, WD7500AYPS-01ZKB0, WD7501AYPS-01ZKB0, aunque parece ser que también funciona con los Caviar Green (Información del Foro Noticias3D).

Esta utilidad modifica el firmware del disco duro para que el aparcado de cabezas se realice pasado un tiempo programado por el usuario (Por defecto los Caviar Green aparcan los cabezales a los 8 segundos), mientras que con esta utilidad se puede reprogramar el aparcado hasta los 5 minutos (300 segundos), lo que ayudaría a reducir el numero de aparcado de cabezales.

Errores de componentes informáticos: Condensadores (Capacitores) hinchados


Actualmente muchos componentes informáticos, entre ellos:

  • Placas base (Motherboard o Mainboard).
  • Tarjetas Gráficas (SVGA o VGA).
  • Tarjetas de sonido.
  • Tarjetas de Red.
  • Tarjetas Capturadoras de vídeo.
  • Etc.

Utilizan entre otros componentes electrónicos los condensadores (Capacitores) cuya función es almacenar energía, los más comunes son:

  • Electrolíticos: El material dieléctrico es ácido electrolítico (Con el tiempo suelen hincharse e incluso derramar líquido por lo que es necesario sustituirlos por unos nuevo o bien cambiar la pieza completa).
  • Sólidos: Utilizan una combinación de Polímero orgánico sólido (Solid Organic Polymer), son de mayor calidad que los anteriores, de hecho algunos fabricantes como Asus o Gigabyte lo implementan en sus productos más actuales, en el caso de Asus por ejemplo la vida estimada de una condensador sólido es de unas 5.000 horas a 105º C, (Un electrolítico tiene un tiempo de vida de unas 2.000 horas), sin embargo el tiempo de vida de los condensadores (Al igual que muchos componentes electrónicos varía con la temperatura), según la escala de Asus:
    • 105º C equivalen a unas 5.000 horas (0,57 años) funcionando 24 horas al día.
    • 85º C equivalen a unas 50.000 horas (5,7 años) funcionando 24 horas al día.
    • 75º C equivalen a unas 158.114 horas (18 años) funcionando 24 horas al día.
    • 65 º C equivalen a unas 500.000 horas (57 años) funcionando 24 horas al día.
    • 60º C equivalen a 889.140 horas (101,5 años) funcionando 24 horas al día.

Como se puede apreciar la vida de un condensador (Capacitor) varía en función de la temperatura por esta razón es importante que un equipo informático este bien refrigerado ya que los componentes principales de un ordenador:

  • Procesador (CPU).
  • Placa base (Chipset).
  • Tarjeta gráfica (SVGA).
  • Fuente de alimentación.

Llevan su correspondiente disipador/ventilador, sin embargo la refrigeración de caja puede ayudar a que los componentes anteriores no se sobrecalienten excesivamente ayudando de paso a refrigerar indirectamente otros componentes del equipo como son:

  • Discos duros (Sólo en el caso de ventiladores frontales que estén delante del/de los disco/s duro/s).
  • Componentes electrónicos de algunas piezas del equipo (Mosfet, Condensadores,…).

Normalmente en muchos componentes electrónicos no suele apreciarse un desgaste/fallo externo, sin embargo en los condensadores si es posible ver físicamente si fallan, ya que en muchos casos suelen hincharse e incluso pueden derramar líquido (Información de Bad Caps), en ambos casos nos indica un fallo del/de los condensador/es (En estas dos fotografías pueden apreciarse tres condensadores hinchados, mientras que el resto de condensadores aparentemente están en buen estado).

Vista general de placa base con condensadores hinchados (Pulsar para ampliar)

Detalle condensadores hinchados (Pulsar para ampliar)

Para reparar este problema, existen dos soluciones posibles:

  1. Sustituir todos los condensadores hinchados y/o con líquido derramado por unos nuevos soldándolos, esta opción suele ser poco viable ya que requiere condensadores equivalentes y por otro lado el acabado de soldar “manualmente” no será el mismo que el de fábrica.
  2. Sustituir la pieza por una nueva, aunque en este caso puede llevar aparejado una sustitución indirecta de más piezas, por ejemplo si tenemos un ordenador con: Procesador Pentium III con Socket 370, Placa base Socket 370 con condensadores hinchados, 1 GB SDRAM PC133 y una gráfica AGP, encontrar a día de hoy en 2011 una placa base nueva para Socket 370 es imposible, la única opción viable sería tirar de segunda mano y el material comprado al no ser nuevo y tener un tiempo de uso más o menos parecido podría fallar en un futuro próximo por lo que en muchos casos sería más viable incluso sustituir el equipo por un nuevo, pero esto implicaría probablemente un cambio de:
    • Placa base por tener los condensadores hinchados.
    • Procesador (Al cambiar de placa el procesador no suele ser compatible con la nueva salvo que tenga el mismo Socket y además este soportado por el fabricante de la placa base).
    • Memoria RAM (La RAM actual es DDR2 ó DDR3 (Esta última es más reciente) en lugar de ser DDR400 ó SDRAM PC133).
    • Tarjeta gráfica (Los modelos actuales son PCI Express (PCIe) no AGP).
    • Fuente de alimentación (Si es muy antigua posiblemente no tenga los conectores que se utilizan actualmente).

Hay que tener en cuenta que utilizar una placa base  con condensadores hinchados (Suele ser el componente más habitual que presenta este tipo de problema), puede generar problemas en el uso del equipo entre ellos:

  • Fallos de placa base antes del POST (Power On Self Test, Auto Diagnóstico Al Encender).
  • Fallos en memoria RAM.
  • Reinicios aleatorios y/o constantes.
  • Fallos durante el arranque y/o instalación del Sistema Operativo.
  • Congelamiento del Sistema Operativo aleatorio y/o frecuente.
  • BSOD (Blue Screens of Death) aleatorias y/o frecuentes durante el uso del equipo.
  • BSOD durante actividad del disco duro (IDE/ATA, SATA, RAID, SCSI,…).
  • Temperatura del procesador (CPU) anormalmente alta en Idle (Sin carga).
  • CPU vCore (Voltaje del procesador) y otros Voltajes erráticos y/o fuera de parámetros normales.

Format144: Recupera disquetes de 3,5″ desmagnetizados


Aunque actualmente los disquetes de 3,5″ y 1,44 MB apenas se usan, siempre viene bien saber que podemos recuperar físicamente aquellos que tienen estropeada la pista cero, ya que a través de la utilidad de formateo de Windows no es posible ni en modo gráfico (GUI: Graphical User Interface, Interfaz Gráfica de Usuario) ni con mediante consola de comandos (CLI: Command Line Interface, Línea de Comandos) mediante el comando: Format, ya que al comprobar que la pista cero es defectuosa detiene el proceso de formateo como se puede ver en esta captura de pantalla:

Pulsar para ampliar

Para evitar tirar el disquete podemos probar la utilidad Format144, una utilidad de código abierto desarrollada por Denis Petrov, que permite formatear los disquetes “estropeados” aun teniendo la pista cero dañada; aunque hay que tener en cuenta que esta utilidad no recupera los datos que haya en el disquete (De hecho el formateo que realiza la utilidad borra los datos existentes en el disquete) sino que nos da la posibilidad de reutilizarlo si lo puede “reparar”, aunque los discos que tengan daños físicos son irreparables, el modo de recuperar el disco sería ejecutando el programa Format144 y siguiendo sus instrucciones (Básicamente pide pulsar Escape (ESC) para salir de programa si no queremos formatear el disco o una tecla cualquiera si queremos iniciar el proceso de formateo del disquete) como se puede ver en esta captura de pantalla:

Pulsar para ampliar

Una vez finalizado el formateo de las 80 pistas (Track) del disquete finaliza el proceso informando al usuario si este ha sido correcto, si hubiese algún error el propio programa lo reporta al usuario. Así mismo una vez finalizado el proceso el programa da la opción de formatear otro disquete pulsando la letra “A” o salir del programa pulsando cualquier otra tecla.

Fuente:  Genbeta

XBoot: Utiliza varios archivos ISO desde un sólo CD/DVD o Memoria flash


En muchas ocasiones los programas de diagnóstico y/o Live CD/DVD de Linux vienen en formato ISO para grabarlos en un CD/DVD, sin embargo grabar un programa testear la RAM como Memtest (De unos pocos MB en un CD/DVD) es una “lastima” ya que queda mucho espacio desaprovechado.

Xboot (Información de Softonic; aunque también puede descargarse desde Softpedia) es un programa gratuito (Freeware) en inglés creado con Netframework v4,  que permite precisamente aprovechar el espacio de un CD/DVD o memoria flash (Pendrive y/o tarjeta de memoria) almacenando varias ISO “compatibles” con el programa, creando un menú dónde el usuario puede elegir la utilidad que quiere arrancar.

Se puede encontrar más información en:

Problemas relacionados con la BIOS de una placa base


Hace tiempo comente en esta entrada del Blog que era la BIOS (Basic Input-Output System, Sistema Básico de Entrada-Salida), así mismo en esta otra entrada del Blog comente los errores relacionados con los pitidos de BIOS. En esta nueva entrada comentare algunos de los errores que se relacionan con la BIOS mediante mensajes de texto, entre ellos:

BIOS ROM checksun error – system halted: el código de control de la BIOS es incorrecto, lo que indica que puede estar corrupta. En caso de reiniciar y repetir el mensaje, tendremos que reemplazar la BIOS.

CMOS battery failed: la pila de la placa base que alimenta la memoria CMOS ha dejado de suministrar corriente. Es necesario cambiar la pila inmediatamente.

CMOS checksum error – Defaults loaded: el código de control de la CMOS no es correcto, por lo que se procede a cargar los parámetros de la BIOS por defecto. Este error se produce por que la información almacenada en la CMOS es incorrecta, lo que puede indicar que la pila está empezando a fallar. Cambiaremos la pila de la misma.

Display switch is set incorrectly: el tipo de pantalla especificada en la BIOS es incorrecta. Esto puede ocurrir si hemos seleccionado la existencia de un adaptador monocromo cuando tenemos uno en color, o al contrario. Bastará con poner bien este parámetro para solucionar el problema.

Floppy disk(s) Fail ( code 40/38/48 dependiendo de la antigüedad de la bios): Disquetera mal conectada, verificamos todos los cables de conexión.

Hard disk install failure: la BIOS no es capaz de inicializar o encontrar el disco duro de manera correcta. Debemos estar seguros de que todos de que todos los discos se encuentren bien conectados y correctamente configurados.

Keyboard error or no keyboard present: no es posible inicializar el teclado. Puede ser debido a que no se encuentre conectado, este estropeado e incluso porque mantenemos pulsada alguna tecla durante el proceso de arranque.

Keyboard error is locked out – Unlock the key: este mensaje solo aparece en muy pocas BIOS, cuando alguna tecla ha quedado presionada.

Memory Test Fail: el chequeo de memoria RAM ha fallado debido probablemente, a errores en los módulos de memoria. En caso de que nos aparezca este mensaje, hemos de tener mucha precaución con el equipo, se puede volver inestable y tener perdidas de datos. Comprobaremos las memorias usando MemTest y cambiaremos la memoria defectuosa por otra nueva.

Override enabled – Defaults loaded: si el sistema no puede iniciarse con los valores almacenados en la CMOS, la BIOS puede optar por sustituir estos por otros genéricos diseñados para que todo funcione de manera estable, aunque sin obtener las mayores prestaciones.

Primary master hard diskfail: el proceso de arranque ha detectado un fallo al iniciar el disco colocado como maestro en el controlador IDE primario. Para solucionar comprobaremos las conexiones del disco y la configuración de la BIOS.

En algunos casos puede ser necesario reconfigurar la BIOS de nuevo (Ej: CMOS battery faled) por lo que habrá que entrar en la BIOS para configurar de nuevo los parámetros o bien cargar los parámetros por defecto: Load Optimized Defaults (Cargar valores optimizados por defecto) u opción similar aunque esto no nos asegura que la BIOS quede correctamente configurada al 100% por lo que siempre es aconsejable si conocemos los parámetros adecuados ponerlos nosotros mismos de forma manual.

Fuente: Forospyware.com

Además de los mensajes de error anteriores, las BIOS también pueden mostrar mensajes de error S.M.A.R.T (En esta entrada del Blog hay más información) sobre el estado de los discos duros (Siempre y cuando los discos soporten esa características, actualmente todos los discos y BIOS nuevos del mercado la soportan, otro tema son los discos y BIOS muy antiguas que podrían no soportar esta tecnología), entre ellos:

Status BAD, Backup and Replace
Press F1 to Resume

Que directamente avisa de que el disco duro tiene problemas (Para diagnosticar el estado de un disco duro se puede usar la utilidad del fabricante correspondiente, en este hilo del Foro de Noticias3D hay un listado), y aconseja hacer una copia de seguridad de los datos importantes (Backup) y un reemplazo de la unidad antes de que la unidad falle por completo dejando los datos inaccesibles para el usuario y teniendo que recurrir a una empresa especializada en recuperación de datos si el disco duro no arranca, lo cual supone un coste económico mucho mayor que el de comprar un disco duro interno/externo y realizar un Backup (Copia de Seguridad).

Como se puede ver la BIOS puede servirnos como fuente de diagnostico de posibles averías

¿ Se pueden recuperar los sectores defectuosos de un disco duro ?


Antes de nada hay que tener en cuenta que el uso de estos programas puede implicar la pérdida de información o incluso un daño físico al disco duro, por lo que deben utilizarse solo en casos extremos en los que el disco duro este fallando y realizar alguno de esos procesos pueda recuperar la unidad si tenemos suerte.

HDD_Regenerator

A veces los discos duros fallan, creando sectores defectuosos no válidos para almacenar información, estos errores pueden ser físicos o bien deberse a una mala magnetización del sector en sí mismo, existiendo la posibilidad de no poder almacenar datos en ellos o incluso perderlos si los hubiera; para solucionar este problema hay algunos programas como:

  • HDD Regenerator (Es una utilidad de pago) que según Dposoft (Desarrolladores del software) es capaz de regenerar muchos de los supuestos sectores defectuosos de un disco duro.
  • DRevitalize Light la versión 1.2o parece ser freeware (La última version es la v2.30, parece ser de pago), según parece este programa es similar al HDD Regenerator.

Hay que tener en cuenta que estas utilidades tampoco hacen milagros y su tiempo de ejecución puede ser bastante largo (Varía en función de la capacidad del disco duro, a mayor capacidad en principio mayor tiempo de ejecución y también de la cantidad de sectores defectuosos que tenga el disco duro); por otra parte es más que aconsejable hacer previamente una copia de los datos que si puedan salvarse para evitar males mayores.

Otra opción es llevar a cabo un formateo a bajo nivel o incondicional (También denominado: Formateo Físico, Low Level Format o Zero Fill), es el formateo que traen los discos cuando se compran nuevos. Para realizar un formateo a bajo nivel se puede utilizar la utilidad del fabricante (Algunos fabricantes tienen utilidades específicas) comentadas en esta entrada (Utilidades de diagnóstico de hardware) o bien usando alguna utilidad de HDD Guru como por ejemplo:

En cualquier caso antes de utilizar este tipo de programas es más que aconsejable hacer una copia de seguridad de los datos importantes.

Hay que tener en cuenta que al aplicar:

  • Un formateo a bajo nivel o incondicional los datos no se pueden recuperar.
  • Un formateo a alto nivel (ej: El que se lleva a cabo con el comando Format de MS-DOS o el que hace Windows XP durante su instalación), aunque borran los datos, se puede recuperar utilizando algún programa de recuperación de datos especializado como los que se comentan en esta entrada (Programas para recuperar datos de discos duros (Software de recuperación de datos de discos duros)), aunque normalmente se invierte bastante tiempo en su recuperación por lo que es más que aconsejable hacer una copia de seguridad de los mismos para evitar perderlos.

De todas formas teniendo en cuenta que actualmente los discos duros se han abaratado bastante es posible que sea mejor opción comprar un disco duro nuevo que intentar “parchear” un disco duro viejo que podría volver a fallar en el momento menos oportuno pudiendo existir una perdida de datos.

Software para testeo (comprobación) de Memorias Flash


Actualmente es muy común el uso de dispositivos de memoria flash ya sean en formato:

  • USB como es el caso de los “pendrives” (Memorias Flash USB) que actualmente los fabrican una gran cantidad de empresas con diversas capacidades y diseños, los de mayor capacidad creo que actualmente llegan a 64 GB, aunque no sería raro ver en unos meses algunos de mayor capacidad.
  • Tarjeta de memoria de las que existen una gran variedad de formatos, entre otros:
    • SD (incluyendo MiniSD, MicroSD y TransFlash).
    • MMC (incluyendo RS-MMC).
    • Sony Memory Stick (incluyendo las versiones Pro y Duo, entre otras variantes).
    • xD (De Olimpus y Fujifilm).
    • Compact Flash.
    • IBM Microdrive.

Sin embargo en algunas ocasiones estos dispositivos pueden dar fallos bien por:

  • La memoria flash tenga algun tipo de error dejandola inservible de forma total o parcial.
  • Porque la memoria flash sea una falsicación (hay muchas memorias flash de alta capacidad “Made In China” que son falsificaciones de productos originales y tienen mucha menor capacidad de la que anuncian y en consecuencia se producen una corrupción (daño) en los datos almacenados ya que aunque se puedan “guardar” no son accesibles).

Si se piensa utilizar algún software de testeo para la memoria flash, es aconsejable que este vacía (sin datos) ya que algunos test es posible que tengan que borrar los datos existentes en la memoria flash, con la consecuente pérdida de los mismos.

Para detectar este tipo de problemas podemos usar varias aplicaciones como por ejemplo:

  • Flash Memory Tool Kit: Es una Suite (conjunto de programas) de pago, aunque existe una versión de prueba que tiene algunas limitaciones (han desactivado algunas funciones) que tiene varias funciones:
    • Permite Obtener Información del dispositivo USB.
    • Detectar Errores en la memoria flash.
    • Recuperar ficheros que se hayan borrado de la memoria flash (aunque para hacer eso supongo que no podrán sobreescribirse ya que sino su recuperación sería improbable).
    • Borrado de ficheros seguro, para no ser recuperables.
    • Backup/Restore: Hace una copia de seguridad de los datos de la memoria flash que posterirmente puede ser restaurada en caso necesario.
    • Test de rendimiento (Benchmark): Tiene dos tipos de mediciones: Low Level y File (Archivos).
  • H2Testw (la página esta en alemán, aunque en SOS Fake Flash hay información en inglés): Esta disponible en alemán e inglés, se puede descargar desde este link: http://www.heise.de/ct/Redaktion/bo/downloads/h2testw_1.4.zip (la página esta en alemán), el programa tiene varias opciones:
    • Verificar una parte de la memoria o toda la memoria flash.
    • Escribir y Verificar una parte de la memoria o toda la memoria flash.
  • Check Flash: Es un programa desarrollado por Cherkes Mihail que permite verificar las memorias flash, se puede descargar de forma directa desde: http://mikelab.kiev.ua/PROGRAMS/ChkFlsh.zip. Hay que tener en cuenta que este archivo zip ademas del archivo ChkFlsh.exe que es el programa en si mismo, contiene dos archivos mas:
    • Un archivo denominado “Danger.bat” (es un archivo por lotes de MS-DOS) que habilita el análisis en todas las unidades de disco, por lo que debe usarse cuidadosamente.
    • Otro archivo denominado Switches.txt que contiene las sintaxis para ejecutar las ordenes a traves de la consola de comandos.
  • FlashNul: Es un programa ruso que funciona con la consola de comandos (no es un programa “Windows”, por lo que es algo más complicado de manejar que los anteriores), permitiendo testear las memorias flash. Se puede descargar de forma directa desde: http://shounen.ru/soft/flashnul/flashnul-0.993.zip (la web es rusa).

S.M.A.R.T (Self Monitoring Analysis and Reporting Technology) o como evitar la pérdida de datos en Discos duros


Las únicas piezas electromecánicas de un ordenador suelen ser el disco duro (HDD: Hard Disk Drive) y los ventiladores, ambos tienen un tiempo de vida estimado y limitado a un cierto número de horas de funcionamiento. Los discos duros son piezas informáticas que tienen básicamente dos tipos de componentes:

  1. Piezas electrónicas, como por ejemplo el chip de memoria cache (Bufer) o la controladora de datos (IDE, SATA, SCSI, SAS).
  2. Piezas mecánicas, como por ejemplo el motor de giro del plato o los cabezales de lectura.

La vida media de un disco duro doméstico se estima en unas 500.000 horas MTBF (Mean Time Between Failures, Tiempo medio entre fallos), mientras que la de un disco duro empresarial tienen al menos 1.000.000 de horas MTBF o incluso más (algunos modelos llegan a 1.400.000 horas), visto así podríamos decir que la vida de un disco duro es casi “ilimitada” (500.000 horas equivalen a unos 57 años funcionando las 24 horas) sin embargo la realidad es bastante más dura, muchos fabricante dan una vida útil de sus discos de unos 5 años (la cual me parece más realista). Por otro lado otros fabricantes usan varios sistemas para medir el tiempo de vida de un dispositivo. Teniendo en cuenta que:

  • El MTBF (Mean Time Between Failures, Tiempo Medio Entre Fallos) nos indica el tiempo promedio en que se tiene alta probabilidad de otra falla después de que ocurrió una.
  • El MTTF (Mean Time To Failure, Tiempo Hasta el Fallo) nos indica el tiempo promedio en el que se tiene alta probabilidad de que el sistema falle.
  • El MTTR (Mean Time To Repear, Tiempo Medio de Reparación) nos permite conocer el tiempo promedio que se requiere desde que el sistema falla hasta su completa recuperación. Este último a los usuarios domésticos no nos importa excesivamente ya que en principio no tenemos las misma urgencia para reactivar un sistema como puede ocurrir por ejemplo en una empresa.

Por lo tanto los discos duros tienen mayores probabilidades de fallar que otras piezas únicamente electrónicas (por ejemplo un procesador, una memoria RAM, una tarjeta gráfica,…), desde hace unos años los discos duros implementan un sistema denominado S.M.A.R.T (Self Monitoring Analysis and Reporting Technology, en Wikipedia y Alegsa hay información sobre esta tecnología) que sirve para avisar al usuario de un fallo en el disco duro y así evitar la perdida de datos, para que S.M.A.R.T funcione debe estar activado en la BIOS de la placa base y el disco duro debe soportar dicha tecnología (actualmente cualquier placa base y disco duro deberían soportarlo sin problemas). S.M.A.R.T informa al usuario de diversos parámetros como por ejemplo:

  • La Temperatura del disco: Un aumento de temperatura excesivo del disco puede hacer que funcione mal los elementos electrónicos.
  • Tasa de transferencia: Si van aumentando los errores en la tasa de transferencia es síntoma de que puede haber algún error.
  • Velocidad de lectura: Muy similar al punto anterior, y la tasa de error puede provenir por síntomas muy similares.
  • Tiempo de partida (spinspin-up): Puede ser un reflejo de algún tipo de error de motor del disco.
  • Contador de sectores reasignados: Cuando son reasignados muchos valores, significa que no pueden ser grabados donde se intenta hacerlo, con lo cual deben ser asignados a otros sectores. Esto es una referencia inequívoca del deterioro del disco y de su fallo probablemente inmediato.
  • Altura de Vuelo del Cabezal: La tendencia a la baja en altura de vuelo a menudo presagian un accidente del cabezal, esto significa que puede haber uno de los peores errores de un disco duro. Que el cabezal dañe la superficie física del disco duro y lo deje totalmente inutilizable.
  • Uso de ECC y Conteo de errores: Es un dato importante a tener en cuenta, el número de errores detectados por la unidad, aunque se corrijan internamente, a menudo señala problemas con su desarrollo. La tendencia es, en algunos casos, más importante que el conteo real.

Los valores de los atributos S.M.A.R.T. van del número 1 al 253, siendo 1 el peor valor. Los valores normales son entre 100 y 200. Estos valores son guardados en un espacio reservado del disco duro.

Existen utilidades que evaluan los parámetros S.M.A.R.T del disco duro, tanto para Linux (por ejemplo SMARTMonTools, en el blog de Jorge Huerga y en SIG.net puede encontrarse más información) como para Windows como por ejemplo:

  • Crystal Disk Info (Utilidad Freeware (Gratuita), la última versión es la v2.x), que es un programa ejecutable (sin instalación) que informa del estado de los discos duros del equipo, en Gen Beta hay más información sobre este programa.
  • HDD Scan (Utilidad Freeware) que basa sus diagnósticos en los parámetros S.M.A.R.T.
  • HDD Health (Utilidad freeware en inglés), algo básica pero con la información de interes mínima.
  • Hard Drive Monitor (Otra utilidad freeware) con información básica.
  • El programa HD Tune (la última versión v2.55) que nos permite hacer un escaneado de errores (Sectores Defectuosos), aunque existe una versión Profesional de pago con mayores opciones.
  • El programa Everest de Lavalys (tanto la versión Ultimate como la Corporate (añade temas de red) son de pago, ambas versiones tienen un periodo de prueba), anteriormente este programa se denominaba Aida32 y posteriormente paso a llamarse Everest, la versión Home es la que sustituyo al Aida32, pero actualmente esta versión ha sido abandonada en favor de la Ultimate y Corporate.
  • Programas de pago (que son funcionales durante unos días) especializados en monitorización de parámetros S.M.A.R.T como por ejemplo:

Así mismo las propias utilidades de diagnóstico de los distintos fabricantes (Comentadas en esta entrada) también suelen basar sus diagnósticos rápidos en la información S.M.A.R.T, aunque disponen de diagnósticos más exaustivos pero también más lentos.

Por otro lado para testear el estado del disco duro también se pueden utilizar otros sistemas como por ejemplo:

  • Utilizar el Scandisk de Windows XP (comando CHKDSK) con las opciones /F (Corrige errores del disco) y /R (Encuentra sectores dañados y recupera la información
    legible, implica /F) , ej: CHKDSK C: /F /R haría un análisis de la unidad C.
  • Utilizar un disco de arranque de Windows 98 para hacer el particionamiento (con el comando FDISK) y el posterior Formateo de la unidad (con el comando Format) ya que en muchos casos si durante el particionamiento de la unidad el proceso se reinicia o se bloquea, o durante el formateo aparece el mensaje “Intentanto recuperar sector n”  es un síntoma de un posible fallo. En este caso se perderían los datos del disco duro ya que al volver a particionar y/o formatear la unidad los datos se borran.

Por esta razón cuando dejamos un ordenador funcionando 24 horas al día los 7 días de la semana las primeras piezas que se resienten a largo plazo (y tarde o temprano deben ser sustituidas) son:

  1. El disco duro, el cual suele hacer más ruido con el tiempo que al principio de comprarlo.
  2. Los ventiladores que en muchos casos suelen hacer más ruido del habitual debido al desgaste.
  3. El ventilador de la fuente de alimentación que en caso de fallo, implica la sustitución de la fuente de alimentación o en su defecto si se tienen suficientes conocimientos de electrónica se puede abrir (hay que tener cuidado porque las fuentes trabajan con voltajes muy altos y podría producirse una descarga eléctrica) y sustituir el ventilador estropeado por otro nuevo, aunque esto no deja de ser un “apaño”, en general suele traer más cuenta cambiar la fuente por otra nueva porque evitamos que un posible desgaste de la fuente pueda llegar a afectar a los componentes del ordenador, por ejemplo si se funde la fuente por un pico de tensión y esta no implementa algún tipo de protección (o la que tiene no funciona correctamente) podría llevarse con ella cualquier pieza del equipo (disco duro, memoria RAM, lector CD/DVD, Placa base, CPU,…), por esta razón es importante contar al menos con una regleta de una cierta calidad que proteja frente a estos imprevisto.

En cuanto a mi experiencia personal casi ningún disco que te tenido ha pasado de los 5 años de uso aproximadamente (por regla general han aparecido sectores defectuosos en mayor o menor grado), así que teniendo en cuenta que la garantía de los mismos es de 2 años (algunos dan 3 años e incluso otros llegan hasta los 5 años de garantía), creo que no se puede decir que son piezas “fiables”, sin embargo almacenamos nuestros datos en ellos porque no hay muchas opciones actualmente de almacenamiento masivo que sean tan asequibles como los discos duros ya que en la relación precio/gigabyte son los más baratos (y tienen mejores prestaciones en general) frente a otras soluciones como por ejemplo:

  • Soportes ópticos CD (hasta 700 MB en los CDs convencionales de 80 minutos), DVD (hasta 4,5 GB en DVD de una capa, y 8,5 GB en DVD de doble capa) o Blu-Ray (hasta 25 GB en Blu-Ray una capa).
  • Memorias flash, ya sean USB o tarjetas de memoria (SD, MMC,…).
  • Discos SSD (Solid State Disk/Drive), discos duros basados en memoria flash.

Además teniendo en cuenta que la capacidad de almacenamiento aumenta pero el precio se mantiene, en caso de que un discos nos falle con el cambio de disco duro ganamos por un lado espacio (al tener mayor capacidad) y prestaciones (por regla general los modelos más actuales tienen rendimientos ligeramente mejores que las generaciones anteriores).

Utilidades de diagnóstico de hardware


La posibilidad de que una pieza del ordenador (disco duro, RAM, tarjeta gráfica,…) tenga algún tipo de fallo (bien de fábrica, por el uso, o por otra razón) siempre existe, por lo que si el equipo experimenta algún tipo de fallo (ej: bloqueos, reinicios (reset),…) habría que comprobar por ejemplo:

  1. Probar a reinstalar primero el sistema operativo, ya que en muchos casos son problemas de software (instalación de malware (virus, troyanos, gusanos,…), borrado/modificación de ficheros del sistema,…) y no del hardware.
  2. Si el fallo se debe a un exceso de temperatura, es posible que alguno de los ventiladores importantes (ej: el del procesador, la tarjeta gráfica, el chipset de placa base o la fuente de alimentación) estén sucios o averiados, en este caso habría que limpiarlos o sustituirlos por unos nuevos según el caso.
  3. Si el fallo es debido a una pieza del equipo habría que testear una por una (En este hilo: Listado de Utilidades de Testeo del PC del foro de Noticias3D hay más información), hasta encontrar el fallo:
    • Para el disco duro cada fabricante dispone de su software propio de diagnostico, por ejemplo Seagate/Maxtor tiene Seatool, Western Digital tiene Data Life Ward Diagnostic , Samsung tiene HDIAG para unos modelos de discos y el SHDIAG para otros, Hitachi tiene el Drive Fitness Test. En este hilo: Programas de fabricantes, utlidades de recuperacion y de testeo para Discos Duros del Foro de Noticias3D se recoge más información sobre estas utilidades y otros programas para recuperar datos.
    • Para la memoria RAM tenemos el Memtest86 y Memtest+86 (este último esta más actualizado), entre otros. Pasan un test en forma de bucle (no se detiene, por lo que para salir del test hay que pulsar Escape (ESC), y el equipo se reinicia, teniendo en cuenta que hay que sacar el soporte (disco de 3,5″, CD o memoria flash) donde hemos ejecutado el test).
    • Para la tarjeta gráfica se puede usar algún benchmark como por ejemplo el 3DMark,  si durante el test muestra artifact (aparecen fallos al mostrar los gráficos) puede que la gráfica tenga problemas de temperatura o que tenga algún fallo físico, aunque esto también podría ser un problema de software: drivers (controladores).
    • Para probar la estabilidad del procesador/microprocesador (CPU)  se pueden usar programas como el Prime95/Orthos, Intel Burn Test y OCCT.

En Major Geeks hay un listado de programas (Benchmark) que pueden servir para comprobar el rendimiento o estabilidad del sistema, hay que tener en cuenta que el software de benchmark estresa  el hardware al máximo a fin de comprobar su rendimiento y estabilidad para poder detectar posibles fallos en el hardware.

En última instancia para comprobar si falla la pieza será aconsejable sustituir la pieza que falla por una que funcione correctamente para asegurarmos de que es la única pieza del equipo que falla puesto que a veces pueden darse fallos simultáneos de varias piezas (ej: cuando hay una subida de tensión).