NAS: organización de datos y recuperación de archivos perdidos

data organization and possibility of data recovery from network attached storages

Un NAS (del inglés Network Attached Storage, almacenamiento conectado en red) es una solución de almacenamiento inteligente ampliamente utilizada en los entornos domésticos y de oficina modernos. Y no es de extrañar, como estos dispositivos son fáciles de usar, fiables, y capaces de almacenar una cantidad considerable de información y compartirla entre usuarios autorizados de la red.

Sin embargo, como en caso de cualquier pieza de equipo, estos dispositivos también pueden manejarse de manera inapropiada o fallar, provocando la pérdida de información valiosa. Afortunadamente, al comprender los fundamentos de NAS y contar con un software confiable de recuperación de datos, se pueden restaurar los archivos que faltan incluso del dispositivo NAS más complejo.


Conceptos básicos de NAS

NAS es un sistema de almacenamiento que, además de simplemente almacenar datos les hace accesibles a los dispositivos conectados en red: computadoras, dispositivos portátiles y otros. Dichos sistemas funcionan como pequeños servidores locales que realizan funciones relacionadas con archivos, sin proporcionar otros servicios, como correo electrónico o autenticación.

La parte de hardware de un dispositivo NAS abarca una placa base, una unidad CPU, una memoria RAM y de una a varias docenas de discos duros o de estado sólido, normalmente ubicadas en las bahías dedicadas dentro de la carcasa. El dispositivo está conectado a una red con una o más tarjetas de interfaz de red, mientras que los protocolos de uso compartido de archivos de red brindan acceso a sus datos. El sistema generalmente carece de periféricos de entrada y salida y se controla completamente a través de una interfaz basada en red.

La parte de software está representada por un sistema operativo especializado, normalmente Linux simplificado o BSD, que no está diseñado para ejecutar aplicaciones de propósito general y viene preinstalado junto con el hardware de NAS. Algunos usuarios incluso crean sistemas NAS personalizados que funcionan en TrueNAS (anteriormente FreeNAS) u otro sistema operativo basado ​​en BSD o Linux.

La parte de almacenamiento, como se ha mencionado ya, se compone de discos HDD o SSD. Un NAS de una sola unidad es algo muy raro, como generalmente incluye al menos dos unidades. Varios discos a menudo se unen en un único sistema virtual basado en RAID, lo que permite aumentar la velocidad operativa del almacenamiento y mejorar su confiabilidad. La mayoría de los fabricantes de NAS, como Drobo, Synology, Iomega y Buffalo, ofrecen un RAID de software como una función del sistema operativo integrado, mientras que otros, como Promise, por ejemplo, pueden proporcionar un RAID de hardware.

En el nivel más alto, el almacenamiento virtual se formatea con un sistema de archivos particular; su tipo generalmente depende del proveedor de NAS o, a veces, de la configuración del dispositivo NAS. Los sistemas más comunes son Ext3, Ext4 y XFS de ediciones especiales de Linux, aunque también hay dispositivos con Btrfs, por ejemplo, Synology NAS. Algunos fabricantes, como Adaptec, ofrecen soluciones basadas en BSD (por ejemplo, SnapOS) y utilizan ediciones personalizadas del sistema de archivos UFS. Al mismo tiempo, otros pueden emplear sus propios sistemas de archivos, como, por ejemplo, el sistema de archivos KDDFS en WD My Cloud Home y WD My Cloud Home Duo de Western Digital. En los NAS personalizados, como los basados en TrueNAS (FreeNAS), también se utilizan varias versiones del sistema de archivos ZFS.

Sugerencia: Para obtener más información sobre los sistemas de archivos y sus tipos, por favor, lea el artículo sobre los conceptos básicos de los sistemas de archivos.

Organización de datos

En la mayoría de los dispositivos NAS, los datos se organizan de manera similar. No obstante, la estructura de datos real puede variar según el proveedor y la configuración integrada.

Estructura típica de almacenamiento

En cada disco que constituye el sistema, los datos se almacenan en las siguientes particiones:

  • Una partición de arranque contiene información de servicio que se requiere para iniciar el sistema operativo integrado del NAS y, por lo general, ocupa hasta un gigabyte;
  • En una partición de firmware se almacenan datos técnicos relacionados con el firmware, como archivos ejecutables, configuraciones, etc. Generalmente ocupa unos pocos gigabytes.
  • Una partición swap (de intercambio) es utilizado por el firmware para ampliar la memoria RAM y no suele superar 1 gigabyte.
  • Una o varias particiones de datos ocupan el resto del espacio en el disco y sirven para almacenar los archivos de usuario. El tamaño real y la cantidad de particiones de datos dependen de la configuración del NAS.

El esquema de división en particiones suele ser el MBR estándar (estilo DOS) legible por cualquier software.

Configuración de RAID y organización de datos

Según el fabricante, el modelo y la configuración del dispositivo NAS, la información en las particiones de datos se puede organizar de una de las siguientes maneras:

  • RAID 5. Este es el tipo de RAID más utilizado. En los RAID 5, los datos de usuario se ubican en forma de stripes (bandas) distribuidas entre las particiones de datos de todos los discos (al menos tres unidades) junto con la paridad, la información que se puede usar para restaurar el contenido en caso de que una de las unidades falle. La distribución de paridad estándar es dinámica hacia atrás (simétrica izquierda). El tamaño de stripe varía según la configuración (64KB es el más común). El orden de los discos puede ser consecuente (el primer disco del NAS es el primer disco del RAID, el segundo disco del NAS es el segundo disco del RAID, etc.) o inverso (el último disco del NAS es el primer disco del RAID, el penúltimo disco del NAS es el segundo disco del RAID y así sucesivamente).
  • RAID 1. Esta configuración se usa a veces en los NAS de 2 discos para garantizar la máxima tolerancia a fallas. En el RAID 1, el contenido de una unidad se duplica a otra, por lo que ambos discos son siempre copias exactas uno de otro. Si una de las unidades falla, los datos siguen estando disponibles en la segunda. El orden de los discos no es relevante.
  • RAID 0. Esta configuración es la menos confiable debido a la falta de redundancia, sin embargo, se puede encontrar en algunos NAS por su alto rendimiento y uso máximo del espacio de almacenamiento. Los datos de usuario se organizan en un solo conjunto de stripes distribuidos uniformemente entre las particiones de datos de todas las unidades sin paridad ni duplicación. El orden de los discos es el siguiente: el primer disco del NAS es el primer disco del RAID, el segundo disco del NAS es el segundo disco del RAID, y así sucesivamente.
  • RAID 6. Este nivel de RAID es muy similar a RAID 5, pero en él, se almacenan dos tipos de información de paridad en lugar de uno para asegurar la redundancia doble. Ambos conjuntos de paridad se distribuyen por separado entre cuatro o más discos y permiten que el arreglo tolere la falla simultánea de hasta dos discos.
  • Tecnología específica basada en RAID. Algunos fabricantes ofrecen sus propios tipos de RAID en los que se emplean algorítmos propietarios y que a menudo tienen características de LVM:
    • Synology Hybrid RAID (SHR) de Synology NAS se compone de dos o más unidades que pueden ser de diferentes capacidades. En cada disco, se crea una unidad de asignación que corresponde al tamaño del disco más pequeño del arreglo y luego estas unidades se organizan en uno de los niveles estándar de RAID (nivel 1, 5 o 6, según la cantidad de componentes y el tipo de redundancia elegido). Los espacios "sobrantes" restantes en los discos cuyos tamaños superan el tamaño de la unidad más pequeña se organizan en otro RAID, que luego se une con el primer RAID utilizando el LVM, y así se obtiene un único almacenamiento virtual.
    • Drobo BeyondRAID de los dispositivos de Drobo consta de dos o más unidades que también pueden ser de diversas capacidades. Esta tecnología es muy compleja incluso en términos de RAID. El sistema se ensambla a partir de numerosos arreglos RAID de 64KB de tamaño. El offset (desplazamiento) de los componentes en cada RAID está determinado dinámicamente por el sistema, así como el nivel de RAID y el tamaño de stripe. Además de eso, para habilitar el aprovisionamiento ligero, todo el espacio se divide en bloques de 4KB dispersos en los discos. El esquema de asignación de bloques se refleja en un mapa especial, la pérdida de lo cual hace imposible recrear el almacenamiento.
    • RAID-Z es soportado por las soluciones NAS personalizadas en TrueNAS (FreeNAS) y se crea en un grupo de almacenamiento (storage pool) que comprende al menos tres discos con y se basa en el sistema de archivos ZFS. Sus algoritmos de distribución de datos son muy similares a los de RAID 5 estándar, sin embargo, el tamaño de stripe no es fijo y se elige por el sistema en función de las necesidades actuales. La información sobre el ancho de cada stripe se escribe en los metadatos, cuyo daño probablemente impida la reconstrucción del almacenamiento.

Otras configuraciones posibles:

  • RAID 10 o RAID 0+1. El espejo de dos conjuntos de stripes RAID 0 o un conjunto de stripes de dos espejos. Los datos de usuario se organizan de la misma manera que en RAID 0, pero un solo "share" y ambos conjuntos de stripes contienen la misma información.
  • JBOD. Las particiones de datos se concatenan para obtener la máxima capacidad de almacenamiento. Los datos de usuario se distribuyen entre todas las particiones sin ninguna redundancia.

Sugerencia: Los conceptos básicos de RAID se explican en el artículo sobre la organización de datos en RAID. Y para aprender más sobre una tecnología particular de NAS, como Drobo BeyondRAID y Synology Hybrid RAID, consulte el artículo correspondiente.

  • Unidades individuales. En las unidades de NAS que no están organizadas en un RAID, cada partición de datos se basa en un sistema de archivos independiente.
  • Cifrado. Algunos fabricantes de NAS, como Synology, QNAP, Buffalo, Western Digital y otros, ofrecen la funcionalidad de cifrado de volumen integrada para proteger los datos del acceso no autorizado mediante una de las tecnologías de cifrado existentes, principalmente, LUKS de Linux. Se puede acceder a los datos de un dispositivo NAS cifrado siempre que el usuario tenga la contraseña correcta (o la clave de cifrado) y las áreas críticas en las que se almacena la información de cifrado estén intactas.

¿Cuándo se puede requerir recuperar datos?

Gracias a sus ventajas evidentes, los NAS se han convertido en una parte esencial del trabajo diario para usuarios domésticos y empresas. Pero a pesar de la confiabilidad mejorada, estos dispositivos de almacenamiento todavía están expuestos a fallas que conducen a la inaccesibilidad de datos o incluso a la corrupción del almacenamiento completo y la pérdida de archivos importantes. Las causas más comunes de la pérdida de datos son:

  • Pérdida del enlace a un NAS;
  • Matriz fuera de línea o 'cuatro luces rojas';
  • Corrupción de datos debido a un corte de energía;
  • Error del firmware o arranque fallido;
  • Falla de disco(s);
  • Falla del controlador;
  • Daños eléctricos o mecánicos.

Los errores de usuario que pueden causar la pérdida de datos son:

  • Actualización incorrecta del firmware y restablecimiento de la configuración integrada de la matiz RAID;
  • Eliminación de archivos;
  • Reconstrucción de la configuración de RAID integrada sobre datos reales y reformateo de discos.

Preparación para la recuperación de datos

Si los discos tienen defectos físicos causados por daños mecánicos, térmicos o eléctricos, se recomienda apagar el sistema NAS y llevarlo a una empresa especializada en la recuperación de datos. Sin embargo, si usted está seguro de que los discos del NAS no sufrieron ningún daño físico y siguen funcionando, puede realizar la recuperación de datos usted mismo siguiendo las recomendaciones a continuación.

  • Como los dispositivos NAS no brindan acceso directo a bajo nivel a sus unidades, y sus sistemas operativos no están diseñados para ejecutar utilidades de recuperación de datos, el proceso de restauración de datos requiere que se desensamblen y que sus discos se conecten a una computadora.
  • Al extraer las unidades de la carcasa, se recomienda marcar su orden con pegatinas de papel o un marcador de tinta blanda para que se pueda volver a montar correctamente el almacenamiento.
  • Se debe prestar atención al sistema operativo en la computadora que sirve como host para la recuperación de datos. Consulte las recomendaciones de cómo elegir un sistema operativo óptimo para la recuperación de datos de un NAS.
  • Los archivos perdidos de un NAS se pueden recuperar fácilmente con la ayuda de un software de recuperación de datos que pueda emular el trabajo de un controlador de RAID, reensamblar dichos sistemas de almacenamiento y brindar acceso a los sistemas de archivos ubicados en ellos. Para este propósito, SysDev Laboratories ofrece los siguientes productos UFS Explorer: UFS Explorer RAID Recovery se desarrolló especialmente para procesar RAID de varios tipos, mientras que UFS Explorer Professional Recovery representa un enfoque profesional para el proceso de restauración de datos. El software soporta un amplio espectro de RAID de software y hardware, desde los estándar (RAID 0, RAID 1, RAID 1E, RAID 3, RAID 4, RAID 5, RAID 6) y anidados (RAID 0+1, RAID 10, RAID 50, RAID 51, etc.) hasta los específicos (Drobo BeyondRAID, Synology Hybrid RAID, ZFS RAID-Z, Btrfs-RAID). En adición, los programas son compatibles con toda la gama de los sistemas de archivos empleados en los dispositivos NAS modernos, incluidos Ext2, Ext3, Ext4, XFS, UFS, ZFS, Btrfs y el formato propietario KDDFS, así como con varias tecnologías de cifrado modernas.

Sugerencia: Para obtener información detallada sobre las tecnologías soportadas por un programa particular, consulte las especificaciones técnicas del producto de software respectivo.

El software lee y utiliza los metadatos de RAID presentes en los discos-componentes para recrear la matriz en el modo virtual. Aún así, en caso de daños graves a los metadatos, es posible que se requieran los siguientes detalles para ensamblar el almacenamiento:

  • Nivel de RAID;
  • Orden de los discos en RAID (excepto RAID 1);
  • Tamaño de banda/stripe (excepto RAID 1);
  • Distribución de paridad y otros parámetros (si hay).

El procedimiento general se explica paso a paso en el tutorial dedicado a la recuperación de datos en NAS. Además, al trabajar con los sistemas de NAS con tecnologías de almacenamiento específicas, hay que consultar los siguientes recursos, como su procesamiento puede requerir instrucciones adicionales:



Última actualización: el 01 de septiembre de 2022

Si le gusta este artículo, compártalo en sus redes sociales: