Guía para principiantes sobre RAID

Qué es el Raid (Redundant Array of Independent Disks) | Explicado [2024]

Esta definición de RAID explica qué es RAID (matriz redundante de discos independientes), cómo funciona y los diferentes niveles de RAID, así como la recuperación de Datos RAID.

Descarga | Win Descarga | Mac

Parte 1. ¿Qué es el RAID?

Proteger y almacenar tus datos es una prioridad para todos, desde los particulares hasta las grandes empresas. Un método popular de almacenamiento de datos es el uso de RAID or Matriz redundante de discos independientes. Duplica los datos y los almacena en varios discos duros o unidades de estado sólido (SSD). Esta redundancia te protege si una de las unidades se estropea o falla, ya que seguirás teniendo los mismos datos almacenados en otras unidades. Hay varios niveles o métodos diferentes de RAID, y no todos están orientados a proporcionar redundancia o duplicar tus datos. Esta guía repasa los diferentes niveles, cómo recuperar tus datos en caso de fallo del sistema y mucho más.

qué es el raid

Parte 2. ¿Cómo funciona el RAID?

Aunque el RAID almacena los datos en discos diferentes, está espaciado lógicamente para que se superponga perfectamente, de modo que el sistema operativo pueda leer los datos de cada uno de los discos simultáneamente. Esto no sólo hace que el almacenamiento de tus datos sea más seguro, sino que también mejora el rendimiento, ya que cada unidad trabaja conjuntamente y aumenta el tiempo medio entre fallos. Desde el punto de vista del sistema operativo, los datos no tienen fisuras y aparecen como una sola unidad.

Funciona porque el método RAID lógico utiliza la duplicación de discos para duplicar los datos en varias unidades. También emplea la separación de discos, que utiliza diferentes particiones para repartir los datos en varias unidades. El espacio de almacenamiento de cada unidad se divide en grupos más pequeños, cuyo tamaño oscila entre 512 bytes y varios megabytes cada uno. Estas franjas están espaciadas para que el sistema pueda saltar entre ellas para un rendimiento más rápido sin corromper los datos.

Hay dos tipos de sistemas RAID:

  • Sistema de usuario único: Las franjas suelen ser de menor escala, más cercanas al mínimo de 512 bytes. Esto permite que un conjunto de datos se distribuya por todos los discos y se pueda leer de una sola vez.
  • Sistema multiusuario: Para mejorar el rendimiento, tendrás que utilizar franjas más grandes para que la operación de entrada/salida (E/S) pueda solaparse en las distintas unidades.

Comprender el controlador RAID

Los controladores RAID administran todos los discos duros y SSD de la matriz de almacenamiento. Puede hacer que el sistema sea menos complejo, por lo que es más fácil para el sistema operativo leer las unidades de disco. Lo hace presentando las unidades como un único conjunto de datos de forma lógica. Si tienes problemas para que el controlador lea tus discos, lee este tutorial para arreglar que la controladora RAID no reconozca las unidades.

Otra ventaja de utilizar una controladora RAID es la mejora del rendimiento y la ayuda adicional para salvar los datos en caso de caída completa del sistema.

controlador raid

Implementación de RAID

Hay dos tipos principales de controladores RAID: por hardware y por software. Cada tipo tiene sus ventajas e inconvenientes, por lo que es importante entender la diferencia para que puedas encontrar la mejor opción para ti.

RAID basado en hardware: El RAID por hardware tiene un controlador dedicado para administrar la matriz de almacenamiento. Configura las matrices virtuales y físicas y las inicializa sin pasar por tu sistema operativo.

El RAID por hardware también se encarga de garantizar que los discos duros sean consistentes y que los datos se solapen adecuadamente entre las distintas unidades físicas. Si hay un problema con una de las unidades, el hardware reparará o construirá una nueva matriz para mantener la consistencia de los datos.

Necesitas controladores de hardware para administrar el RAID basado en hardware. El controlador suele insertarse directamente en la placa base a través de la ranura PCIe.

Pros

Excelente rendimiento y rapidez

Compatible con las principales plataformas

Una potente encriptación asegura los datos de las unidades

No requiere demasiados recursos de la CPU

Inmune a los virus, ya que el hardware se instala por separado del host

La copia de seguridad de la batería evita la pérdida de datos en caso de un corte de energía en el conjunto de almacenamiento

Contras

El hardware puede ser costoso

Si la tarjeta RAID de la placa base falla, tendrás que comprar una nueva que sea compatible con tu configuración anterior.

RAID basado en software: Aunque el software suele instalarse directamente en el sistema operativo, puedes utilizar un software BIOS para instalarlo independientemente del sistema operativo. Independientemente del método que elijas, el software agotará los recursos de tu CPU y afectará al rendimiento de tu sistema.

El software te da más flexibilidad a la hora de reconfigurar las matrices, ya que no estás sujeto a los requisitos del hardware

Pros

Una opción económica sin necesidad de comprar hardware

Recibe soporte para más discos duros que el hardware

Contras

Es más lento que la opción de hardware porque obtiene su energía de la CPU

No es compatible con matrices que se comparten en varias plataformas

La mayoría de los sistemas operativos sólo admiten configuraciones RAID limitadas

El software sólo puede instalarse en un único sistema, lo que dificulta la migración de los datos a otro sistema operativo

Hardware RAID vs. Software RAID

Hardware RAID
Software RAID
Resumen Un sistema de procesamiento personalizado que se instala directamente en la placa base, independientemente del SO del sistema. Es compatible con diferentes controladores RAID y administra múltiples matrices en diferentes sistemas operativos y plataformas. Se instala en la computadora y depende del sistema operativo. Funciona utilizando los recursos de la computadora donde están instaladas las matrices RAID
Costo El hardware puede ser costoso, ya que tienes que comprar el hardware y posiblemente comprar piezas de repuesto en caso de que se rompa Opción de bajo costo ya que no tienes que comprar un controlador RAID de hardware
Rendimiento En general, funciona a un nivel muy alto. Sin embargo, es inconsistente con ciertos tipos de matrices HDD y SSD Es el más adecuado para RAID 0 y RAID 1
Reemplazo Un proceso sencillo pero costoso. Sólo tienes que retirar el chip de la placa base e instalar uno nuevo. El nuevo hardware RAID debe ser idéntico al modelo que vas a quitar para evitar cualquier problema de consistencia Un proceso más complejo. Antes de desinstalar el software antiguo y reinstalar la versión actualizada, deberás indicar al sistema que ponga en pausa el disco antes de sustituirlo

Si puedes comprar el RAID por hardware y el RAID por software no es compatible con el sistema operativo, hay una tercera opción:

RAID basado en firmware y controladores: Esta opción es similar a la del software, con una diferencia importante: sólo implementa el sistema RAID cuando el sistema arranca. Una vez que el sistema operativo está en marcha, la unidad controladora se encarga de la función RAID. El firmware requiere más potencia de procesamiento de la CPU que las otras dos opciones, lo que puede afectar significativamente al rendimiento de la computadora.

Otras aplicaciones tipo RAID

Hay algunos otros programas de software disponibles que son similares a RAID. Las dos alternativas más populares son el volumen rayado de Windows y la unidad de fusión de macOS.

  • Volumen rayado de Windows: Tiene la misma funcionalidad básica que el RAID 0 y sólo está disponible con servidores Windows. Almacena los datos en un mínimo de dos unidades físicas fusionando el espacio libre en una unidad de disco virtual dinámica. Este método es ideal para leer o escribir en grandes bases de datos, para trabajar con elementos con muchos datos, como DLLs y bibliotecas en tiempo de ejecución, o si quieres mejorar el rendimiento de archivos de alto uso.
  • Unidad de Fusión de macOS: No hay ningún requisito de software o hardware para ejecutar una unidad Fusion Drive en un Mac. Utilizando la función de la Utilidad de Discos, puedes combinar rápidamente varias unidades que el macOS tratará como una única unidad.

Parte 3. Niveles RAID

Hay muchos niveles RAID diferentes, y cada uno maneja los datos y el conjunto de almacenamiento de forma diferente. Cuando se conceptualizó por primera vez el RAID, había seis niveles: RAID 0 - 5. Sin embargo, a medida que la tecnología ha ido mejorando, se han creado niveles adicionales, y los RAID 2, RAID 3 y RAID 4 apenas se utilizan. Todos los niveles RAID pueden dividirse en una de estas tres categorías: Estándar, Anidado y No Estándar.

1.Niveles RAID estándar

RAID 0

qué es el raid 0

RAID 0 es el tipo más básico de RAID y requiere un mínimo de dos unidades. Se centra en la separación o distribución de los datos en cada una de las unidades disponibles. El RAID 0 funciona creando bloques de datos y almacenándolos en todas las unidades. Esta opción es la mejor cuando necesitas obtener el máximo rendimiento de tus dispositivos de almacenamiento. Por ejemplo, si trabajas en un proyecto con muchos datos, como la edición de video, el RAID 0 es la mejor opción. Sin embargo, no es recomendable si trabajas con datos sensibles o críticos, porque basta con que falle una de las unidades para que pierdas todos tus datos. Pero no te preocupes, hay métodos para recuperar los datos perdidos del RAID 0, lee nuestro artículo Recuperación de Datos en RAID 0.

Pros

Alto rendimiento en la lectura y escritura de datos

Fácil de configurar y utilizar

Contras

Si falla una unidad, se pierden todos los datos

RAID 1

qué es el raid 1

El método RAID 1 se utiliza para reflejar los bloques de datos en ambos conjuntos de unidades. Si una de las unidades no funciona correctamente o se bloquea, el controlador puede acceder a la versión espejo, y el programa seguirá funcionando sin problemas, y no experimentarás ninguna pérdida de datos. Las dos unidades pueden leerse simultáneamente, lo que da lugar a un alto rendimiento de lectura. No hay ningún cambio en el rendimiento de escritura porque, aunque las dos unidades se lean a la vez, sigue teniendo que escribir los datos varias veces. El RAID 1 es el más adecuado para almacenar datos críticos, ya que funciona como una eficaz herramienta de almacenamiento de copias de seguridad.

Pros

Alta velocidad de lectura y escritura de datos

Funciona como una copia de seguridad de los datos. Si una unidad se estropea, puedes reconstruir rápidamente el conjunto

Contras

Más costoso, ya que requiere el doble de unidades de disco

Diseñado para trabajar con sólo dos unidades, lo que puede limitar la cantidad de almacenamiento a la que puedes acceder

También te puede interesar RAID 0 vs RAID 1

RAID 5

qué es el raid 5

RAID 5 es el nivel RAID más común. Necesitas entre 3 y 16 unidades para que funcione correctamente. El nivel se centra en la separación de datos con paridad, que proporciona la redundancia. En lugar de reflejar los datos de las unidades, utiliza un algoritmo avanzado para crear bloques virtuales basados en los datos de la unidad. Para simplificar, si miras la siguiente ecuación "5+x+4=10, sabes que x=1. Del mismo modo, si una de las unidades de disco falla o no se carga correctamente, el RAID 5 puede resolver la X y reconstruir los datos que faltan.

Funciona con paridad simple, así que mientras no tengas varios fallos en las unidades, deberías estar bien. Aunque el RAID 5 puede funcionar con algunos controladores de software, se recomienda instalar el controlador RAID basado en hardware para obtener los mejores resultados.

El RAID 5 es una opción fiable en todos los sentidos. Combina la maximización del espacio de almacenamiento con la seguridad, y el resultado es un rendimiento sólido. Es el más adecuado para servidores con unidades de datos limitadas.

Pros

Lee los datos con extrema rapidez

No perderás ningún dato si una de las unidades falla

Contras

La escritura de datos es un poco más lenta ya que debe. Más calcular la paridad

Es una tecnología muy compleja y sustituir un disco defectuoso puede llevar mucho tiempo.

Leer más: ¿Cómo recuperar los datos de las unidades RAID 5?

RAID 6

qué es el raid 6

RAID 6 es una versión mejorada del RAID 5. La principal mejora es que funciona con doble paridad. Necesitarás al menos cuatro unidades disponibles, dos con los datos originales y las otras dos para la paridad. Una matriz RAID 6 puede sobrevivir a dos fallos de disco simultáneos sin ninguna pérdida de datos.

El RAID 6 es un sistema de almacenamiento eficaz con un alto rendimiento y una seguridad de primer orden. Sin embargo, necesitarás espacio para servidores adicionales.

Pros

La lectura de datos es muy rápida

Puede soportar dos fallos de disco simultáneos sin perder ningún dato.

Contras

Rendimiento de escritura más lento que el RAID 5 debido a la doble paridad

Un mayor número de unidades aumenta las probabilidades de fallo de las mismas

Leer más: 2 Métodos para recuperar datos de unidades RAID 6

2. Niveles RAID anidados

Los niveles RAID anidados combinan dos de las funcionalidades RAID mencionadas anteriormente (striping, mirroring y paridad) en una única matriz

RAID 01 (RAID 0+1)

combinar raid 0 y 1

Combina la duplicación de los datos con la división en franjas para obtener una única matriz que pueda replicar y compartir los datos entre las unidades. Necesitas al menos cuatro unidades para ejecutar el nivel RAID 01, y la mitad de ellas se utilizan para duplicar datos.

Pros

Puedes soportar un fallo de la unidad de disco sin ninguna consecuencia. Los datos se almacenan en otra unidad.

Contras

Es una forma costosa de crear redundancia, ya que utilizas la mitad de los servidores para la duplicación

RAID 10 (RAID 1+0)

combinar-raid-1-y-0

La combinación de RAID 0 y RAID 1 aumenta la seguridad, de la que carece el RAID 0. Refleja los datos en un conjunto secundario de unidades, a la vez que los separa en cada una de ellas para aumentar la velocidad de las transferencias de datos. La principal diferencia entre RAID 10 y RAID 01 es el orden de funcionamiento. En este nivel, los datos son una franja de espejos en lugar de reflejar las franjas.

Pros

Puedes soportar un fallo de la unidad de disco sin ninguna consecuencia. Los datos se almacenan en otra unidad.

Contras

Es una forma costosa de crear redundancia, ya que utilizas la mitad de los servidores para la duplicación

RAID 50 (RAID 5+0)

qué-es-raid-50

La matriz RAID 50 requiere al menos 6 unidades. Combina la división en bandas del RAID 0 con la paridad de una sola unidad del RAID 5.

Con este tipo de matriz, puedes perder hasta una unidad de cada una sin que se pierdan datos. Por ejemplo, si tienes cuatro conjuntos de discos, puedes perder hasta 4 discos a la vez, siempre que formen parte de un conjunto diferente. La pérdida de un par de unidades coincidentes provocará la pérdida de datos.

La configuración RAID 50 mejora el rendimiento del RAID 5 en cuanto a una escritura más rápida y una mayor tolerancia a los fallos de las unidades deficientes.

Pros

Rendimiento de lectura más rápido

Un mayor nivel de seguridad de los datos sin aumentar los costos

Mejora del flujo de datos y de la redundancia

Contras

Si dos de los servidores RAID 5 fallan al mismo tiempo, todo el conjunto dejará de funcionar

3. Niveles RAID no estándar

El tercer tipo de nivel RAID es un híbrido entre las opciones RAID estándar y los niveles anidados.

RAID 7

Toma las mejores características de RAID 3 y RAID 4, y obtendrás RAID 7. Este nivel utiliza la triple paridad, y tendrás que comprar un controlador especial para leer y escribir datos. La ventaja del RAID 7 es que administra la matriz con un procesador de caché incorporado.

RAID adaptativo

Se adapta al número de unidades y al nivel RAID en función del tipo de datos. Puede elegir entre RAID 3 o RAID 5, y el controlador determina el número de paridades y cómo almacenarlas en el dispositivo.

LinuxMD RAID 10

El RAID basado en Linux es compatible con muchas de las principales distribuciones. Admite todo tipo de matrices RAID no estándar y anidadas. Además, puedes crear RAID 0, 1, 4, 5 y 6 con LinuxMD y asegurar y transferir datos en tu sistema operativo Linux.

RAID desacoplado

Mientras que con una matriz RAID tradicional, un gran grupo de unidades se divide en grupos más pequeños o clusters, un RAID desclasificado reparte los datos uniformemente por toda la matriz de unidades. Todos los datos se reflejan, pero se distribuyen aleatoriamente en la matriz. Esto es útil en una situación en la que una de las unidades falle o se borre, y el conjunto desclasificado pueda reconstruir los datos más rápidamente.

BeeGFS

El sistema de clústeres de archivos paralelos reparte los archivos de datos entre varios servidores. Se diseñó como una forma de mejorar la velocidad y el rendimiento. El programa puede reducir la intensidad de las cargas de trabajo de E/S mediante el paralelismo. Puedes aumentar el rendimiento y la capacidad de almacenamiento aumentando el número de unidades y servidores.

Hadoop