Gestión de Almacenamiento

Dispositivos, Sistemas de Archivos y Técnicas de Optimización

Plataformas Tecnológicas - SPEED

¿Qué es el Almacenamiento en Computación?

El almacenamiento informático se refiere a los componentes, dispositivos y medios que retienen datos digitales utilizados para computación durante intervalos de tiempo.

Los sistemas de almacenamiento modernos deben balancear cuatro atributos clave: capacidad, velocidad, confiabilidad y costo. La evolución desde las cintas magnéticas hasta los SSD NVMe ha revolucionado cómo almacenamos y accedemos a los datos.

Jerarquía de Almacenamiento

  • Registros del CPU 1-64 bytes
  • Caché (L1, L2, L3) KB a MB
  • Memoria RAM GB
  • Almacenamiento SSD GB a TB
  • Discos Duros (HDD) TB
  • Almacenamiento en la Nube TB a PB

Dispositivos de Almacenamiento

Comparativa de Tecnologías

Tipo Velocidad Capacidad Costo/GB
SSD NVMe 3-7 GB/s 250GB-8TB $$$
SSD SATA 500-600 MB/s 120GB-4TB $$
HDD 100-250 MB/s 500GB-20TB $
Blu-ray 36-144 MB/s 25-128GB $$
Almacenamiento SSD
HDD

Definición: Platos magnéticos giratorios con cabezales móviles.

Capacidad: 500GB-20TB
Velocidad: 5400-15000 RPM

Gran capacidad, bajo costo

Partes móviles, más lentos

SSD

Definición: Memoria flash sin partes móviles.

Capacidad: 120GB-8TB
Velocidad: 200-7000 MB/s

Alta velocidad, silenciosos

Mayor costo, vida útil limitada

Óptico

Definición: Láser sobre superficies reflectantes.

Capacidad: 700MB-128GB
Tipos: CD/DVD/Blu-ray

Portables, duraderos

Baja velocidad, capacidad limitada

Flash

Definición: Estado sólido portátil.

Capacidad: 1GB-2TB
Velocidad: USB 2.0 a USB4

Plug-and-play, portables

Vida útil limitada

Tendencias de Almacenamiento

  • Transición de HDD a SSD en consumidores
  • Adopción de NVMe para alto rendimiento
  • Crecimiento del almacenamiento en la nube
  • Desarrollo de tecnologías emergentes (3D XPoint, DNA storage)

Sistemas de Archivos

Un sistema de archivos es la estructura que determina cómo se almacenan, organizan y acceden los datos en un dispositivo de almacenamiento.

NTFS

Sistema: Windows NT/2000/XP/Vista/7/8/10/11

Características:

  • Soporte para archivos grandes (>4GB)
  • Compresión y encriptación
  • Permisos de seguridad avanzados
  • Journaling para recuperación
  • Tamaño máximo de archivo: 16TB

EXT4

Sistema: Linux

Características:

  • Archivos hasta 16TB
  • Particiones hasta 1EB (exabyte)
  • Journaling mejorado
  • Asignación dinámica de inodos
  • Retraso en asignación

APFS

Sistema: macOS/iOS

Características:

  • Optimizado para SSD
  • Snapshots y clones
  • Encriptación nativa
  • Compresión en tiempo real
  • Espacios compartidos

FAT32/exFAT

Sistema: Universal

Características:

  • Compatibilidad universal
  • Simplicidad
  • FAT32: Límite de 4GB por archivo
  • exFAT: Sin límites prácticos
  • Ideal para dispositivos USB

Comparativa de Sistemas de Archivos

Sistema Tamaño Máx. Archivo Tamaño Máx. Partición Journaling Compresión Encriptación
NTFS 16TB 256TB
EXT4 16TB 1EB
APFS 8EB 8EB
FAT32 4GB 8TB
exFAT 16EB 128PB

Organización de Archivos

Estructura Jerárquica

Los sistemas de archivos organizan los datos en una estructura de árbol, con directorios padre e hijos, permitiendo una navegación intuitiva.

/
├── bin/       # Comandos esenciales
├── etc/       # Archivos de configuración
├── home/      # Directorios de usuarios
│   ├── usuario1/
│   └── usuario2/
├── var/       # Archivos variables
└── tmp/       # Archivos temporales
Tipos de Rutas:
  • Absoluta: /home/usuario/documentos/archivo.txt
  • Relativa: ../imagenes/foto.jpg

Permisos y Seguridad

Control de acceso a archivos y directorios mediante permisos de lectura, escritura y ejecución para diferentes usuarios y grupos.

Permiso Símbolo Valor Descripción
Lectura r 4 Leer contenido
Escritura w 2 Modificar contenido
Ejecución x 1 Ejecutar archivo
Ejemplo de Permisos:
-rwxr-xr--
  • Propietario: lectura (r), escritura (w), ejecución (x)
  • Grupo: lectura (r), ejecución (x)
  • Otros: solo lectura (r)

Representación octal: 754

Metadatos de Archivos

Atributos Comunes:
  • Nombre del archivo Identificador
  • Tamaño Bytes
  • Fechas (creación, modificación, acceso) Timestamp
Atributos Extendidos:
  • Atributos de sistema (oculto, solo lectura) Windows/Linux
  • Checksum/Hash Integridad
  • Propietario y permisos ACL Seguridad

Técnicas de Optimización

Desfragmentación

Reorganización de archivos en el disco para reducir la fragmentación y mejorar el rendimiento de acceso.

Beneficios:
  • Reduce tiempos de búsqueda
  • Mejora velocidad de lectura
  • Extiende vida útil de HDD
No es necesaria para SSD (puede reducir su vida útil)

Caché de Disco

Uso de memoria RAM para almacenar temporalmente datos de disco frecuentemente accedidos.

Técnicas:
  • Read-ahead (pre-lectura)
  • Write-back (post-escritura)
  • LRU (Least Recently Used)
Windows: SuperFetch
Linux: Page Cache

Compresión

Reducción del tamaño de archivos mediante algoritmos de compresión para optimizar el espacio de almacenamiento.

Algoritmos comunes:
  • ZIP (DEFLATE)
  • LZ4 (rápido)
  • ZSTD (balanceado)
  • Brotli (web)
NTFS y APFS soportan compresión transparente

RAID

Redundant Array of Independent Disks para mejorar rendimiento y/o redundancia mediante múltiples discos.

Niveles comunes:
  • RAID 0: Striping (rendimiento)
  • RAID 1: Mirroring (redundancia)
  • RAID 5: Paridad distribuida
  • RAID 10: Espejo + stripe
RAID no reemplaza backups

Otras Técnicas de Optimización

Niveles de Almacenamiento

Uso jerárquico de almacenamiento rápido (SSD) y lento (HDD) según frecuencia de acceso.

Deduplicación

Eliminación de datos duplicados para ahorrar espacio, común en sistemas de backup.

Tiering en la Nube

Mover datos poco accedidos a almacenamiento en la nube más económico.

Gestión de Entrada/Salida

Métodos de E/S

E/S Programada

El CPU verifica constantemente el estado del dispositivo. Simple pero ineficiente.

Ventaja: Simple de implementar
Desventaja: CPU ocupado en polling

E/S por Interrupciones

El dispositivo notifica al CPU cuando está listo. Más eficiente que la E/S programada.

Ventaja: CPU libre hasta interrupción
Desventaja: Overhead por manejo de interrupciones

DMA (Direct Memory Access)

Transferencia directa entre memoria y dispositivo sin intervención del CPU.

Ventaja: CPU solo interviene al inicio/fin
Desventaja: Requiere controlador DMA

Buffering y Spooling

Buffering

Técnica que utiliza memoria intermedia para compensar diferencias de velocidad entre dispositivos.

  • Un buffer por proceso
  • Reducir esperas de E/S
  • Mejorar throughput

Spooling

Simultaneous Peripheral Operations Online - Cola de trabajos para dispositivos compartidos.

  • Compartir dispositivos
  • Ejemplo: impresión
  • Mayor utilización

Casos de Estudio

Almacenamiento en Centros de Datos

Los centros de datos modernos utilizan arquitecturas híbridas para optimizar costos y rendimiento:

  • Caché: NVMe para máxima velocidad
  • Almacenamiento primario: SSDs de alta capacidad
  • Almacenamiento secundario: HDDs para datos fríos
  • Backup: Cintas o almacenamiento en la nube
Ejemplo de configuración:
Storage Tiering:
1. Nivel 0: RAM + NVMe (caché)
2. Nivel 1: SSD (datos activos)
3. Nivel 2: HDD (datos poco accedidos)
4. Nivel 3: Cinta/Nube (backup/archivo)

Almacenamiento en Dispositivos Móviles

Los smartphones modernos usan técnicas avanzadas para optimizar el limitado espacio:

  • Almacenamiento UFS 3.1: Alta velocidad en pequeño factor de forma
  • Adopción de HEIF: Mejor compresión que JPEG
  • Optimización de apps: Limpieza automática de caché
  • Almacenamiento en la nube: Integración con servicios cloud
Ejemplo de optimización:
Sistema de archivos F2FS (Flash-Friendly File System):
- Optimizado para NAND flash
- Mejor manejo de wear-leveling
- Mayor velocidad en operaciones aleatorias
- Desfragmentación automática

Conclusión

La gestión eficiente del almacenamiento es fundamental para el rendimiento de cualquier sistema informático.

Puntos Clave

  • Entender la jerarquía de almacenamiento ayuda a optimizar costos y rendimiento
  • La elección del sistema de archivos impacta en seguridad y eficiencia
  • Las técnicas de optimización deben adaptarse al tipo de almacenamiento
  • Las tecnologías emergentes prometen revolucionar el almacenamiento futuro