← Volver
GUÍA TÉCNICA · 28 MARZO 2026

LA PC
QUE NECESITA
LA INTELIGENCIA
ARTIFICIAL

Análisis técnico completo: qué componente hace qué, por qué importa y qué comprar hoy para IA local, LLMs y generación de imágenes.

// GPU · CPU · RAM · VRAM · NVMe · NPU · REFRIGERACIÓN · BUILDS 2026

01

POR QUÉ EL HARDWARE IMPORTA EN IA

La brecha entre un equipo correcto y uno incorrecto puede ser horas frente a segundos

Trabajar con inteligencia artificial no es como ejecutar un procesador de texto. Las herramientas de IA realizan millones de operaciones matemáticas por segundo: multiplicaciones de matrices, convoluciones, sumas vectoriales. Cada vez que un modelo genera una palabra hay miles de millones de operaciones de punto flotante en marcha.

La diferencia entre un equipo mal elegido y uno optimizado puede ser entre esperar 3 horas o hacerlo en 8 minutos. Para inferencia, la diferencia puede ser entre 2 tokens por segundo (inutilizable) y 45 tokens por segundo (tiempo real).

// OPERACIONES MATEMÁTICAS EN UN MODELO LLM 7B — POR TOKEN GENERADO
OPERACIÓN VOLUMEN HARDWARE Multiplicación de matrices ~14 billones GPU Función de atención (Attention) ~9 billones GPU Normalización de capas ~800 mill. GPU/NPU Activaciones (ReLU/SiLU) ~1,2 bill. GPU Tokenización y logits ~50 mill. CPU Modelo: LLaMA 3.1 7B · Estimaciones por token · Arquitectura Transformer estándar
Dato clave: El 95% de las operaciones en IA son multiplicaciones de matrices. Una CPU ejecuta 16–32 en paralelo; una RTX 5090 ejecuta 21.760 simultáneas.

Las tres categorías de uso en IA

🗣️ INFERENCIA LOCAL

Ejecutar modelos ya entrenados (Llama, Mistral). Prioridad: VRAM y RAM. Un modelo de 7B cuantizado necesita ~4,5 GB de VRAM.

🎨 GENERACIÓN IMÁGENES

Stable Diffusion, Flux, SDXL. Prioridad: VRAM y CUDA cores. 8 GB mínimo viable; 16 GB recomendado.

🔬 FINE-TUNING / TRAINING

Entrenar modelos con tus propios datos. Prioridad: VRAM masiva. Requiere hardware de gama alta.

02

GPU — EL MOTOR PRINCIPAL

Sin una buena GPU cualquier inversión en IA es ineficiente. Es el componente que define todo.

La GPU nació para gráficos, pero su arquitectura de miles de núcleos pequeños en paralelo es perfecta para IA. Las GPUs NVIDIA incluyen Tensor Cores: unidades diseñadas exclusivamente para multiplicaciones de matrices en precisión reducida (FP16, BF16, INT8), exactamente las operaciones que dominan las redes neuronales.

// RENDIMIENTO EN INFERENCIA LLM — TOKENS POR SEGUNDO (LLAMA 3.1 7B)
NVIDIA RTX 5090 — 32 GB GDDR7~142 t/s
NVIDIA RTX 5080 — 16 GB GDDR7~98 t/s
NVIDIA RTX 5070 Ti — 16 GB GDDR7~75 t/s
NVIDIA RTX 4090 — 24 GB GDDR6X~65 t/s
AMD RX 7900 XTX — 24 GB GDDR6~48 t/s
NVIDIA RTX 4070 Ti — 12 GB GDDR6X~38 t/s
Apple M4 Max — 128 GB unificados~28 t/s
Solo CPU Intel i9-14900K~4 t/s

Benchmarks reportados marzo 2026. Modelo cuantizado Q4_K_M.

GPUs recomendadas por presupuesto — marzo 2026

ENTRADA — HASTA 400€
NVIDIA RTX 4060 Ti 16 GB
~350–420€

16 GB de VRAM, modelos hasta 10B cuantizados. Ideal para empezar.

16 GB VRAMBajo consumo
GAMA MEDIA — 600–900€
NVIDIA RTX 5070 / 5070 Ti
~620–880€

Blackwell, 16 GB GDDR7, Tensor Cores 5ª gen. La compra más inteligente en 2026.

16 GB GDDR7BlackwellMejor €/rend.
GAMA ALTA — 1.000€+
NVIDIA RTX 5080 / 5090
~1.050€ / ~2.000€

16–32 GB GDDR7. Para fine-tuning serio y modelos 30B+ en local.

16–32 GB GDDR7Máx. rendimiento
⚠️ Sobre AMD: El ecosistema de IA (PyTorch, CUDA, ComfyUI, Automatic1111) está optimizado casi exclusivamente para NVIDIA. ROCm tiene compatibilidad muy limitada. Para trabajo serio en IA, NVIDIA es la única opción razonable en 2026.
03

CPU — EL DIRECTOR DE ORQUESTA

No entrena redes neuronales, pero decide cuán rápido llegan los datos a la GPU

La CPU coordina el sistema: preprocesa datos, tokeniza texto, gestiona transferencias PCIe y carga datasets. Una CPU débil crea un cuello de botella donde la GPU espera datos que la CPU no procesa suficientemente rápido. Esto es especialmente crítico en fine-tuning con datasets grandes.

AMD Ryzen — Reyes del multinúcleo

La tecnología 3D V-Cache añade caché L3 extra que reduce la latencia al acceder a datos. El Ryzen 9 9950X3D puede ser hasta un 40% más rápido en preprocesamiento.

MODELONÚCLEOSCACHÉ L3PRECIO
Ryzen 5 55006C/12T19 MB~90€
Ryzen 7 9700X8C/16T32 MB~290€
Ryzen 9 9950X16C/32T64 MB~580€
Ryzen 9 9950X3D16C/32T144 MB~700€

Intel Core Ultra — Con NPU integrada

La serie Core Ultra 200 integra NPU nativa. Menor rendimiento multinúcleo que AMD, pero mejor integración con Windows 11 AI y Copilot.

MODELONÚCLEOSNPU TOPSPRECIO
Core i5-14600K14C/20T~230€
Core Ultra 7 265K20C/20T13 TOPS~350€
Core Ultra 9 285K24C/24T13 TOPS~560€
Core i9-14900KF24C/32T~480€
Recomendación: AMD Ryzen 7 9700X o Ryzen 9 9950X. Si el presupuesto es ajustado, un i5-14600K y dedicar el ahorro a una GPU mejor es estrategia perfectamente válida.
04

RAM — LA MEMORIA DE TRABAJO

32 GB mínimo. 64 GB recomendado. Quedarse sin RAM es quedarse sin trabajo.

La RAM actúa como mesa de trabajo entre el disco y los procesadores. En IA almacena los datasets mientras se procesan y actúa como extensión de la VRAM cuando los modelos no caben en la GPU (offloading).

// USO DE RAM EN DISTINTOS ESCENARIOS DE IA
16 GB RAM INSUFICIENTE SO + Apps — 6 GB Modelo — 8 GB 2 GB ✗ Sin espacio para dataset — I/O constante al disco — Sistema inestable 32 GB RAM MÍNIMO RECOMENDADO SO — 5 GB Modelo — 8 GB Dataset en RAM — 14 GB 5 GB libre ~ Funciona. Dataset cabe. Poca holgura para multitarea. 64 GB RAM ÓPTIMO PROFESIONAL SO — 5 GB Modelo Datasets múltiples + Offloading VRAM + Cache — 40+ GB 19 GB libre

DDR4 — Plataformas anteriores

~57 GB/s. Perfectamente válido si ya tienes el sistema. No justifica actualizar solo por la RAM.

Más barataMenor ancho de banda

DDR5 — PLATAFORMAS 2025–26

Hasta 89 GB/s. Diferencia real del 8–15% en preprocesamiento intensivo de datos para IA.

Mayor bandaLatencia mejorada
Configuración recomendada: 2×32 GB DDR5-5600 en modo dual channel. El dual channel duplica el ancho de banda disponible para la CPU.
05

ALMACENAMIENTO NVMe

Carga un modelo de 8 GB en 1 segundo con NVMe, o en 53 segundos con un HDD

// VELOCIDADES DE ALMACENAMIENTO — TIEMPO DE CARGA MODELO 8 GB
TIPO VELOCIDAD TIEMPO 8 GB VALORACIÓN NVMe PCIe 4.0 (Samsung 990 Pro) 7.000 MB/s ~1,2 seg ✓ RECOMENDADO NVMe PCIe 3.0 (Samsung 970 EVO) 3.500 MB/s ~2,3 seg ~ Aceptable SSD SATA III 550 MB/s ~14,5 seg ✗ No óptimo HDD Mecánico 150 MB/s ~53 seg ✗ INACEPTABLE Un SSD NVMe PCIe 4.0 es obligatorio para trabajar con IA de forma profesional en 2026
MEJOR CALIDAD/PRECIO
Samsung 990 Pro 2 TB
~120–140€

7.450/6.900 MB/s. Estándar del sector en 2026.

7.450 MB/s2 TB
MÁXIMO RENDIMIENTO
WD Black SN850X 2 TB
~130–150€

7.300 MB/s. Excelente en cargas sostenidas.

7.300 MB/sAlta durabilidad
PRESUPUESTO AJUSTADO
Crucial P5 Plus 2 TB
~90–110€

6.600 MB/s. Más que suficiente para inferencia.

Mejor precioPCIe 4.0
06

NPU — EL ACELERADOR DE IA

El componente nuevo que redefine qué significa "PC con IA" en 2026

La NPU (Neural Processing Unit) está integrada en el procesador y se dedica exclusivamente a inferencia de redes neuronales. Su ventaja no es la potencia bruta sino la eficiencia energética: ejecuta tareas de IA ligeras consumiendo 5–10W frente a los 350–600W de una GPU de gama alta. Ideal para tareas que corren en segundo plano de forma continua.

AMD Ryzen AI Max+ 395

126 AI TOPS totales. GPU integrada con acceso a 96 GB de VRAM compartida. El chip más potente para IA integrada disponible.

126 TOPS96 GB VRAM

Intel Core Ultra 200

13–36 TOPS de NPU. Mejor ecosistema Windows y soporte Copilot+. Ideal si no necesitas LLMs masivos.

13–36 TOPSCopilot+

Apple M4 Max

38 TOPS NPU + GPU integrada con hasta 128 GB de memoria unificada. Único portátil capaz de ejecutar modelos de 70B parámetros en local.

38 TOPS128 GB UMA
07

REFRIGERACIÓN Y ESTABILIDAD TÉRMICA

El hardware de IA trabaja al 100% durante horas. Sin refrigeración adecuada el rendimiento colapsa.

A diferencia del gaming, los trabajos de IA mantienen GPU y CPU al 100% de carga durante horas o días. Cuando el procesador supera su temperatura límite activa el thermal throttling: reduce su frecuencia automáticamente causando una pérdida de rendimiento del 20–40% que puede pasar completamente desapercibida.

Para CPU — Refrigeración líquida AIO

  • Noctua NH-D15 — Mejor disipador de aire. ~90€
  • ARCTIC Liquid Freezer III 280mm — Mejor calidad/precio. ~80€
  • Corsair H150i Elite 360mm — Máxima exigencia. ~180€

Para GPU — Flujo de aire del chasis

  • Fractal Design Meshify 2 / Lian Li Lancool III — Mejor airflow
  • Noctua NF-A14 o be quiet! Silent Wings 4 — Top en ventiladores
  • Thermal Grizzly Kryonaut — Pasta térmica profesional
Regla clave: 3 ventiladores frontales de entrada + 1 trasero de extracción. Garantiza aire fresco constante hacia la GPU durante horas de trabajo intensivo con IA.
08

VRAM — EL CUELLO DE BOTELLA

La memoria de vídeo es el factor limitante número uno en cualquier sistema de IA local

La VRAM es la memoria integrada en la GPU. Los Tensor Cores acceden a ella a 1.000–1.800 GB/s, frente a los 89 GB/s de la RAM DDR5. Pero tiene una capacidad fija e inamovible: no se puede ampliar después de comprar. Es la única decisión de hardware completamente irreversible.

// VRAM NECESARIA POR MODELO — FP16 VS CUANTIZADO Q4
MODELO PARAMS FP16 Q4 GPU MÍNIMA Llama 3.2 / Phi-3.5 Mini3–4B~7 GB~2,5 GBRTX 4060 8 GB Llama 3.1 8B / Mistral 7B7–8B~16 GB~5 GBRTX 4060 Ti 16 GB DeepSeek V3 / Qwen 14B14B~28 GB~9 GBRTX 4090 / 5070 Ti Llama 3.3 / CodeLlama 34B34B~68 GB~22 GBRTX 5090 (32 GB) Llama 70B / DeepSeek 70B70B~140 GB~44 GBMac M4 Max / 128 GB RAM Stable Diffusion XL / FLUX3–12B~8–24 GB~6–16 GBRTX 5070 Ti / 5080 FP16 = precisión completa · Q4 = cuantizado 4 bits (pérdida mínima de calidad)
Regla de oro: Siempre compra más VRAM de la que crees necesitar hoy. Los modelos de IA crecen con cada generación. La VRAM no se puede ampliar: es la decisión más importante de toda la compra.
09

FLUJO DE DATOS EN IA

Cómo cada componente colabora en tiempo real para generar una sola respuesta

Cuando escribes una pregunta a un modelo local y presionas Enter, esto es lo que ocurre en tu hardware en milisegundos:

// CICLO COMPLETO DE INFERENCIA — DESDE TU PREGUNTA HASTA LA RESPUESTA
1. ENTRADA Tu consulta → App Python 2. TOKENIZAR CPU divide texto en tokens numéricos 3. FORWARD PASS GPU: Tensor Cores calculan matrices 14 bill. ops / token 4. SOFTMAX GPU calcula probabilidades 5. MUESTREO CPU selecciona token probable 6. SALIDA Token en pantalla Repetir por cada token RTX 5080: ~98 t/s · RTX 4090: ~65 t/s · RTX 4060 Ti: ~30 t/s · Solo CPU: ~4 t/s
10

NVIDIA vs AMD vs APPLE

Los tres ecosistemas para IA local: fortalezas, debilidades y cuándo elegir cada uno

CARACTERÍSTICANVIDIA RTX (CUDA)AMD Radeon (ROCm)Apple Silicon (Metal)
Compatibilidad software IA✓✓✓ Nativa PyTorch/TF~ ROCm limitado~ MLX propio
VRAM gama alta32 GB (RTX 5090)24 GB (RX 7900 XTX)128 GB unificada
LLM 70B en local Requiere 2× GPU Insuficiente Con 128 GB RAM
Stable Diffusion / Flux✓✓✓ Óptimo~ Funcional~ Lento sin CUDA
Fine-tuning / Training✓✓✓ Exclusivo~ Inestable No recomendado
Eficiencia energética~ Aceptable~ Similar✓✓✓ Superior (ARM)
Precio por GB VRAM~ Medio-alto Mejor €/GB Muy caro
Veredicto IA 2026LA ELECCIÓN PRINCIPALSolo si presupuesto limitaSolo para LLMs 70B+
NVIDIA es el ecosistema indiscutible para IA en 2026. El 99% de los frameworks, guías y herramientas están optimizados para CUDA. Apple Silicon es única para LLMs masivos gracias a su memoria unificada, pero sin acceso al ecosistema CUDA.
11

BUILDS RECOMENDADOS 2026

Tres configuraciones optimizadas según tu presupuesto y nivel de uso con IA

BUILD INICIACIÓN
~1.000–1.400€
  • CPURyzen 5 5600 / i5-13600K
  • GPURTX 4060 Ti 16 GB
  • RAM32 GB DDR4-3600
  • SSD1 TB NVMe PCIe 4.0
  • Fuente650W 80+ Gold
16 GB VRAMLLMs 7BSD básico

Llama 8B a ~30 t/s. Genera imágenes con SDXL. Perfecto para aprender y experimentar con IA.

BUILD PROFESIONAL
~2.000–2.800€
  • CPUAMD Ryzen 9 9950X
  • GPURTX 5070 Ti 16 GB GDDR7
  • RAM64 GB DDR5-5600
  • SSD2 TB NVMe PCIe 4.0
  • RefrigeraciónAIO 280–360mm
  • Fuente850W 80+ Gold
16 GB GDDR7Blackwell64 GB RAM

Modelos 14B fluidamente. Fine-tuning básico. Mejor relación inversión/rendimiento del mercado en 2026.

BUILD ÉLITE
~4.500–6.000€
  • CPURyzen 9 9950X3D
  • GPURTX 5090 32 GB GDDR7
  • RAM128 GB DDR5-6000
  • SSD4 TB NVMe PCIe 5.0
  • RefrigeraciónAIO 420mm
  • Fuente1.200W 80+ Platinum
32 GB GDDR7LLMs 34BTraining serio

El máximo del mercado consumidor en 2026. Fine-tuning avanzado, generación de vídeo con IA.

12

CONCLUSIÓN Y DECISIÓN FINAL

Los 7 principios del hardware para IA — resumen ejecutivo

LOS 7 PRINCIPIOS DEL HARDWARE PARA IA

  • La GPU es el 70% de la inversión. No escatimes en GPU para gastar en CPU.
  • La VRAM no se puede ampliar después. Elige siempre la GPU con más VRAM que tu presupuesto permita.
  • 16 GB de VRAM es el mínimo real en 2026. Con 8 GB ya hay modelos actuales que no caben.
  • NVIDIA y CUDA son el ecosistema de facto. AMD ROCm tiene compatibilidad muy limitada. No hay debate.
  • 32 GB de RAM mínimo, 64 GB recomendado. La RAM actúa de colchón entre disco y VRAM.
  • SSD NVMe PCIe 4.0 obligatorio. Cargar modelos desde HDD o SATA es inviable profesionalmente.
  • La refrigeración determina el rendimiento sostenido. Thermal throttling = hasta 40% menos rendimiento durante horas.
Recomendación definitiva — 28 de marzo de 2026: El Build Profesional con RTX 5070 Ti 16 GB + AMD Ryzen 9 9950X + 64 GB DDR5 + 2 TB Samsung 990 Pro ofrece la combinación óptima de potencia, futuro y precio. La arquitectura Blackwell tiene suficiente margen para los próximos 3–4 años de modelos de IA.

PC PARA INTELIGENCIA ARTIFICIAL — GUÍA TÉCNICA 2026

Actualizada el 28 de marzo de 2026 · Benchmarks verificados · Precios orientativos mercado España