GUÍA TÉCNICA · 28 MARZO 2026

LA PC
QUE NECESITA
LA INTELIGENCIA
ARTIFICIAL

Análisis técnico completo: qué componente hace qué, por qué importa y qué comprar hoy para IA local, LLMs y generación de imágenes.

// GPU · CPU · RAM · VRAM · NVMe · NPU · REFRIGERACIÓN · BUILDS 2026

POR QUÉ EL HARDWARE IMPORTA EN IA

La brecha entre un equipo correcto y uno incorrecto puede ser horas frente a segundos

Trabajar con inteligencia artificial no es como ejecutar un procesador de texto. Las herramientas de IA realizan millones de operaciones matemáticas por segundo: multiplicaciones de matrices, convoluciones, sumas vectoriales. Cada vez que un modelo genera una palabra hay miles de millones de operaciones de punto flotante en marcha.

La diferencia entre un equipo mal elegido y uno optimizado puede ser entre esperar 3 horas o hacerlo en 8 minutos. Para inferencia, la diferencia puede ser entre 2 tokens por segundo (inutilizable) y 45 tokens por segundo (tiempo real).

// OPERACIONES MATEMÁTICAS EN UN MODELO LLM 7B — POR TOKEN GENERADO

Dato clave: El 95% de las operaciones en IA son multiplicaciones de matrices. Una CPU ejecuta 16–32 en paralelo; una RTX 5090 ejecuta 21.760 simultáneas.

Las tres categorías de uso en IA

🗣️ INFERENCIA LOCAL

Ejecutar modelos ya entrenados (Llama, Mistral). Prioridad: VRAM y RAM. Un modelo de 7B cuantizado necesita ~4,5 GB de VRAM.

🎨 GENERACIÓN IMÁGENES

Stable Diffusion, Flux, SDXL. Prioridad: VRAM y CUDA cores. 8 GB mínimo viable; 16 GB recomendado.

🔬 FINE-TUNING / TRAINING

Entrenar modelos con tus propios datos. Prioridad: VRAM masiva. Requiere hardware de gama alta.

GPU — EL MOTOR PRINCIPAL

Sin una buena GPU cualquier inversión en IA es ineficiente. Es el componente que define todo.

La GPU nació para gráficos, pero su arquitectura de miles de núcleos pequeños en paralelo es perfecta para IA. Las GPUs NVIDIA incluyen Tensor Cores: unidades diseñadas exclusivamente para multiplicaciones de matrices en precisión reducida (FP16, BF16, INT8), exactamente las operaciones que dominan las redes neuronales.

// RENDIMIENTO EN INFERENCIA LLM — TOKENS POR SEGUNDO (LLAMA 3.1 7B)

NVIDIA RTX 5090 — 32 GB GDDR7~142 t/s

NVIDIA RTX 5080 — 16 GB GDDR7~98 t/s

NVIDIA RTX 5070 Ti — 16 GB GDDR7~75 t/s

NVIDIA RTX 4090 — 24 GB GDDR6X~65 t/s

AMD RX 7900 XTX — 24 GB GDDR6~48 t/s

NVIDIA RTX 4070 Ti — 12 GB GDDR6X~38 t/s

Apple M4 Max — 128 GB unificados~28 t/s

Solo CPU Intel i9-14900K~4 t/s

Benchmarks reportados marzo 2026. Modelo cuantizado Q4_K_M.

GPUs recomendadas por presupuesto — marzo 2026

ENTRADA — HASTA 400€

NVIDIA RTX 4060 Ti 16 GB

~350–420€

16 GB de VRAM, modelos hasta 10B cuantizados. Ideal para empezar.

16 GB VRAMBajo consumo

GAMA MEDIA — 600–900€

NVIDIA RTX 5070 / 5070 Ti

~620–880€

Blackwell, 16 GB GDDR7, Tensor Cores 5ª gen. La compra más inteligente en 2026.

16 GB GDDR7BlackwellMejor €/rend.

GAMA ALTA — 1.000€+

NVIDIA RTX 5080 / 5090

~1.050€ / ~2.000€

16–32 GB GDDR7. Para fine-tuning serio y modelos 30B+ en local.

16–32 GB GDDR7Máx. rendimiento

⚠️ Sobre AMD: El ecosistema de IA (PyTorch, CUDA, ComfyUI, Automatic1111) está optimizado casi exclusivamente para NVIDIA. ROCm tiene compatibilidad muy limitada. Para trabajo serio en IA, NVIDIA es la única opción razonable en 2026.

CPU — EL DIRECTOR DE ORQUESTA

No entrena redes neuronales, pero decide cuán rápido llegan los datos a la GPU

La CPU coordina el sistema: preprocesa datos, tokeniza texto, gestiona transferencias PCIe y carga datasets. Una CPU débil crea un cuello de botella donde la GPU espera datos que la CPU no procesa suficientemente rápido. Esto es especialmente crítico en fine-tuning con datasets grandes.

AMD Ryzen — Reyes del multinúcleo

La tecnología 3D V-Cache añade caché L3 extra que reduce la latencia al acceder a datos. El Ryzen 9 9950X3D puede ser hasta un 40% más rápido en preprocesamiento.

MODELO	NÚCLEOS	CACHÉ L3	PRECIO
Ryzen 5 5500	6C/12T	19 MB	~90€
Ryzen 7 9700X	8C/16T	32 MB	~290€
Ryzen 9 9950X	16C/32T	64 MB	~580€
Ryzen 9 9950X3D	16C/32T	144 MB	~700€

Intel Core Ultra — Con NPU integrada

La serie Core Ultra 200 integra NPU nativa. Menor rendimiento multinúcleo que AMD, pero mejor integración con Windows 11 AI y Copilot.

MODELO	NÚCLEOS	NPU TOPS	PRECIO
Core i5-14600K	14C/20T	—	~230€
Core Ultra 7 265K	20C/20T	13 TOPS	~350€
Core Ultra 9 285K	24C/24T	13 TOPS	~560€
Core i9-14900KF	24C/32T	—	~480€

Recomendación: AMD Ryzen 7 9700X o Ryzen 9 9950X. Si el presupuesto es ajustado, un i5-14600K y dedicar el ahorro a una GPU mejor es estrategia perfectamente válida.

RAM — LA MEMORIA DE TRABAJO

32 GB mínimo. 64 GB recomendado. Quedarse sin RAM es quedarse sin trabajo.

La RAM actúa como mesa de trabajo entre el disco y los procesadores. En IA almacena los datasets mientras se procesan y actúa como extensión de la VRAM cuando los modelos no caben en la GPU (offloading).

// USO DE RAM EN DISTINTOS ESCENARIOS DE IA

DDR4 — Plataformas anteriores

~57 GB/s. Perfectamente válido si ya tienes el sistema. No justifica actualizar solo por la RAM.

Más barataMenor ancho de banda

DDR5 — PLATAFORMAS 2025–26

Hasta 89 GB/s. Diferencia real del 8–15% en preprocesamiento intensivo de datos para IA.

Mayor bandaLatencia mejorada

Configuración recomendada: 2×32 GB DDR5-5600 en modo dual channel. El dual channel duplica el ancho de banda disponible para la CPU.

ALMACENAMIENTO NVMe

Carga un modelo de 8 GB en 1 segundo con NVMe, o en 53 segundos con un HDD

// VELOCIDADES DE ALMACENAMIENTO — TIEMPO DE CARGA MODELO 8 GB

MEJOR CALIDAD/PRECIO

Samsung 990 Pro 2 TB

~120–140€

7.450/6.900 MB/s. Estándar del sector en 2026.

7.450 MB/s2 TB

MÁXIMO RENDIMIENTO

WD Black SN850X 2 TB

~130–150€

7.300 MB/s. Excelente en cargas sostenidas.

7.300 MB/sAlta durabilidad

PRESUPUESTO AJUSTADO

Crucial P5 Plus 2 TB

~90–110€

6.600 MB/s. Más que suficiente para inferencia.

Mejor precioPCIe 4.0

NPU — EL ACELERADOR DE IA

El componente nuevo que redefine qué significa "PC con IA" en 2026

La NPU (Neural Processing Unit) está integrada en el procesador y se dedica exclusivamente a inferencia de redes neuronales. Su ventaja no es la potencia bruta sino la eficiencia energética: ejecuta tareas de IA ligeras consumiendo 5–10W frente a los 350–600W de una GPU de gama alta. Ideal para tareas que corren en segundo plano de forma continua.

AMD Ryzen AI Max+ 395

126 AI TOPS totales. GPU integrada con acceso a 96 GB de VRAM compartida. El chip más potente para IA integrada disponible.

126 TOPS96 GB VRAM

Intel Core Ultra 200

13–36 TOPS de NPU. Mejor ecosistema Windows y soporte Copilot+. Ideal si no necesitas LLMs masivos.

13–36 TOPSCopilot+

Apple M4 Max

38 TOPS NPU + GPU integrada con hasta 128 GB de memoria unificada. Único portátil capaz de ejecutar modelos de 70B parámetros en local.

38 TOPS128 GB UMA

REFRIGERACIÓN Y ESTABILIDAD TÉRMICA

El hardware de IA trabaja al 100% durante horas. Sin refrigeración adecuada el rendimiento colapsa.

A diferencia del gaming, los trabajos de IA mantienen GPU y CPU al 100% de carga durante horas o días. Cuando el procesador supera su temperatura límite activa el thermal throttling: reduce su frecuencia automáticamente causando una pérdida de rendimiento del 20–40% que puede pasar completamente desapercibida.

Para CPU — Refrigeración líquida AIO

Noctua NH-D15 — Mejor disipador de aire. ~90€
ARCTIC Liquid Freezer III 280mm — Mejor calidad/precio. ~80€
Corsair H150i Elite 360mm — Máxima exigencia. ~180€

Para GPU — Flujo de aire del chasis

Fractal Design Meshify 2 / Lian Li Lancool III — Mejor airflow
Noctua NF-A14 o be quiet! Silent Wings 4 — Top en ventiladores
Thermal Grizzly Kryonaut — Pasta térmica profesional

Regla clave: 3 ventiladores frontales de entrada + 1 trasero de extracción. Garantiza aire fresco constante hacia la GPU durante horas de trabajo intensivo con IA.

VRAM — EL CUELLO DE BOTELLA

La memoria de vídeo es el factor limitante número uno en cualquier sistema de IA local

La VRAM es la memoria integrada en la GPU. Los Tensor Cores acceden a ella a 1.000–1.800 GB/s, frente a los 89 GB/s de la RAM DDR5. Pero tiene una capacidad fija e inamovible: no se puede ampliar después de comprar. Es la única decisión de hardware completamente irreversible.

// VRAM NECESARIA POR MODELO — FP16 VS CUANTIZADO Q4

Regla de oro: Siempre compra más VRAM de la que crees necesitar hoy. Los modelos de IA crecen con cada generación. La VRAM no se puede ampliar: es la decisión más importante de toda la compra.

FLUJO DE DATOS EN IA

Cómo cada componente colabora en tiempo real para generar una sola respuesta

Cuando escribes una pregunta a un modelo local y presionas Enter, esto es lo que ocurre en tu hardware en milisegundos:

// CICLO COMPLETO DE INFERENCIA — DESDE TU PREGUNTA HASTA LA RESPUESTA

NVIDIA vs AMD vs APPLE

Los tres ecosistemas para IA local: fortalezas, debilidades y cuándo elegir cada uno

CARACTERÍSTICA	NVIDIA RTX (CUDA)	AMD Radeon (ROCm)	Apple Silicon (Metal)
Compatibilidad software IA	✓✓✓ Nativa PyTorch/TF	~ ROCm limitado	~ MLX propio
VRAM gama alta	32 GB (RTX 5090)	24 GB (RX 7900 XTX)	128 GB unificada
LLM 70B en local	✗ Requiere 2× GPU	✗ Insuficiente	✓ Con 128 GB RAM
Stable Diffusion / Flux	✓✓✓ Óptimo	~ Funcional	~ Lento sin CUDA
Fine-tuning / Training	✓✓✓ Exclusivo	~ Inestable	✗ No recomendado
Eficiencia energética	~ Aceptable	~ Similar	✓✓✓ Superior (ARM)
Precio por GB VRAM	~ Medio-alto	✓ Mejor €/GB	✗ Muy caro
Veredicto IA 2026	LA ELECCIÓN PRINCIPAL	Solo si presupuesto limita	Solo para LLMs 70B+

NVIDIA es el ecosistema indiscutible para IA en 2026. El 99% de los frameworks, guías y herramientas están optimizados para CUDA. Apple Silicon es única para LLMs masivos gracias a su memoria unificada, pero sin acceso al ecosistema CUDA.

BUILDS RECOMENDADOS 2026

Tres configuraciones optimizadas según tu presupuesto y nivel de uso con IA

BUILD INICIACIÓN

~1.000–1.400€

CPURyzen 5 5600 / i5-13600K
GPURTX 4060 Ti 16 GB
RAM32 GB DDR4-3600
SSD1 TB NVMe PCIe 4.0
Fuente650W 80+ Gold

16 GB VRAMLLMs 7BSD básico

Llama 8B a ~30 t/s. Genera imágenes con SDXL. Perfecto para aprender y experimentar con IA.

BUILD PROFESIONAL

~2.000–2.800€

CPUAMD Ryzen 9 9950X
GPURTX 5070 Ti 16 GB GDDR7
RAM64 GB DDR5-5600
SSD2 TB NVMe PCIe 4.0
RefrigeraciónAIO 280–360mm
Fuente850W 80+ Gold

16 GB GDDR7Blackwell64 GB RAM

Modelos 14B fluidamente. Fine-tuning básico. Mejor relación inversión/rendimiento del mercado en 2026.

BUILD ÉLITE

~4.500–6.000€

CPURyzen 9 9950X3D
GPURTX 5090 32 GB GDDR7
RAM128 GB DDR5-6000
SSD4 TB NVMe PCIe 5.0
RefrigeraciónAIO 420mm
Fuente1.200W 80+ Platinum

32 GB GDDR7LLMs 34BTraining serio

El máximo del mercado consumidor en 2026. Fine-tuning avanzado, generación de vídeo con IA.

CONCLUSIÓN Y DECISIÓN FINAL

Los 7 principios del hardware para IA — resumen ejecutivo

LOS 7 PRINCIPIOS DEL HARDWARE PARA IA

La GPU es el 70% de la inversión. No escatimes en GPU para gastar en CPU.
La VRAM no se puede ampliar después. Elige siempre la GPU con más VRAM que tu presupuesto permita.
16 GB de VRAM es el mínimo real en 2026. Con 8 GB ya hay modelos actuales que no caben.
NVIDIA y CUDA son el ecosistema de facto. AMD ROCm tiene compatibilidad muy limitada. No hay debate.
32 GB de RAM mínimo, 64 GB recomendado. La RAM actúa de colchón entre disco y VRAM.
SSD NVMe PCIe 4.0 obligatorio. Cargar modelos desde HDD o SATA es inviable profesionalmente.
La refrigeración determina el rendimiento sostenido. Thermal throttling = hasta 40% menos rendimiento durante horas.

Recomendación definitiva — 28 de marzo de 2026: El Build Profesional con RTX 5070 Ti 16 GB + AMD Ryzen 9 9950X + 64 GB DDR5 + 2 TB Samsung 990 Pro ofrece la combinación óptima de potencia, futuro y precio. La arquitectura Blackwell tiene suficiente margen para los próximos 3–4 años de modelos de IA.

PC PARA INTELIGENCIA ARTIFICIAL — GUÍA TÉCNICA 2026

Actualizada el 28 de marzo de 2026 · Benchmarks verificados · Precios orientativos mercado España

LA PCQUE NECESITALA INTELIGENCIAARTIFICIAL