velocidad de tokens de llama.cpp en 16 GB de VRAM (tablas).
Aquí comparo la velocidad de varios LLMs (modelos de lenguaje grande) ejecutándose en una GPU con 16 GB de VRAM, y elijo el mejor para autoalojamiento.
Controla los datos y los modelos con LLMs autoalojados
El autoalojamiento de modelos de lenguaje grandes (LLM) mantiene los datos, los modelos y la inferencia bajo su control: una vía práctica hacia la soberanía de la IA para equipos, empresas y naciones.
Prueba de velocidad de LLM en RTX 4080 con 16GB de VRAM
Ejecutar modelos de lenguaje grandes (LLMs) de forma local te ofrece privacidad, capacidad de funcionamiento sin conexión y cero costos de API.
Este análisis revela exactamente qué se puede esperar de 14
LLMs populares en Ollama con una RTX 4080.
Verificación de precios de GPU y RAM en enero de 2025
Hoy nos estamos enfocando en las GPUs de consumo de alto nivel y módulos de RAM.
Específicamente, me estoy enfocando en
precios de RTX-5080 y RTX-5090, y 32GB (2x16GB) DDR5 6000.
Precios reales en AUD de minoristas australianos ahora
El
NVIDIA DGX Spark
(GB10 Grace Blackwell) ya está
disponible en Australia
en los principales minoristas de PC con stock local.
Si has estado siguiendo los
precios y disponibilidad globales del DGX Spark,
te interesará saber que los precios en Australia oscilan entre $6.249 y $7.999 AUD, dependiendo de la configuración de almacenamiento y del minorista.
Después de instalar automáticamente un nuevo núcleo, Ubuntu 24.04 ha perdido la conexión de red ethernet. Este problema frustrante ocurrió de nuevo para mí, así que estoy documentando la solución aquí para ayudar a otros que enfrenten el mismo problema.
Los precios de la RAM aumentan entre un 163% y un 619% debido a la escasez provocada por la demanda de IA.
El mercado de la memoria está experimentando una volatilidad de precios sin precedentes a finales de 2025, con un aumento dramático en los precios de la RAM en todos los segmentos.
Despliegue de IA empresarial en hardware económico con modelos abiertos
La democratización de la IA está aquí.
Con modelos de lenguaje de gran tamaño (LLM) de código abierto como Llama, Mistral y Qwen rivalizando ahora con los modelos propietarios, los equipos pueden construir una infraestructura de IA utilizando hardware de consumo, reduciendo drásticamente los costos mientras mantienen el control total sobre la privacidad de los datos y el despliegue.