Performance

Estrategias de caché de Hugo para el rendimiento

Estrategias de caché de Hugo para el rendimiento

Optimizar el desarrollo y ejecución de sitios Hugo

Estrategias de caché en Hugo son esenciales para maximizar el rendimiento de tu generador de sitios estáticos. Aunque Hugo genera archivos estáticos que son inherentemente rápidos, implementar un caché adecuado en múltiples capas puede mejorar drásticamente los tiempos de construcción, reducir la carga del servidor y mejorar la experiencia del usuario.

Cómo Ollama maneja las solicitudes en paralelo

Cómo Ollama maneja las solicitudes en paralelo

Comprende la concurrencia y la cola de Ollama, y aprende a ajustar OLLAMA_NUM_PARALLEL para solicitudes paralelas estables.

Esta guía explica cómo Ollama maneja las solicitudes paralelas (concurrencia, colas y límites de recursos), y cómo ajustarlo utilizando la variable de entorno OLLAMA_NUM_PARALLEL (y otros parámetros relacionados).

Prueba de velocidad de modelos de lenguaje grandes

Prueba de velocidad de modelos de lenguaje grandes

Probemos la velocidad de los LLM en GPU frente a CPU

Comparando la velocidad de predicción de varias versiones de LLMs: llama3 (Meta/Facebook), phi3 (Microsoft), gemma (Google), mistral (open source) en CPU y GPU.