AI - Page 3 - Rost Glukhov | Sitio personal y blog técnico

Interfaz de chat para instancias locales de Ollama

Locally hosted Ollama permite ejecutar modelos de lenguaje grandes en tu propia máquina, pero usarlo desde la línea de comandos no es muy amigable para el usuario. Aquí hay varios proyectos de código abierto que ofrecen interfaces estilo ChatGPT que se conectan a un Ollama local.

Popularidad de los lenguajes de programación y herramientas para desarrolladores de software

La carta de The Pragmatic Engineer publicada hace unos días presentó estadísticas de una encuesta sobre la popularidad de lenguajes de programación, IDEs, herramientas de IA y otros datos para mediados de 2025.

NVIDIA DGX Spark - nuevo pequeño superordenador de inteligencia artificial

Nvidia está a punto de lanzar NVIDIA DGX Spark - pequeño superordenador de IA basado en la arquitectura Blackwell con 128+GB de memoria unificada y un rendimiento de IA de 1 PFLOPS. Dispositivo interesante para ejecutar LLMs.

Reordenar documentos con Ollama y el modelo Qwen3 Reranker - en Go

Dado que el Ollama estándar no tiene una API de rerank directa, tendrás que implementar reranking usando Qwen3 Reranker en GO generando embeddings para pares de consulta y documentos y calificándolos.

Un frío día de invierno en julio… que es en Australia… sentí la urgente necesidad de entrenar un modelo de IA para detectar barras de refuerzo de concreto sin tapones…

Comparación de la calidad de la traducción de páginas en Hugo - LLMs en Ollama

En este test estoy comparando cómo diferentes LLMs alojados en Ollama traducen una página Hugo del inglés al alemán. Tres páginas que probé estaban sobre temas diferentes, tenían algún buen markdown con cierta estructura: encabezados, listas, tablas, enlaces, etc.

Reclasificación de textos con Ollama y Qwen3 Embedding LLM - en Go

Este pequeño Ejemplo de código Go para reranking llama a Ollama para generar embeddings para la consulta y para cada documento candidato, luego ordenando de forma descendente por similitud coseno.

Rendimiento de LLM y canales PCIe: Consideraciones clave

Cómo afectan los canales PCIe al rendimiento de los LLM? Dependiendo de la tarea. Para el entrenamiento y la inferencia con múltiples GPUs, la caída de rendimiento es significativa.

Convierte contenido HTML a Markdown utilizando LLM y Ollama

En la biblioteca de modelos de Ollama hay modelos que pueden convertir contenido HTML a Markdown, lo cual es útil para tareas de conversión de contenido.

Búsqueda vs. Deepsearch vs. Investigación profunda

Buscar es ideal para recuperar información rápida y directa utilizando palabras clave.
Búsqueda profunda destaca por comprender el contexto e intención, entregando resultados más relevantes y completos para consultas complejas.

Comparación de asistentes de codificación AI

Listaré aquí algunas herramientas de codificación asistidas por IA y Asistentes de codificación de IA y sus aspectos positivos.

El uso de LLMs no es muy costoso, quizás no sea necesario comprar una nueva GPU increíble.
Aquí hay una lista de proveedores de LLM en la nube con LLMs que alojan.

Prueba: Cómo Ollama está utilizando el rendimiento de la CPU de Intel y los núcleos eficientes

Tengo una teoría para probar: ¿si utilizamos todos los núcleos en una CPU de Intel aumentaría la velocidad de los LLMs? Me molesta que el nuevo modelo gemma3 de 27 bits (gemma3:27b, 17 GB en ollama) no se ajuste a los 16 GB de VRAM de mi GPU, y se ejecute parcialmente en la CPU.

Comparando la idoneidad de las GPU de NVidia para la IA

En medio del caos del mundo moderno aquí estoy comparando especificaciones técnicas de diferentes tarjetas adecuadas para tareas de IA
(Deep Learning,
Deteción de objetos
y LLMs).
Aunque todas son increíblemente caras.

Cómo Ollama maneja las solicitudes en paralelo

Cuando el servidor Ollama recibe dos solicitudes al mismo tiempo, su comportamiento depende de su configuración y de los recursos del sistema disponibles.

Vibe coding es un enfoque de programación impulsado por IA donde los desarrolladores describen la funcionalidad deseada en lenguaje natural, permitiendo que las herramientas de IA generen código automáticamente.

AI

Interfaz de chat para instancias locales de Ollama

Popularidad de los lenguajes de programación y herramientas para desarrolladores de software

NVIDIA DGX Spark - nuevo pequeño superordenador de inteligencia artificial

Reordenar documentos con Ollama y el modelo Qwen3 Reranker - en Go

Detección de objetos con Tensorflow

Comparación de la calidad de la traducción de páginas en Hugo - LLMs en Ollama

Reclasificación de textos con Ollama y Qwen3 Embedding LLM - en Go

Rendimiento de LLM y canales PCIe: Consideraciones clave

Convierte contenido HTML a Markdown utilizando LLM y Ollama

Búsqueda vs. Deepsearch vs. Investigación profunda

Comparación de asistentes de codificación AI

Proveedores de LLM en la nube

Prueba: Cómo Ollama está utilizando el rendimiento de la CPU de Intel y los núcleos eficientes

Comparando la idoneidad de las GPU de NVidia para la IA

Cómo Ollama maneja las solicitudes en paralelo

Vibe Coding - Significado y descripción