LLM

Reranking es un segundo paso en la Generación Aumentada por Recuperación (RAG) sistemas, situado justo entre la Recuperación y la Generación.

Recientemente, Black Forest Labs publicó un conjunto de modelos de IA de texto a imagen. Estos modelos se dicen que tienen una calidad de salida mucho mayor. Probémoslos

La comida increíble también es un placer para la vista. Pero en esta entrada compararemos dos sistemas de búsqueda basados en IA, Farfalle y Perplexica.

¡Eso es muy emocionante! En lugar de llamar a Copilot o Perplexity.ai y contarle al mundo entero lo que buscas, ¡ahora puedes alojar un servicio similar en tu propio PC o portátil!

Recientemente hemos visto la liberación de varios nuevos LLMs. Tiempo emocionante. Vamos a probar y ver cómo se desempeñan al detectar falacias lógicas.

Aún así, existen algunos enfoques comunes para escribir buenos prompts de manera que los modelos de lenguaje no se confundan al intentar entender lo que deseas.

Comparando las capacidades de resumen de los LLM

Prueba de cómo se comportan los modelos con diferentes números de parámetros y cuantización.

Después de instalar Ollama, es mejor reconfigurar Ollama para que los almacene en la nueva ubicación de inmediato. Así, cuando descargamos un nuevo modelo, no se descarga en la ubicación antigua.

Comparando la velocidad de predicción de varias versiones de LLMs: llama3 (Meta/Facebook), phi3 (Microsoft), gemma (Google), mistral (open source) en CPU y GPU.

Aquí estoy comparando varias versiones de LLM: Llama3 (Meta), Phi3 (Microsoft), Gemma (Google), Mistral Nemo (Mistral AI) y Qwen (Alibaba).

Reordenamiento con modelos de incrustación

Modelo de IA Flux de texto a imagen

Farfalle frente a Perplexica

Autoalojamiento de Perplexica - con Ollama

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Escribir prompts efectivos para LLMs

Comparando las capacidades de resumen de los LLM

Mover los modelos de Ollama a una ubicación diferente

Prueba de velocidad de modelos de lenguaje grandes

Detección de falacias lógicas con LLMs