LLM

Comparação da qualidade da tradução de páginas do Hugo - LLMs no Ollama

Neste teste, estou comparando como diferentes LLMs hospedados no Ollama traduzem páginas do Hugo de inglês para alemão.

Reranking de textos com Ollama e Qwen3 Embedding LLM - em Go

Este pequeno Exemplo de código Go para reranking que chama o Ollama para gerar embeddings é usado para a consulta e para cada documento candidato, ordenando em ordem decrescente por similaridade cosseno.

Modelos de Incorporação e Reordenamento Qwen3 no Ollama: Desempenho de Ponta

Os modelos Qwen3 de Embedding e Reranker são os lançamentos mais recentes da família Qwen, projetados especificamente para tarefas avançadas de incorporação (embedding), recuperação e reclassificação de texto.

Desempenho de LLM e Faixas PCIe: Considerações Essenciais

Como as Pistas PCIe Afetam o Desempenho de LLM? Depende da tarefa. Para treinamento e inferência multi-GPU, a queda de desempenho é significativa.

Converta conteúdo HTML para Markdown usando LLM e Ollama.

Na biblioteca de modelos do Ollama, existem modelos capazes de converter conteúdo HTML para Markdown, o que é útil para tarefas de conversão de conteúdo.

Busca vs. Busca Profunda vs. Pesquisa Profunda em 2026

Search é o ideal para recuperação rápida e direta de informações usando palavras-chave.
Deep Search destaca-se na compreensão de contexto e intenção, entregando resultados mais relevantes e abrangentes para consultas complexas.

Comparação de Assistentes de Codificação com IA

Aqui, listarei algumas ferramentas de codificação assistidas por IA e Assistentes de Codificação com IA, bem como seus pontos positivos.

Usar LLMs não é muito caro; pode ser que não haja necessidade de comprar uma nova GPU incrível. Abaixo está uma lista de provedores de LLM na nuvem com os LLMs que hospedam.

Teste: Como o Ollama está utilizando os núcleos de desempenho e eficientes da CPU Intel

Tenho uma teoria para testar: se utilizar todos os núcleos de uma CPU Intel aumentaria a velocidade dos LLMs? Isso tem me incomodado: o novo modelo gemma3 de 27 bilhões (gemma3:27b, 17GB no Ollama) não cabe nos 16GB de VRAM da minha GPU e está rodando parcialmente na CPU.

Comparando a adequação das GPUs da NVidia para IA

No meio da agitação do mundo moderno, estou comparando as especificações técnicas de diferentes placas adequadas para tarefas de IA (Aprendizado Profundo, Detecção de Objetos e LLMs). No entanto, todas elas são incrivelmente caras.

Como o Ollama Lida com Solicitações Paralelas

Este guia explica como o Ollama gerencia solicitações paralelas (concorrência, filas e limites de recursos) e como ajustá-lo usando a variável de ambiente OLLAMA_NUM_PARALLEL (e configurações relacionadas).

O que é Vibe Coding? Significado, Ferramentas, Benefícios e Riscos em 2026

Vibe coding é uma abordagem de programação orientada por IA, onde os desenvolvedores descrevem a funcionalidade desejada em linguagem natural e permitem que ferramentas de IA gerem o código automaticamente — com escrita direta mínima.

A primeira geração de modelos de raciocínio da DeepSeek com desempenho comparável ao OpenAI-o1, incluindo seis modelos densos destilados do DeepSeek-R1 com base em Llama e Qwen.

Este resumo de comandos da CLI do Ollama foca nos comandos que você usa todos os dias (ollama ls, ollama serve, ollama run, ollama ps, gerenciamento de modelos e fluxos de trabalho comuns), com exemplos que você pode copiar e colar.

Não foi muito tempo atrás que foi lançado. Vamos dar uma olhada e testar como o Mistral Small se compara a outros LLMs.

Reranking é uma segunda etapa na Geração Aumentada por Recuperação (RAG) sistemas, situada exatamente entre a Recuperação e a Geração.

Comparação da qualidade da tradução de páginas do Hugo - LLMs no Ollama

Reranking de textos com Ollama e Qwen3 Embedding LLM - em Go

Modelos de Incorporação e Reordenamento Qwen3 no Ollama: Desempenho de Ponta

Desempenho de LLM e Faixas PCIe: Considerações Essenciais

Converta conteúdo HTML para Markdown usando LLM e Ollama.

Busca vs. Busca Profunda vs. Pesquisa Profunda em 2026

Comparação de Assistentes de Codificação com IA

Provedores de LLM na Nuvem

Teste: Como o Ollama está utilizando os núcleos de desempenho e eficientes da CPU Intel

Comparando a adequação das GPUs da NVidia para IA

Como o Ollama Lida com Solicitações Paralelas

O que é Vibe Coding? Significado, Ferramentas, Benefícios e Riscos em 2026

Testando o Deepseek-R1 no Ollama

Resumo de Comandos do Ollama CLI: ls, serve, run, ps + comandos (atualização de 2026)

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 e Phi - Teste de LLM

Reclassificação com modelos de embedding