AI - Page 2 - Rost Glukhov | Site pessoal e blog técnico

IA para Gerenciamento de Conhecimento: Fluxos de Trabalho Reais que Funcionam

A IA não está substituindo a gestão do conhecimento; está mudando a forma dela tanto para indivíduos quanto para equipes.

OpenClaw vs Hermes Agent: Estrelas, Downloads e Uso em 2026

Frameworks de agentes de IA de código aberto estão explodindo em popularidade no GitHub. Dois projetos no centro do ecossistema de sistemas de IA auto-hospedados — OpenClaw e Hermes Agent — avançaram tanto que o resto do campo luta por um distante terceiro lugar.

Qwen 3.6 27B e 35B MTP versus Padrão em GPU de 16GB

Testei o desempenho da Decodificação Especulativa (Previsão de Múltiplos Tokens, MTP) nos modelos Qwen 3.6 27B e 35B em uma RTX 4080 com 16 GB de VRAM.

Descarregar todos os modelos do roteador llama.cpp sem reiniciar

o modo roteador do llama.cpp é uma das mudanças mais úteis no llama-server em anos. Ele finalmente oferece aos operadores de LLMs locais uma experiência de gerenciamento de modelos próxima do que as pessoas esperam do Ollama, mantendo o desempenho bruto e o controle de baixo nível que tornam o llama.cpp digno de uso em primeiro lugar.

LLM Wiki - Conhecimento Compilado Que o RAG Não Pode Substituir

A premissa é simples: o conhecimento compilado é mais reutilizável do que fragmentos recuperados. O RAG tornou-se a resposta padrão para uma questão direta: como fornecer a um LLM acesso a conhecimento externo?

PKM vs RAG vs Wiki vs Sistemas de Memória: Explicados Claramente

PKM, RAG, wikis, sistemas de memória de IA e, agora, fluxos de trabalho práticos assistidos por IA são frequentemente discutidos como se resolvessem o mesmo problema. Eles não resolvem. Todos lidam com conhecimento, mas operam em camadas diferentes:

Validação de Saída Estruturada de LLMs em Python que Funciona

A maioria dos tutoriais sobre “saída estruturada” de LLMs é superficial. Eles ensinam você a pedir JSON educadamente e depois torcer para que o modelo se comporte. Isso não é validação. Isso é otimismo com chaves.

Referência de Parâmetros de Inferência de LLMs Agentes para Qwen e Gemma

Esta página é uma referência prática para ajuste de inferência de LLMs agênicos (temperatura, top_p, top_k, penalidades e como elas interagem em fluxos de trabalho multi-step e com uso intenso de ferramentas).

Controle de Voz do Hermes pelo Seu Telefone

Você já conversa com o Hermes Agent pelo seu telefone usando texto. Agora você quer falar com ele diretamente e receber respostas faladas. Geralmente, essa é a melhor abordagem, especialmente se você já usa o Hermes como um assistente auto-hospedado persistente. Digitar prompts longos em uma tela pequena é lento e propenso a erros.

Kanban no Hermes Agent para Fluxos de Trabalho de LLMs Auto-Hospedados

O Hermes Agent vem com um quadro estilo Kanban e o Hermes Gateway, que podem saturar seu LLM auto-hospedado se muitas tarefas forem despachadas de uma só vez.

Criação de Habilidades do Agente Hermes — Estrutura e Melhores Práticas do SKILL.md

O Hermes Agent trata skills (habilidades) como a forma padrão de ensinar fluxos de trabalho repetíveis. A documentação oficial descreve-os como documentos de conhecimento sob demanda, alinhados com a especificação aberta agentskills.io, carregados através de revelação progressiva para que o modelo veja primeiro um índice pequeno e só carregue as instruções completas quando uma tarefa realmente precisar delas.

Resumo de atalhos do Hermes Agent CLI — comandos, sinalizadores e atalhos de barra

O Hermes Agent da Nous Research é um assistente agnóstico ao modelo e utilizador de ferramentas que você executa localmente ou em um VPS.

Guia prático NemoClaw para operações seguras do OpenClaw em 2026

A maioria das pilhas de agentes de IA ainda trata a segurança como um ajuste pós-demonstração. NemoClaw parte da premissa oposta e torna o isolamento, a política e o roteamento padrões desde o primeiro dia.

Memória de Sistemas de IA — Conhecimento Persistente e Memória de Agentes

Esta seção reúne guias sobre conhecimento persistente e memória para sistemas de IA — como assistentes mantêm fatos, preferências e contexto distilado entre sessões, sem sobrecarregar um único prompt com todos os tokens. Aqui, memória refere-se à retenção intencional (fatos do usuário, resumos, armazenamentos suportados por plugins), não à memória RAM da GPU ou aos pesos do modelo.

Provedores de Memória de Agentes Comparados — Honcho, Mem0, Hindsight e mais cinco

Assistentes modernos ainda esquecem tudo quando você fecha a aba, a menos que algo persista além da janela de contexto. Provedores de memória de agentes são serviços ou bibliotecas que mantêm fatos e resumos entre sessões — frequentemente integrados como plugins para que o framework permaneça leve enquanto a memória escala.

Sistema de Memória do Agente Hermes: Como a Memória Persistente de IA Funciona

Você já sabe como funciona. Você abre um chat com um agente de IA, explica seu projeto, compartilha suas preferências, realiza algum trabalho e fecha a aba. Ao voltar na semana seguinte, é como falar com um estranho — todo o contexto sumiu, todas as preferências foram esquecidas, o projeto precisa ser explicado do zero.