Qwen 3.6 27B e 35B MTP versus Padrão em GPU de 16GB

Qwen 3.6 27B e 35B MTP versus Padrão em GPU de 16GB

MTP versus decodificação padrão na RTX 4080 — benchmarks reais

Testei o desempenho da Decodificação Especulativa (Previsão de Múltiplos Tokens, MTP) nos modelos Qwen 3.6 27B e 35B em uma RTX 4080 com 16 GB de VRAM.

Recuperação vs. Representação em Sistemas de Conhecimento

Recuperação vs. Representação em Sistemas de Conhecimento

A busca não é estrutura de conhecimento

A maioria dos sistemas de conhecimento modernos otimiza a recuperação, e isso é compreensível. A pesquisa é visível, fácil de demonstrar e parece mágica quando funciona. Digite uma pergunta, obtenha uma resposta.

Segunda Mente Explicada para Engenheiros e Profissionais do Conhecimento

Segunda Mente Explicada para Engenheiros e Profissionais do Conhecimento

As notas são armazenamento. Um segundo cérebro é computação.

A sobrecarga de informação tem menos a ver com o volume bruto do que com entradas não resolvidas. O trabalho de conhecimento moderno deixa um rastro de abas, threads de chat, documentos, destaques, trechos, transcrições, capturas de tela e notas meio escritas.

Validação de Saída Estruturada de LLMs em Python que Funciona

Validação de Saída Estruturada de LLMs em Python que Funciona

Pare de interpretar vibes. Valide contratos.

A maioria dos tutoriais sobre “saída estruturada” de LLMs é superficial. Eles ensinam você a pedir JSON educadamente e depois torcer para que o modelo se comporte. Isso não é validação. Isso é otimismo com chaves.

Idempotência em Sistemas Distribuídos que Realmente Funciona

Idempotência em Sistemas Distribuídos que Realmente Funciona

Evitar efeitos colaterais duplicados

A idempotência em sistemas distribuídos é a propriedade que te salva depois que a rede falha, a fila retransmite, o cliente entra em pânico e o operador clica em “replay”. Em sistemas de produção, a entrega duplicada é normal. Os efeitos colaterais duplicados são o bug.

Criação de Habilidades do Agente Hermes — Estrutura e Melhores Práticas do SKILL.md

Criação de Habilidades do Agente Hermes — Estrutura e Melhores Práticas do SKILL.md

Habilidades do autor Hermes que carregam rapidamente e comportam-se de forma confiável

O Hermes Agent trata skills (habilidades) como a forma padrão de ensinar fluxos de trabalho repetíveis. A documentação oficial descreve-os como documentos de conhecimento sob demanda, alinhados com a especificação aberta agentskills.io, carregados através de revelação progressiva para que o modelo veja primeiro um índice pequeno e só carregue as instruções completas quando uma tarefa realmente precisar delas.

Assinar

Receba novos artigos sobre sistemas, infraestrutura e engenharia de IA.