Hardware

Autosserviço do Cognee: Testes de Desempenho de LLM

Cognee é um framework Python para construir grafos de conhecimento a partir de documentos usando LLMs. Mas funciona com modelos auto-hospedados?

Ubuntu perdeu a rede após a atualização do kernel

Após instalar automaticamente um novo kernel, Ubuntu 24.04 perdeu a rede Ethernet. Este problema frustrante aconteceu comigo pela segunda vez, então estou documentando a solução aqui para ajudar outros que enfrentam o mesmo problema.

Preço da RAM na Austrália - Dezembro de 2025

Com essa volatilidade louca dos preços da RAM, para formar e ter uma melhor ideia, vamos rastrear o preço da RAM na Austrália primeiro nós mesmos.

O mercado de memória está experimentando uma volatilidade de preços sem precedentes no final de 2025, com preços da RAM disparando dramaticamente em todos os segmentos.

Preços da NVidia RTX 5080 e RTX 5090 na Austrália - novembro de 2025

Vamos comparar os preços das principais GPUs de consumo para o topo, que são adequadas para LLMs em particular e para a IA em geral.
Especificamente, estou olhando para
preços do RTX-5080 e RTX-5090.

Infraestrutura de IA em Hardware para Consumo

A democratização da IA está aqui. Com LLMs de código aberto como Llama 3, Mixtral e Qwen agora rivalizando com modelos proprietários, as equipes podem construir infraestrutura poderosa de IA usando hardware de consumo - reduzindo custos enquanto mantêm o controle completo sobre a privacidade dos dados e o deployment.

Adicionando suporte a GPU da NVIDIA ao Docker Model Runner

Docker Model Runner é a ferramenta oficial do Docker para executar modelos de IA localmente, mas habilitar a aceleração da GPU da NVidia no Docker Model Runner requer uma configuração específica.

NVIDIA DGX Spark vs Mac Studio vs RTX-4080: Comparação de Desempenho do Ollama

Fui atrás de alguns testes de desempenho interessantes do GPT-OSS 120b em execução no Ollama em três plataformas diferentes: NVIDIA DGX Spark, Mac Studio e RTX 4080. O modelo GPT-OSS 120b da biblioteca Ollama tem 65GB, o que significa que ele não cabe na VRAM de 16GB de um RTX 4080 (ou no mais novo RTX 5080).

Docker Model Runner Cheatsheet: Comandos e Exemplos

Docker Model Runner (DMR) é a solução oficial do Docker para executar modelos de IA localmente, introduzida em abril de 2025. Este guia rápido fornece uma referência rápida para todos os comandos essenciais, configurações e melhores práticas.

GNOME Boxes: Um Guia Abrangente sobre Funcionalidades, Vantagens, Desafios e Alternativas

No cenário atual da computação, a virtualização tornou-se essencial para desenvolvimento, testes e execução de múltiplos sistemas operacionais. Para usuários de Linux que buscam uma forma simples e intuitiva de gerenciar máquinas virtuais, GNOME Boxes destaca-se como uma opção leve e amigável ao usuário que prioriza a facilidade de uso sem sacrificar a funcionalidade.

O Surgimento de ASICs para LLM: Por que o Hardware de Inferência Importa

O futuro do IA não é apenas sobre modelos mais inteligentes modelos — é sobre silício mais inteligente.
Hardware especializado para inferência de LLM está impulsionando uma revolução semelhante à mudança do mineração de Bitcoin para ASICs.

DGX Spark vs. Mac Studio: Análise de Preços da Supercomputação Pessoal da NVIDIA

NVIDIA DGX Spark é real, disponível para venda a partir de 15 de outubro de 2025, e direcionado a desenvolvedores de CUDA que precisam de trabalho local com LLM com uma pilha integrada de IA da NVIDIA. Preço de venda sugerido nos EUA $3.999; o preço retalhista em UK/DE/JP é mais alto devido ao imposto sobre o valor agregado e ao canal. Preços públicos em AUD/KRW ainda não estão amplamente divulgados.

Preços da NVidia RTX 5080 e RTX 5090 na Austrália - outubro de 2025

Mais uma vez, vamos comparar os preços das GPUs de alto desempenho para consumidores, que são adequadas, em particular, para LLMs e, em geral, para IA.

Especificamente, estou olhando para preços do RTX-5080 e RTX-5090. Eles tiveram uma leve redução.

Aplicativos de monitoramento de GPU no Linux / Ubuntu

Aplicações de monitoramento de carga da GPU:
nvidia-smi vs nvtop vs nvitop vs KDE plasma systemmonitor.

NVIDIA DGX Spark - novo pequeno supercomputador para IA

Nvidia está prestes a lançar NVIDIA DGX Spark - pequeno supercomputador de IA baseado na arquitetura Blackwell com 128+GB de memória unificada e 1 PFLOPS de desempenho de IA. Dispositivo interessante para executar LLMs.

Preços da NVidia RTX 5080 e RTX 5090 na Austrália - julho de 2025

Vamos comparar preços para GPUs de topo de linha para consumidores, que são adequadas para LLMs em particular e para IA em geral. Especificamente, dê uma olhada em preços da RTX 5080 e RTX 5090. Eles tiveram uma leve queda.