Self-Hosting

NVIDIA DGX Spark vs Mac Studio vs RTX-4080: Comparação de Desempenho do Ollama

Fiz uma pesquisa sobre alguns interessantes testes de desempenho do GPT-OSS 120b em execução no Ollama em três diferentes plataformas: NVIDIA DGX Spark, Mac Studio e RTX 4080. O modelo GPT-OSS 120b da biblioteca Ollama tem 65GB, o que significa que não cabe na VRAM de 16GB de um RTX 4080 (ou no mais recente RTX 5080).

Docker Model Runner Cheatsheet: Comandos & Exemplos

Docker Model Runner (DMR) é a solução oficial do Docker para executar modelos de IA localmente, introduzida em abril de 2025. Esta folha de dicas fornece uma referência rápida para todos os comandos essenciais, configurações e melhores práticas.

Runner de Modelo Docker vs Ollama (2026): Qual é Melhor para LLMs Locais?

Executar grandes modelos de linguagem (LLMs) localmente tornou-se cada vez mais popular por motivos de privacidade, controle de custos e capacidades offline. O cenário mudou significativamente em abril de 2025, quando o Docker introduziu Docker Model Runner (DMR), sua solução oficial para implantação de modelos de IA.

GNOME Boxes: Um Guia Abrangente sobre Funcionalidades, Vantagens, Desafios e Alternativas

No cenário atual da computação, a virtualização tornou-se essencial para desenvolvimento, testes e execução de múltiplos sistemas operacionais. Para usuários de Linux que buscam uma forma simples e intuitiva de gerenciar máquinas virtuais, GNOME Boxes destaca-se como uma opção leve e amigável ao usuário que prioriza a facilidade de uso sem sacrificar a funcionalidade.

Guia de Dicas para o Multipass VM Manager: Ubuntu, Windows e macOS

Multipass é um gerenciador leve de máquinas virtuais que facilita a criação e o gerenciamento de instâncias de nuvem Ubuntu no Linux, Windows e macOS.

Além do Google: Guia de Motores de Busca Alternativos

Enquanto o Google domina o mercado de motores de busca com mais de 90% de participação no mercado global, há um ecossistema em crescimento de motores de busca alternativos que oferecem abordagens diferentes para a busca na web.

O Surgimento de ASICs para LLM: Por que o Hardware de Inferência Importa

O futuro do IA não é apenas sobre modelos mais inteligentes modelos — é sobre silício mais inteligente.
Hardware especializado para inferência de LLM está impulsionando uma revolução semelhante à migração do mineração de Bitcoin para ASICs.

Web Independente: Recuperando a Independência Digital

A web foi originalmente concebida como uma rede descentralizada onde qualquer pessoa poderia publicar e se conectar. Com o tempo, plataformas corporativas consolidaram o controle, criando jardins fechados onde os usuários são produtos e o conteúdo está bloqueado. O movimento Indie Web tem como objetivo restaurar a promessa original da web: posse pessoal, liberdade criativa e conexão genuína.

DGX Spark vs. Mac Studio: Análise de Preços da Supercomputação Pessoal da NVIDIA

NVIDIA DGX Spark é real, disponível para venda a partir de 15 de outubro de 2025, e direcionado a desenvolvedores de CUDA que precisam de trabalho local com LLM com uma pilha integrada de IA da NVIDIA. Preço de venda sugerido nos EUA $3.999; o preço retalhista em UK/DE/JP é mais alto devido ao imposto sobre o valor agregado e ao canal. Preços públicos em AUD/KRW ainda não estão amplamente divulgados.

Protocolo Gemini: Uma Alternativa Minimalista para a Web

O protocolo Gemini representa um retorno aos fundamentos da comunicação na internet - uma alternativa leve, segura e respeitosa à privacidade ao moderno web cada vez mais complexo.

Clientes Go para Ollama: comparação de SDK e exemplos com Qwen3/GPT-OSS

Este guia fornece uma visão abrangente dos disponíveis SDKs Go para Ollama e compara seus conjuntos de funcionalidades.

Aqui está uma comparação entre Qwen3:30b e GPT-OSS:20b
focando em seguir instruções e parâmetros de desempenho, especificações e velocidade.

Plataforma de Blogagem Federada Writefreely - custos de auto-hospedagem vs. hospedagem gerenciada

Aqui está uma rápida informação sobre Write.as / WriteFreely – como ele se encaixa no fediverse, onde obter hospedagem gerenciada, como é a tendência de uso e como hospedar por conta própria (mais estimativas de custos aproximados).

Integrando o Ollama com Python: Exemplos de API REST e Cliente Python

Neste post, vamos explorar duas formas de conectar seu aplicativo Python ao Ollama: 1. Via HTTP REST API; 2. Via a biblioteca oficial do Ollama para Python.

Proxmox em 2025: Uma pilha de virtualização prática e completa

Proxmox Virtual Environment (Proxmox VE) é um hipervisor de tipo 1 e uma plataforma de orquestração de datacenter de código aberto construída sobre o Debian.

Preços da NVidia RTX 5080 e RTX 5090 na Austrália - outubro de 2025

Mais uma vez, vamos comparar os preços das GPUs de alto desempenho para consumidores, que são adequadas, em particular, para LLMs e, em geral, para IA.

Especificamente, estou olhando para preços do RTX-5080 e RTX-5090. Eles tiveram uma leve redução.