Self-Hosting

NVIDIA DGX Spark vs Mac Studio vs RTX-4080 : Comparaison des performances d'Ollama

J’ai découvert des tests de performance intéressants sur l’exécution du modèle GPT-OSS 120b avec Ollama sur trois plateformes différentes : NVIDIA DGX Spark, Mac Studio, et RTX 4080. Le modèle GPT-OSS 120b de la bibliothèque Ollama pèse 65 Go, ce qui signifie qu’il ne peut pas s’exécuter dans les 16 Go de VRAM d’un RTX 4080 (ou sur le plus récent RTX 5080).

Fichier d'aide-mémoire Docker Model Runner : commandes et exemples

Docker Model Runner (DMR) est la solution officielle de Docker pour exécuter des modèles d’IA localement, introduite en avril 2025. Cette fiche pratique fournit un référentiel rapide pour toutes les commandes essentielles, les configurations et les bonnes pratiques.

Docker Model Runner vs Ollama (2026) : lequel est meilleur pour les LLM locaux ?

Exécuter des grands modèles de langage (LLMs) localement a de plus en plus de popularité pour la confidentialité, le contrôle des coûts et les capacités hors ligne. Le paysage s’est considérablement transformé en avril 2025 lorsque Docker a introduit Docker Model Runner (DMR), sa solution officielle pour le déploiement de modèles d’IA.

GNOME Boxes : Un guide complet sur les fonctionnalités, les avantages, les défis et les alternatives

Dans le paysage actuel de l’informatique, la virtualisation est devenue essentielle pour le développement, les tests et le fonctionnement de plusieurs systèmes d’exploitation. Pour les utilisateurs de Linux souhaitant gérer des machines virtuelles de manière simple et intuitive, GNOME Boxes se distingue comme une option légère et conviviale qui privilégie l’ergonomie sans sacrifier la fonctionnalité.

Multipass VM Manager : guide pour Ubuntu, Windows et macOS

Multipass est un gestionnaire léger de machines virtuelles qui permet de créer et de gérer facilement des instances Ubuntu en nuage sur Linux, Windows et macOS.

Au-delà de Google : Guide des moteurs de recherche alternatifs

Alors que Google domine le marché des moteurs de recherche avec plus de 90 % de part de marché mondiale, un écosystème croissant de moteurs de recherche alternatifs propose des approches différentes pour la recherche sur le web.

L'essor des ASIC pour LLM : pourquoi le matériel d'inférence compte

L’avenir de l’IA ne réside pas seulement dans des modèles plus intelligents, mais dans des siliciums plus intelligents.
L’équipement matériel spécialisé pour l’inférence des LLM entraîne une révolution similaire à celle du passage du minage de Bitcoin aux ASICs.

Indie Web : Recouvrer son indépendance numérique

Le web a été initialement conçu comme un réseau décentralisé où tout le monde pouvait publier et se connecter. Au fil du temps, des plateformes corporatives ont consolidé le contrôle, créant des jardins clos où les utilisateurs sont des produits et le contenu est verrouillé. Le mouvement Indie Web vise à restaurer la promesse originale du web : la propriété personnelle, la liberté créative et la véritable connexion.

DGX Spark vs. Mac Studio : une analyse tarifaire de l'ordinateur personnel AI de NVIDIA

NVIDIA DGX Spark est réel, disponible à la vente le 15 octobre 2025, et ciblé aux développeurs CUDA ayant besoin de travail local avec des LLM avec une pile AI NVIDIA intégrée. Prix de vente au détail aux États-Unis $3 999 ; le prix de vente au détail UK/DE/JP est plus élevé en raison de la TVA et des canaux. Les prix publics AUD/KRW ne sont pas encore largement affichés.

Protocole Gemini : Une alternative minimaliste au Web

Le protocole Gemini représente un retour aux fondamentaux de la communication sur Internet : une alternative légère, sécurisée et respectueuse de la vie privée à l’Internet moderne de plus en plus complexe.

Clients Go pour Ollama : comparaison des SDK et exemples avec Qwen3/GPT-OSS

Ce guide fournit un aperçu complet des SDK Go pour Ollama disponibles et compare leurs ensembles de fonctionnalités.

Voici une comparaison entre Qwen3:30b et GPT-OSS:20b
axée sur le suivi des instructions et les performances, les spécifications et la vitesse.

Plateforme de blogging fédérée Writefreely - coûts d'hébergement autonome vs. hébergement géré

Voici un aperçu rapide de Write.as / WriteFreely – comment il s’intègre au fediverse, où trouver un hébergement géré, à quoi ressemble l’évolution d’utilisation, et comment l’héberger soi-même (avec des estimations de coûts approximatives).

Intégrer Ollama avec Python : exemples d'API REST et de client Python

Dans cet article, nous allons explorer deux façons de connecter votre application Python à Ollama : 1. Via HTTP REST API ; 2. Via la bibliothèque Python officielle d’Ollama.

Proxmox en 2025 : une pile de virtualisation pratique et tout-en-un

Proxmox Virtual Environment (Proxmox VE) est un hyperviseur de type 1 et une plateforme d’orchestration de centre de données open source, construite sur Debian.

Prix de la carte graphique NVidia RTX 5080 et RTX 5090 en Australie - octobre 2025

Encore et encore, comparons les prix des cartes graphiques grand public de haut niveau, qui sont particulièrement adaptées aux LLM et en général à l’IA. Plus précisément, je regarde les prix de l’RTX-5080 et de l’RTX-5090. Ils ont légèrement baissé.