Hardware

NVIDIA DGX Spark vs Mac Studio vs RTX-4080 : Comparaison des performances d'Ollama

NVIDIA DGX Spark vs Mac Studio vs RTX-4080 : Comparaison des performances d'Ollama

Benchmarks GPT-OSS 120b sur trois plateformes d'IA

J’ai découvert quelques tests de performance intéressants du modèle GPT-OSS 120b exécuté sur Ollama sur trois plateformes différentes : NVIDIA DGX Spark, Mac Studio et RTX 4080. Le modèle GPT-OSS 120b de la bibliothèque Ollama pèse 65 Go, ce qui signifie qu’il ne peut pas s’adapter dans les 16 Go de VRAM d’une RTX 4080 (ou même sur la nouvelle RTX 5080).

GNOME Boxes : Un guide complet sur les fonctionnalités, les avantages, les défis et les alternatives

GNOME Boxes : Un guide complet sur les fonctionnalités, les avantages, les défis et les alternatives

Gestion simple de VM pour Linux avec GNOME Boxes

Dans le paysage actuel de l’informatique, la virtualisation est devenue essentielle pour le développement, les tests et le fonctionnement de plusieurs systèmes d’exploitation. Pour les utilisateurs de Linux souhaitant gérer des machines virtuelles de manière simple et intuitive, GNOME Boxes se distingue comme une option légère et conviviale qui privilégie l’ergonomie sans sacrifier la fonctionnalité.

L'essor des ASIC pour LLM : pourquoi le matériel d'inférence compte

L'essor des ASIC pour LLM : pourquoi le matériel d'inférence compte

Les puces spécialisées rendent l'inférence d'IA plus rapide et moins coûteuse.

L’avenir de l’IA ne concerne pas seulement des modèles plus intelligents [https://www.glukhov.org/fr/post/2025/06/qwen3-embedding-qwen3-reranker-on-ollama/ “Modèles Qwen3 embedding et reranker - performance d’avant-garde”] - il concerne des siliciums plus intelligents.
L’évolution vers un matériel spécialisé pour l’inférence des LLM entraîne une révolution similaire à celle du passage du minage de Bitcoin aux ASICs.

DGX Spark vs. Mac Studio : une analyse tarifaire de l'ordinateur personnel AI de NVIDIA

DGX Spark vs. Mac Studio : une analyse tarifaire de l'ordinateur personnel AI de NVIDIA

Disponibilité, prix de vente au détail dans le monde réel dans six pays, et comparaison avec le Mac Studio.

NVIDIA DGX Spark est réel, disponible à la vente le 15 octobre 2025, et ciblé aux développeurs CUDA ayant besoin de travail local avec des LLM avec une pile AI NVIDIA intégrée. Prix de vente au détail aux États-Unis $3 999 ; le prix de vente au détail UK/DE/JP est plus élevé en raison de la TVA et des canaux. Les prix publics AUD/KRW ne sont pas encore largement affichés.

NVIDIA DGX Spark - nouveau petit superordinateur AI

NVIDIA DGX Spark - nouveau petit superordinateur AI

« En juillet 2025, il devrait bientôt être disponible »

Nvidia est sur le point de lancer le NVIDIA DGX Spark – un petit superordinateur d’IA basé sur l’architecture Blackwell, doté d’une mémoire unifiée de 128+Go et d’une performance d’IA de 1 PFLOPS. Un appareil intéressant pour exécuter les LLM.